Scopri ricerche e innovazioni nell'IA in questo podcast con i fondatori di Arize AI, che presentano le menti e i metodi che plasmano l'apprendimento automatico.
LibreEval: The Largest Open Source Benchmark for RAG Hallucination Detection
27 mins • Apr 18, 2025
Charts
- 10Increased by 8
- 24Decreased by 2
- 19Decreased by 2
- 19Decreased by 8
- 15Increased by 0
Episodi recenti

Apr 18, 2025
LibreEval: The Largest Open Source Benchmark for RAG Hallucination Detection
27 mins

Apr 4, 2025
AI Benchmark Deep Dive: Gemini 2.5 and Humanity's Last Exam
26 mins

Mar 25, 2025
Model Context Protocol (MCP)
15 mins

Mar 1, 2025
AI Roundup: DeepSeek’s Big Moves, Claude 3.7, and the Latest Breakthroughs
30 mins

Feb 21, 2025
How DeepSeek is Pushing the Boundaries of AI Development
30 mins

Lingua
Inglese
Paese
Stati Uniti
Feed Host
Sito web
Feed
Richiedi un aggiornamento
Gli aggiornamenti potrebbero richiedere alcuni minuti.