Explora recursos valiosos del curso Fundamentos de Seguridad en IA, que ofrecen perspectivas y conocimientos sobre estrategias de alineación para la inteligencia artificial.
We Need a Science of Evals
20 mins • Jan 2, 2025
Charts
- 150NEW
- 93NEW
- 178Increased by 0
Episodios recientes

Jan 2, 2025
We Need a Science of Evals
20 mins

Jan 2, 2025
Introduction to Mechanistic Interpretability
12 mins

Jul 19, 2024
Illustrating Reinforcement Learning from Human Feedback (RLHF)
S3 E2 • 23 mins

Jul 19, 2024
Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback
S3 E4 • 32 mins

Jul 19, 2024
Constitutional AI Harmlessness from AI Feedback
S3 E2 • 62 mins

Idioma
Inglés
País
Reino Unido
Feed Host
Sitio web
Feed
Solicitar una actualización
Las actualizaciones pueden tardar unos minutos.