Profitez des narrations audio des meilleurs articles de LessWrong, mettant en avant du contenu sélectionné et des discussions populaires. Abonnez-vous pour plus d'idées et d'aperçus captivants.
“A Three-Layer Model of LLM Psychology” by Jan_Kulveit
18 mins • Jan 26, 2025
Charts
- 147NEW
- 101NEW
- 99Increased by 8
- 139Decreased by 37
- 176NEW
Épisodes récents

Jan 26, 2025
“A Three-Layer Model of LLM Psychology” by Jan_Kulveit
18 mins

Jan 24, 2025
“Training on Documents About Reward Hacking Induces Reward Hacking” by evhub
5 mins

Jan 24, 2025
“AI companies are unlikely to make high-assurance safety cases if timelines are short” by ryan_greenblatt
25 mins

Jan 24, 2025
“Mechanisms too simple for humans to design” by Malmesbury
29 mins

Jan 22, 2025
“The Gentle Romance” by Richard_Ngo
1 mins

Langue
Anglais
Pays
États-Unis
Feed Host
Site web
Flux
Demander une mise à jour
Les mises à jour peuvent prendre quelques minutes.