LessWrong

LessWrong (30+ Karma)

Hören Sie spannende Audio-Lesungen von Beiträgen der LessWrong-Community, ideal für alle, die anregende Inhalte zu Rationalität und Entscheidungsfindung suchen.

Listen on Apple Podcasts

“Automated Researchers Can Subtly Sandbag” by gasteigerjo, Akbir Khan, Sam Bowman, Vlad Mikulik, Ethan Perez, Fabien Roger

8 mins • Mar 27, 2025

Neueste Folgen

Mar 27, 2025

“Automated Researchers Can Subtly Sandbag” by gasteigerjo, Akbir Khan, Sam Bowman, Vlad Mikulik, Ethan Perez, Fabien Roger

8 mins

Mar 26, 2025

“Negative Results for SAEs On Downstream Tasks and Deprioritising SAE Research (GDM Mech Interp Team Progress Update #2)” by Neel Nanda, lewis smith, Senthooran Rajamanoharan, Arthur Conmy, Callum McDougall, Tom Lieberum, János Kramár, Rohin Shah

58 mins

Mar 26, 2025

“Eukaryote Skips Town - Why I’m leaving DC” by eukaryote

12 mins

Mar 26, 2025

“Conceptual Rounding Errors” by Jan_Kulveit

6 mins

Mar 26, 2025

“Goodhart Typology via Structure, Function, and Randomness Distributions” by JustinShovelain, Mateusz Bagiński

32 mins

Sprache
Englisch
Land
Vereinigtes Königreich
Aktualisierung anfordern
Aktualisierungen können einige Minuten dauern.