LessWrong

LessWrong (30+ Karma)

リスナーの皆さんは、LessWrongコミュニティからの洞察に満ちた投稿の魅力的な音声読み上げを楽しむことができます。これは、合理性や意思決定に関する考えさせられるコンテンツを求める方に最適です。

Listen on Apple Podcasts

[Linkpost] “Reasoning-Finetuning Repurposes Latent Representations in Base Models” by Jake Ward, lccqqqqq, Neel Nanda

6 mins • Jul 25, 2025

最近のエピソード

Jul 25, 2025

[Linkpost] “Reasoning-Finetuning Repurposes Latent Representations in Base Models” by Jake Ward, lccqqqqq, Neel Nanda

6 mins

Jul 24, 2025

“Building and evaluating alignment auditing agents” by Sam Marks, Sam Bowman, Euan Ong, Johannes Treutlein, evhub

11 mins

Jul 24, 2025

“The Whole Check” by JustisMills

7 mins

Jul 24, 2025

“‘Behaviorist’ RL reward functions lead to scheming” by Steven Byrnes

21 mins

Jul 23, 2025

“Steering Out-of-Distribution Generalization with Concept Ablation Fine-Tuning” by kh4dien, Helena Casademunt, Adam Karvonen, Sam Marks, Senthooran Rajamanoharan, Neel Nanda

12 mins

言語
英語
イギリス
ウェブサイト
フィード
更新をリクエストする
更新には数分かかる場合があります。