mcgrof

AI: post transformers

Explorez l'évolution des réseaux de neurones à travers des critiques éclairantes de recherches révolutionnaires, retraçant le parcours des transformers aux avancées contemporaines de l'IA.

Listen on Apple Podcasts

STAR: Sub-Entry Sharing TLB for Multi-Instance GPU Efficiency

18 mins • Oct 26, 2025

Épisodes récents

Oct 26, 2025

STAR: Sub-Entry Sharing TLB for Multi-Instance GPU Efficiency

18 mins

Oct 26, 2025

Strata: Efficient Hierarchical Context Caching for LLM Serving

16 mins

Oct 26, 2025

FlashAttention: IO-Aware Fast and Memory-Efficient Attention

14 mins

Oct 26, 2025

Introducing MTEB v2: Multimodal Embedding Evaluation

12 mins

Oct 26, 2025

Structural Understanding of LLM Overthinking

17 mins

Langue
Anglais
Pays
États-Unis
Catégories
Feed Host
Demander une mise à jour
Les mises à jour peuvent prendre quelques minutes.