Découvrez les dernières avancées de l'IA multimodale, explorez ses innovations technologiques et les scénarios d'application pratiques futurs.
[Google]AudioLM: 一种用于音频生成的语言建模方法
6 mins • Nov 4, 2024
Charts
- 78Decreased by 33
Épisodes récents
Nov 4, 2024
[Google]AudioLM: 一种用于音频生成的语言建模方法
6 mins
Oct 21, 2024
[DeepSeek]Janus: 解耦视觉编码以实现统一的多模态模型
7 mins
Oct 16, 2024
[Baichuan]BAICHUAN-OMNI多模态模型技术报告
13 mins
Oct 14, 2024
[Apple]MM1.5:多模态大语言模型微调的方法、分析与见解
12 mins
Oct 13, 2024
Pixtral 12B: 兼顾文本和多模态任务的多模态模型
10 mins
Langue
Chinois
Pays
Chine
Catégories
Feed Host
Site web
Flux
Demander une mise à jour
Les mises à jour peuvent prendre quelques minutes.