DjvuLee

智涌多模

Découvrez les dernières avancées de l'IA multimodale, explorez ses innovations technologiques et les scénarios d'application pratiques futurs.

Listen on Apple Podcasts

[Google]AudioLM: 一种用于音频生成的语言建模方法

6 mins • Nov 4, 2024

Épisodes récents

Nov 4, 2024

[Google]AudioLM: 一种用于音频生成的语言建模方法

6 mins

Oct 21, 2024

[DeepSeek]Janus: 解耦视觉编码以实现统一的多模态模型

7 mins

Oct 16, 2024

[Baichuan]BAICHUAN-OMNI多模态模型技术报告

13 mins

Oct 14, 2024

[Apple]MM1.5:多模态大语言模型微调的方法、分析与见解

12 mins

Oct 13, 2024

Pixtral 12B: 兼顾文本和多模态任务的多模态模型

10 mins

Langue
Chinois
Pays
Chine
Catégories
Feed Host
Demander une mise à jour
Les mises à jour peuvent prendre quelques minutes.