多モーダルAIの最新の発展を深く理解し、その技術革新と未来の実際の応用シーンについて探求します。
[Google]AudioLM: 一种用于音频生成的语言建模方法
6 mins • Nov 4, 2024
Charts
This show is not currently ranked in any charts.
最近のエピソード
Nov 4, 2024
[Google]AudioLM: 一种用于音频生成的语言建模方法
6 mins
Oct 21, 2024
[DeepSeek]Janus: 解耦视觉编码以实现统一的多模态模型
7 mins
Oct 16, 2024
[Baichuan]BAICHUAN-OMNI多模态模型技术报告
13 mins
Oct 14, 2024
[Apple]MM1.5:多模态大语言模型微调的方法、分析与见解
12 mins
Oct 13, 2024
Pixtral 12B: 兼顾文本和多模态任务的多模态模型
10 mins