文 | 周鑫雨
编辑 | 邓咏仪
想要更接近通用人工智能,提高AI对图像、语音、视频等多模态内容的理解不可或缺。相较于注重文本交互的单模态语言模型,多模态模型能将AI领域拓展至识别、检测等更广泛的领域。
这是一个从 https://www.36kr.com/p/2282695937316614 下的原始话题分离的讨论话题
文 | 周鑫雨
编辑 | 邓咏仪
想要更接近通用人工智能,提高AI对图像、语音、视频等多模态内容的理解不可或缺。相较于注重文本交互的单模态语言模型,多模态模型能将AI领域拓展至识别、检测等更广泛的领域。