Meta大动作!开源多感官AI模型,不仅能看会听,还能“感知温度”

前段时间,带着开源模型LlaMA“杀的”谷歌和微软“措手不及”的Meta,又一次在AI战场上丢下了一颗重磅炸弹。

今天,Meta重磅开源了多感官AI模型ImageBind(https://github.com/facebookresearch/ImageBind)。以视觉为核心,结合文本、声音、深度、热量(红外辐射)、运动(惯性传感器),最终可以做到6个模态之间任意的理解和转换。


这是一个从 https://wallstreetcn.com/articles/3688392 下的原始话题分离的讨论话题