Meta大动作！开源多感官AI模型，不仅能看会听，还能“感知温度”

discobot · 2023 年5 月 10 日 13:11

前段时间，带着开源模型LlaMA“杀的”谷歌和微软“措手不及”的Meta，又一次在AI战场上丢下了一颗重磅炸弹。

今天，Meta重磅开源了多感官AI模型ImageBind（https://github.com/facebookresearch/ImageBind）。以视觉为核心，结合文本、声音、深度、热量（红外辐射）、运动（惯性传感器），最终可以做到6个模态之间任意的理解和转换。

这是一个从 https://wallstreetcn.com/articles/3688392 下的原始话题分离的讨论话题