为何 CV 里没有出现类似 NLP 大模型的涌现现象?

表达一下个人思考,权当抛砖引玉。欢迎指正。

因为普遍认为CV领域还没出现涌现,所以得先思考CV的涌现是什么才能继续回答为何没有涌现。自然语言天然带有语义信息,因为语言本身就是人类交流思想所使用的工具,它既能承载世界知识,也能表述智能(逻辑、推理等等),还非常方便和人类进行alignment。而纯RGB域视觉信息的来源是自然场景,我认为其极限应该是以下几点:


这是一个从 https://www.zhihu.com/question/597657073/answer/3000794811 下的原始话题分离的讨论话题