人工智能军备竞赛白热化:谷歌最新AI大语言模型数据量扩充5倍

据报道,谷歌上周发布的最新大语言模型使用的训练数据,几乎是2022年的上一代模型的5倍。得益于此,该模型在编程、数学和创意写作方面的表现更为优秀。

谷歌是在其I/O开发者大会上发布最新通用大语言模型PaLM2的。内部文件显示,该模型采用了3.6万亿个令牌(token)进行训练。令牌指的是单词串,这是训练大语言模型的重要基础,因为这可以教给模型如何预测字符串中可能出现的下一个单词。


这是一个从 https://www.36kr.com/p/2261584448335747 下的原始话题分离的讨论话题