人工智能军备竞赛白热化：谷歌最新AI大语言模型数据量扩充5倍

discobot · 2023 年5 月 17 日 14:01

据报道，谷歌上周发布的最新大语言模型使用的训练数据，几乎是2022年的上一代模型的5倍。得益于此，该模型在编程、数学和创意写作方面的表现更为优秀。

谷歌是在其I/O开发者大会上发布最新通用大语言模型PaLM2的。内部文件显示，该模型采用了3.6万亿个令牌（token）进行训练。令牌指的是单词串，这是训练大语言模型的重要基础，因为这可以教给模型如何预测字符串中可能出现的下一个单词。

这是一个从 https://www.36kr.com/p/2261584448335747 下的原始话题分离的讨论话题