谷歌新AI大语言模型PaLM2训练数据量达3.6万亿个token,为前一代5倍


【资料图】

5月17日消息,谷歌日前发布最新通用大语言模型PaLM2。据CNBC获取的一份内部文件显示,该模型采用3.6万亿个token数据进行训练。至于去年发布的前一版本PaLM,当时其训练数据约7800亿个token,是最新一代的1/5左右。