首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
创始人
2026-02-04 22:21:07
0

快科技2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。

值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。

他在文中提到,当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。

一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。

人类并不只依赖多年前学到的死知识,而是在实时地从眼前的上下文中学习。

在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。

为了衡量现有模型距离真正的“上下文学习者”还有多远,研究团队构建了CL-bench。

这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。

CL-bench包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。

CL-bench只包含一个简单但苛刻的要求:“解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。”

通过实验发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2%。

也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。

不过这也为大语言模型后续的迭代指出了一个可能的方向,强化模型从上下文中进行学习的能力。

相关内容

热门资讯

当预设遭遇现实:特朗普为何对伊... 2026年7月4日,美国迎来建国250周年的独立日庆典,而数千公里之外的伊朗,已故最高领袖哈梅内伊的...
外来画种如何说“中国话”?观此... 中国油画自舶入本土,便踏上了一条不断寻根与拓界的双重旅程——既需在百年变局中辨析传统,又需在现实土壤...
石景山出发!市郊铁路如何购票、... 7月1日,衙门口东站通车 石景山居民通勤出行 有了“家门口的专列” 根据后台留言咨询最多的问题 小石...
原创 医... 58岁的王阿姨身体一直硬朗,体态匀称,体重常年稳定,从来没有消瘦的情况。她一直觉得,糖尿病的典型表现...
原创 世... 前阵子小区体检,发生了一件特别让人惋惜的事。62岁的张阿姨,一辈子不抽烟、不喝酒,作息规律,每天坚持...
先戴好自己的氧气面罩:照顾抑郁... “自从家人确诊抑郁症,我连呼吸都不敢太大声。”“我每天都在强颜欢笑,生怕哪句话没说对刺激到他。”在陪...
原创 7... 转眼 7 月 7 日就到小暑节气,盛夏的闷热真的太磨人了!天气又热又潮,空气里都是黏糊糊的湿气,好多...
增肌减脂别踩雷!少碰这2种鱼:... 为了增肌减脂,不少人天天大口吃肉、吃豆腐,以为蛋白质吃得越多效果越好。可坚持一段时间后,体脂没降,体...
黄皮再次被点名!研究发现:吃得... 先说一个反直觉的结论:有一种水果,近年在痛风饮食地图里反复被划重点,不是因为要躲着它,而是因为吃得多...
一架小小的无人机,何以变成“以... 中新网7月5日电(记者 刁炜)一边是装备精良、掌握情报与火力优势,拥有大批先进战机、重型火炮和装甲战...