首席科学家姚顺雨腾讯首篇论文:道破为何AI死活听不懂人话
创始人
2026-02-04 22:21:07
0

快科技2月4日消息,近日,腾讯混元团队和复旦联合团队发布了首篇论文《CL-bench》。

值得一提的是,这也是姚顺雨入职腾讯首席AI科学家后,首次署名的研究论文。

他在文中提到,当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。

一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。

人类并不只依赖多年前学到的死知识,而是在实时地从眼前的上下文中学习。

在这篇论文里,研究团队提到,大模型在上下文利用上,依然存在显著的能力短板。

为了衡量现有模型距离真正的“上下文学习者”还有多远,研究团队构建了CL-bench。

这是一个专门评测语言模型能否从上下文中学习新知识并正确应用的基准。

CL-bench包含由资深领域专家精心制作的500个复杂上下文、1899个任务和31607个验证标准。

CL-bench只包含一个简单但苛刻的要求:“解决每个任务要求模型必须从上下文中学习到模型预训练中不存在的新知识,并正确应用。”

通过实验发现,世界上排名前十的语言模型在CL-bench上的任务解决率平均只有17.2%。

也就是说即使是如今最强的语言模型,在上下文的利用方面仍然做得不好,甚至可以说是还不会利用上下文,从上下文中学习。

不过这也为大语言模型后续的迭代指出了一个可能的方向,强化模型从上下文中进行学习的能力。

相关内容

热门资讯

原创 “... 一、那个让男人后背发凉的电话 闺蜜讲了个真事:朋友林静结婚七年发现老公出轨。林静没按剧本哭闹撕逼,反...
原创 9... 职业生涯至今,总共踢了97场正式比赛,但却从未踢满全场,这就是22岁的丘库埃梅卡的特殊经历。 在昨...
如何计算气候变化的经济成本?最... 中新网北京3月29日电(记者 孙自法)国际学术期刊《自然》最新发表一篇经济学论文,聚焦气候变化代价提...
家校共育 | 共赴自我探索之旅... Parents Coffee Time 年末,古北耀华的Parents Coffee Time洋...
德元升提醒|坚持三周,把鼻炎养... 当妈后才懂,孩子鼻子不通气的夜晚有多难熬。翻来覆去的小身子,憋得通红的小脸,每一声呼吸都揪着心。试过...
港产片女星患癌症晚期,癌细胞四... 现年58岁的港产片女星顾婕,现在已经确诊大肠癌晚期,体内的癌细胞在全身扩散。 对于顾婕的身体状况,外...
聚焦大龄孤独症托付难题,多方联... 3月27日,“父母渐年迈 大福怎么办”大龄孤独症群体关爱服务行动发布会在深圳举行。近年来,深圳市一直...
湖北十大踏春目的地榜单出炉!高... 春柳抽芽寄哀思,清风拂面念故人,清明是是烟火与诗意的交融,是思念与希望的共生。 在湖北,一直都有“早...