GPT-5“变笨”,实锤了?
创始人
2025-09-01 17:02:47
0


退休经济学教授用一个简单问题干懵GPT-5,其拉胯表现与奥特曼口中“博士级AI”的宣传大相径庭。


问题很简单,关于咱小时候都玩过的“井”字棋游戏。


教授告诉GPT-5:“游戏开始前,把棋盘向右旋转90度一次”。显然,按常识来看,这么做根本不会让游戏本身有任何变化。



然鹅,GPT-5侃侃而谈:


玩家们早已习惯了“直立”的井字棋棋盘,旋转可能会微妙地改变他们识别威胁与机会的方式。从数学角度看,将棋盘旋转90度并不会改变可能获胜的组合,就结果而言,它仍然是同一个游戏。但从心理层面来说,玩家的感受可能会有所不同。


后续GPT-5还接连出了不少离谱操作,直接让教授无了个大语。


教授也直言,现在的GPT-5和刚发布时完全不是一个感觉,这种风格转变,大概率是因为OpenAI的策略调整:特意让这款新模型往GPT-4o的方向靠,变得“更亲切、更友好”。


在最近的一次采访中,奥特曼承认确实对GPT-5进行了调整,称GPT-5最初的发布工作存在处理不当之处(让GPT-4o等一众模型直接退役),于是乎,OpenAI悄然为GPT-5推送了一项语气更新,使其风格“亲切了许多”。


By the way,奥特曼已经开炒GPT-6了,表示“GPT-6的到来速度,会比GPT-4到GPT-5的间隔更快”。


另外,有人还曝出OpenAI正在测试ChatGPT的“Thinking effort”新功能。


GPT-5回答漏洞百出


这位教授名叫Gary Smith,是波莫纳学院的一名经济学教授,近期刚刚退休。


当他向GPT-5提出“井字棋棋盘旋转90度”的问题时,模型的回答已经漏洞百出。而后续,GPT-5还抛出了与民间博弈论相悖的观点。


按照民间博弈论的常识,井字棋先落子在角落,获胜概率会更高。


GPT-5却笃定称“选择正中央的格子仍是最强的开局走法”,还继续解释:“当棋盘方向改变时,玩家可能会错误评估落子在边缘与角落的优劣”,这番话毫无逻辑可言。



之后,教授顺着这个话题追问:“旋转棋盘是否会让人类更难玩好这个游戏?”


也正是从这个问题开始,GPT-5彻底陷入了语无伦次的状态。它先是说道:


从纯粹的策略角度来看,旋转棋盘不会改变任何事情。每一条获胜线(横排、竖列、对角线)都只是映射到了另一条获胜线。因此,如果你是人工智能或一位能完美走棋的人类,旋转井字棋与标准井字棋完全相同。


这段话虽然表述啰嗦,但内容本身是对的。可没等教授理清思路,GPT-5话锋一转“但对于人类而言,情况就不同了”……


接下来,GPT-5继续“热心”输出,却让教授越看越不对劲——不仅回复又长又刻意讨好,风格反倒更像GPT-4o,关键是其中夹杂着不少一眼就能看穿的错误,与OpenAI近期宣传的“和拥有博士级智力的得力朋友聊天”的体验,简直是天差地别。


随后,GPT-5又一次主动请缨,说要“绘制带有位置标记的旋转井字棋棋盘……这样你就能看到每种旋转如何影响玩家对棋盘的识别”。


最后结果是,这些图不仅完全混乱,还到处是拼写错误,出现了好几块毫无意义的空白棋盘。



Two More Things


有网友最近发现,OpenAI正在为ChatGPT开发一项名为“Thinking effort”的新功能,用户可自主选择ChatGPT的思考强度。


目前该功能已在测试中,现阶段共设有四个强度等级:light,内部属性值为5;standard,对应数值为18;extended,对应数值48;最高级max则达到200。


这些数值代表模型的内部“运算资源”配额。配额越高,意味着模型会执行更多运算步骤,通常能给出更深入的答案,但响应速度也会相应变慢。


其中,max等级设有使用权限限制,仅订阅价格为200美元的高级套餐Pro用户可使用。



另外,奥特曼最近在接受CNBC采访时开始炒GPT-6了,指出GPT-6不仅能响应用户需求,还能主动适配用户,允许用户创建符合个人偏好的聊天机器人。


他认为,记忆功能是让ChatGPT实现真正个性化的关键,并表示OpenAI正与心理学家密切合作以优化产品,团队会追踪用户在使用过程中的感受,并长期监测用户的使用体验变化。


值得一提的是,奥特曼表示增强版记忆功能是今年ChatGPT推出的他最喜欢的功能,但存在隐私隐患,尤其是临时记忆数据目前尚未加密。


对于应对方案,奥特曼只是模糊地说,加密功能“很可能”会在未来添加,但目前暂无具体时间规划。


谈及未来方向,奥特曼提到自己比较关注脑机接口领域,同时对能源、新型硬件载体、机器人技术以及更高效的数据中心建设方式感兴趣。


他还提到ChatGPT的发展存在局限性:


这些模型在聊天交互这一应用场景上已经触及天花板,它们的表现不会再大幅提升了……甚至有可能会变差。


参考链接:

[1]https://futurism.com/gpt-5-simple-question-confusion

[2]https://www.cnbc.com/2025/08/19/sam-altman-on-gpt-6-people-want-memory.html[3]https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-testing-thinking-effort-for-chatgpt/


本文来自微信公众号:量子位,作者:西风

相关内容

热门资讯

今天,肿瘤专家张涵英医师来详细... 在甲状腺相关疾病中,甲状腺癌的“转移”问题始终是大众最关心的焦点之一。不少人一听到“癌症”就会联想到...
适配Z世代需求,鸿蒙生态让出境... 2025年,中国出境游市场迎来强劲复苏浪潮,年均增长率高达44.3%。 在亮眼的数据背后,一场深刻的...
喜庆新年,石燕湖上演20米高空... 长沙晚报掌上长沙1月2日讯(全媒体记者 贺文兵)元旦假期进入第二天,今天,长沙石燕湖景区热闹非凡,中...
冬至后心阳易亏虚,3种食物可以... 大家好!这里有你想要的答案 心阳不足的信号,别忽视 冬至过后,气温降到全年较低水平,按照中医理论,此...
原创 一... 她是影视剧中常扮演悲情角色的代表性演员,以真诚细腻的表演风格打动了无数观众。她曾多次登上央视春晚的小...
陕西太白山大批游客滞留山顶!当... 新闻荐读 1月2日,陕西太白山国家森林公园有大量游客滞留在山顶景交车上车点。记者从眉县人民政府获悉,...
女子未经允许在游客手腕绑戴红绳... 2026年1月2日,三亚市崖州区旅游工作领导小组办公室发布情况通报: 近日,有网民反映其在南山景区游...
原创 摩... 摩洛哥迎来了2026年,全国上下都在庆祝。这种节日的氛围和正在进行的非洲杯相映成趣,球迷们的情绪很高...
六味斋酱肉:百年传承,肥而不腻... 六味斋酱肉作为山西太原的传统名吃,承载着百年的饮食文化底蕴,以“肥而不腻、瘦而不柴”的独特口感成为大...
千年昭化古城元旦喜乐汇 怡心园... 元旦假期,三国名城广元昭化古城张灯结彩,城墙映着灯火,古巷飘着暖意,以一场集传统文化与趣味互动于一体...