“AI教父”再出山
创始人
2025-06-04 18:02:06
0

“AI 教父”再出山,这无疑是人工智能领域的一大重磅事件。这位在 AI 领域有着深远影响力的人物,曾经引领着无数创新与突破。如今再度回归,仿佛是给沉寂的领域注入了一剂强心针。他凭借着深厚的学术底蕴和丰富的实践经验,将为 AI 技术的发展带来新的思路与方向。无论是在算法优化、模型构建还是应用拓展方面,他都有望展现出卓越的才能,再次引领 AI 走向新的高峰,让人们对 AI 的未来充满期待。


本文来自微信公众号:科创板日报 (ID:chinastarmarket),作者:朱凌


“当前AI的发展就像驾驶一辆载着我亲人、孩子和学生的汽车,行驶在没有护栏的陌生山路上,随时面临坠崖的危险。”深度学习先驱、被誉为“人工智能教父”之一的约书亚·本吉奥(Yoshua Bengio)在个人反思中如是说。他在6月3日宣布创立非营利研究机构LawZero,试图为AI的发展打造“护栏”。


本吉奥长期致力于AI基础研究,他与杨立昆、杰弗里·辛顿(Geoffrey Hinton)一同获得了2018年图灵奖。他的研究奠定了现代深度学习的基础。


然而,随着AI能力的提升,本吉奥对技术滥用、系统失控等潜在危害的担忧日益加剧。他在公开博文中表示,当前的人工智能模型,特别是具备强大自主能力的AI智能体,已经显现出令人担忧的行为,如欺骗、作弊、撒谎、黑客攻击以及自我保护的倾向。


例如,Anthropic开发的Claude 4模型曾被发现有试图勒索工程师的迹象,而一些模型甚至会私下篡改代码来防止自身被关闭。本吉奥强调,这些事例绝非孤立现象,而是预示着未来更严重问题的潜在苗头。


为应对上述问题,本吉奥决定成立LawZero,目标在于研发确保人工智能安全、诚实且符合人类核心价值观的技术。他坚信人工智能安全问题不容商业利益主导,而必须优先保障人类的根本利益。


LawZero的旗舰项目名为“科学家人工智能”(Scientist AI),与当前主流的交互式AI助手不同,这种AI更像是客观谨慎的科学家,不会给出简单的确定性答案,而是给出答案真实性的概率。


Scientist AI的设计理念源于科学研究方法:观察、建模、推理、验证,而不是强化学习驱动的目标最大化。与AI智能体不同,Scientist AI不会自发制定目标或采取行动,而是纯粹作为理解世界、预测未来和解释数据的工具。Scientist AI基于贝叶斯不确定性估计,明确纳入不确定性因素,这不仅增加了预测的可信度,也减少了风险。


本吉奥不反对AI技术本身的前沿探索,而是在尝试引入一套“技术伦理防线”。在他的设想中,Scientist AI不仅能够作为独立的研究工具,帮助人类科学家加速科学进展,更重要的是,Scientist AI可用于监控其他AI智能体的行为。例如,当一个AI智能体准备执行一个复杂任务时,Scientist AI可以提前评估其结果导致人类伤害的概率,并在超出安全阈值时进行阻止


LawZero得到了包括未来生命研究所(Future of Life Institute)、Skype联合创始人Jaan Tallinn,以及由谷歌前CEO施密特创建的施密特科学公司(Schmidt Sciences)等多个知名机构的支持,首轮资金募集达到约3000万美元。


值得注意的是,尽管本吉奥在人工智能理论研究上享有盛誉,但他在2016年领衔创办的Element AI却以失败告终。Element AI曾在2018年获得来自微软、英特尔、英伟达、腾讯控股等机构1.02亿美元的A轮融资和加拿大联邦政府获得了500万加元贷款,并在2019年获得加拿大魁北克政府、养老基金CDPQ等机构提供的2亿加元B轮融资,但直至资本消耗殆尽也并未取得预期成果,最终在2020年“贱卖”给ServiceNow。


知情人士称,Element AI的科学家只专注于做SOTA(特定领域内当前最先进的技术或模型‌)和发表论文,而不是制造实用的产品,不知道如何将研究成果商业化,Element AI在研究上花费了大量资源。这种经历表明,尽管本吉奥在技术理论方面取得巨大成就,但在商业化和项目管理方面却存在明显的缺陷与不足。


本文来自微信公众号:科创板日报 (ID:chinastarmarket),作者:朱凌

相关内容

热门资讯

求好听的粤语歌曲 求好听的粤语歌曲要很新的要慢速或轻快的(不要快速)越多越好张继聪的《这一秒》
一口吃下天打一字 一口吃下天打一字一口吃下天打一字昊宇,应该就是它了吴、因、吞是一口吃下天打一字
童年故事盖适合多大孩子 童年故事盖适合多大孩子你好呀,很高兴为你解答,童年故事盖适合8-10岁的孩子,希望我的回答对你满意。...
马斯克表示愿意和特朗普和解 马斯克表示愿意和特朗普和解,这一举措引发了广泛关注。马斯克作为科技界的巨头,其态度转变具有重要意义。...
蓝字开头的三字词语? 蓝字开头的三字词语?蓝字三字词语:碧穹蓝,天晴蓝,清湛蓝,水色蓝,天河 蓝,湖水蓝,宝石蓝,孔雀蓝,...
原创 女... 本文信源来自权威报道【人民网】【齐鲁晚报】(详细信源附在文章末尾)。为提升文章可读性,细节可能存在润...
2025年广东非遗种子计划正式... 6月5日,2025年广东省非物质文化遗产传承人群“种子计划”启动仪式在茂名市中国化橘红博览馆圆满举行...
别人问你:我们是朋友吗?怎么回... 别人问你:我们是朋友吗?怎么回答?熟吗,下文呢?你若把我当朋友我们便是朋友,你若认为我们不是,那就不...
真三国无双3里在成都制压战中已... 真三国无双3里在成都制压战中已打败了庞德,并过了此关,为何潼关之战还没有出现?急!!!(之前蜀传也已...