特斯拉机器人大转向:训练需求至少是汽车的10倍
创始人
2025-08-26 15:24:06
0

本文来自微信公众号:凤凰网科技 (ID:ifeng_tech),作者:凤凰网科技


北京时间8月26日,据《商业内幕》报道,特斯拉在自动驾驶技术上坚持使用纯视觉方案,现在它又把这一套成熟策略用在了人形机器人Optimus的训练上


知情内部人士告诉《商业内幕》,特斯拉已在6月底告知员工,公司未来将更加专注于通过纯视觉方案来推进Optimus人形机器人的训练。


此前,特斯拉使用动作捕捉服和虚拟现实(VR)头显来记录人类操作员的数据,并远程操控机器人。现在,特斯拉将主要通过录制员工执行任务的视频来训练机器人,让其学习如何完成例如拾取物体或折叠T恤等动作。


内部人士称,特斯拉表示,放弃动作捕捉服和远程操作将使团队能够更快速地扩大数据收集规模。


这一调整标志着特斯拉机器人战略的重大转变,将让Optimus的训练方式与埃隆·马斯克(Elon Musk)长期坚持的理念保持一致:AI可以通过摄像头掌握复杂任务。长期以来,特斯拉也采用类似的方法来训练其自动驾驶系统


打破常规


远程操作和动作捕捉是行业训练机器人时的标准做法。例如,知名机器人公司波士顿动力就曾使用远程操作来训练其Atlas机器人。在训练过程中,员工会穿上动作捕捉服执行各种任务。这些数据随后会被传输给机器人。动作捕捉服也可用于远程控制机器人。


目前尚不清楚特斯拉未来是否会再次优先使用动作捕捉服和远程操作,或者是否利用视频数据在此前收集的信息基础上进行进一步训练。


人类与机器认知研究所的高级研究科学家罗伯特·格里芬(Robert Griffin)对《商业内幕》表示,大量远程操作数据使机器人能够通过与环境的实际互动来学习。他表示,要教会机器人将视频数据转化为现实世界的动作并非易事。


“如果你只是使用视频数据,就没有这种直接交互体验。”他说道。


今年5月,特斯拉发布了一段视频,似乎显示Optimus机器人正在根据视频录像完成各种任务。


特斯拉负责Optimus硬件研发的总监康斯坦蒂诺斯·拉斯卡里斯(Konstantinos Laskaris)似乎已经承认了这一新策略。今年5月,他在领英上发文称:“这听起来令人难以置信,但我们的机器人正在通过人类视频直接学习新任务!”


马斯克也在5月表示,Optimus最终将能够通过观看YouTube视频学习执行任务


知情内部人士称,在技术转型期间,特斯拉曾短暂停止Optimus团队的招聘。截至8月底,特斯拉的招聘页面仍列出了50多个与Optimus相关的职位。


技术转型


知情人士表示,在6月底之前,特斯拉仍在远程操作Optimus,并通过动作捕捉服训练机器人。员工们需要花时间排查动作捕捉服和Optimus的问题,这限制了团队能够收集的数据量。


自训练方式转变以来,员工们开始专注于使用5个内部自制摄像头记录自身动作。这些摄像头安装在员工佩戴的头盔和沉重背包上。摄像头向各个方向拍摄,为AI模型提供精确的环境定位数据。


佛罗里达州立大学FAMU-FSU工程学院机器人实验室主任克里斯蒂安·胡比茨基(Christian Hubicki)表示,多角度拍摄可能帮助特斯拉采集更精细的细节,“比如关节和手指的位置”,并实现机器人的空间精准定位。他指出这些视频也可用于增强此前通过远程操作收集的数据集。


执行训练任务的工作人员会收到具体指令,特别是在手部动作方面需要确保动作尽可能接近人类形态。一名人士称,有些员工可能需花费数月时间重复执行同一个简单动作。


谢菲尔德大学机器人专家乔纳森·艾特肯(Jonathan Aitken)告诉《商业内幕》,特斯拉很可能需要想办法教会Optimus使用可应用于多种任务的动作。


“在这种规模的操作中,他们必须建立通用动作库,否则逐个训练所有动作将耗费无穷的时间。”艾特肯表示。


他补充说,特斯拉可能会采用与Physical Intelligence公司类似的策略,后者向机器人输入海量示范数据,使其能够学习可转移技能并灵活应用,而非仅仅机械记忆单项任务的执行方式。


比自动驾驶更难


这一新策略与特斯拉训练其自动驾驶系统的方案一致。尽管其他自动驾驶公司使用激光雷达和雷达传感器来训练软件,特斯拉主要依赖多个摄像头。


特斯拉使用从数百万特斯拉车主收集的数据,这些车辆配备了八到九个摄像头。马斯克表示,特斯拉之所以能在中国发布其辅助驾驶系统,得益于该公司利用公开亚洲街道视频训练其AI系统。


不过,马斯克在1月份的财报电话会议上承认,“Optimus人形机器人的训练需求,可能最终至少是汽车所需的10倍。”


艾特肯表示:“这是非常符合特斯拉风格的机器人开发方式。没有其他公司在同等规模上尝试这样做。他们需要的数据量将与训练汽车所用的数据量相当。”


俄勒冈州立大学AI与机器人专家艾伦·费恩(Alan Fern)表示,对于特斯拉来说,训练Optimus将比开发自动驾驶汽车更加艰巨。


“驾驶只是单一任务。”费恩称。他表示,主要靠视频学习要求机器人理解视频中发生的情况,然后具备完成任务的技能,“有些技能可以通过观察学习,有些则需在模拟器或现实中进行物理实践”。


截至发稿,特斯拉尚未就此置评。(综合整理|箫雨)


若您有相关线索,欢迎联络,一经采用,将支付相应报酬。

相关内容

热门资讯

沉迷工作,原来是“抑郁”了? 本文来自微信公众号:简单心理 (ID:jdxl2000),责编:罗文,作者:简单心理,原文标题:《沉...
中医智慧照亮脑健康:传统疗法如... 偏头痛是一种常见的慢性神经血管性疾病,给患者的生活和工作带来了诸多不便。中医传统疗法以其独特的整体观...
2025中国健康科普大赛河南赛... 本报讯(记者 杨须 通讯员 郑智源 王建坡)8月15日,2025中国健康科普大赛河南赛区作品征集展演...
被“现任”与“前任”填满的女性... 女性综艺再度卷起话题漩涡,《姐姐当家》与《我家那闺女2025》两档女性生活观察节目集中“拱火”。这一...
斗破苍穹|云韵-私家密照 高清... 国漫女神云韵壁纸欣赏:曾是加玛帝国十大强者之一,排名第三,拥有三星斗皇的实力! 国漫女神云韵壁纸欣...
不止于预订!旅游小程序开发,打... 在旅游行业竞争白热化的今天,单纯提供机票酒店预订功能的平台已难以满足用户日益多元化和个性化的需求。旅...
【我的家乡我推介】儿童友好乡村... 为深入贯彻落实党的二十大关于全面推进乡村振兴的战略部署,发挥儿童在乡村振兴中“小小主人翁”的作用,深...
损耗降三成,物美Agent破解... 出品 | 虎嗅智库头图 | AI生成晚上八点钟,北京物美超市的生鲜区,店员已不再忙着给蔬菜贴折扣标签...
别小看爱哭的男人:他们的眼泪,... 在这个多元且复杂的社会中,每个人的情感表达方式都是独一无二的。其中,喜欢哭的男人往往被贴上各种标签,...
失眠的你,绿茶中的L-茶氨酸或... 失眠的你,绿茶中的L-茶氨酸或许能保护你的大脑 你是不是也试过熬夜到深夜,第二天起来感觉脑袋昏昏沉沉...