开云体育app 具身智能如何抵达 “ChatGPT时刻”?智源院长、清华老师和3位首创东谈主聊了聊
发布日期:2026-02-14 21:19 点击次数:132

文|富充
裁剪|苏建勋
具身智能正在恭候我方的“ChatGPT时刻”。但对于这个时刻的具体界说,业内还充满非共鸣。
近日,原力灵机的时刻绽开日圆桌论坛上,5位AI界的一线产、学、研从业者把这个问题摊开,各自愿表了观点。他们永别是:
清华大学电子工程系长聘老师汪玉
北京智源东谈主工智能研究院院长王仲远
阶跃星辰首创东谈主&CEO 姜大昕
星海图首创东谈主&CEO 高继扬
原力灵机纠合首创东谈主&CEO 唐文斌
阶跃星辰首创东谈主&CEO姜大昕当先提倡“ChatGPT时刻”的界说尺度,是“零样本泛化”——即使给出从未见过的领导,AI也能回答问题完成任务——这恰是大谈话模子所展现的才略。
但姜大昕少顷指出,因为具身智能的泛化要触及场景、任务、操作物体等更多维度,是以机器东谈主要达到这个尺度还十分讲求。
算作机器东谈主创企的CEO,高继扬进一步阐发注解了具身智能买卖化落地的难点:大谈话模子不错“模子即居品”,结尾是手机电脑、渠谈是互联网传播;具身智能却必须穿过更长的产业链——整机、供应链、真机数据、线下托付,不可偏废。
基于以上各样待科罚的问题,原力灵机纠合首创东谈主&CEO 唐文斌,给出了一个脚下更可抵达的“具身智能ChatGPT时刻”:先在一个规章场景,闭环科罚其中统共的问题,且算过来ROI的账。
他的旨趣很节略,ChatGPT时刻让东谈主们看到谈话模子算作器具的可用性;要产生这种变化,具身智能也得从玩物和研究面孔,变身为一个灵验的事物。
也因此,这场圆桌就“具身智能脚下的发展宗旨”达成了初步共鸣:在追求更强泛化之前,先把一个垂类场景跑通,让机器东谈主在试验干活中滚出真机数据飞轮,再用数据反哺模子与系统迭代。
这个想路,也阐发注解了本次圆桌论坛主办方原力灵机的旅途遴荐:在数据飞轮动弹之前,要现存能评测真机闭幕的和解标尺,因此在发布自家模子与实质之前,原力灵机先纠合HuggingFace推出真机评测Benchmark“RoboChallenge”。
原力灵机设立于2025年3月,首创东谈主唐文斌为原旷视科技联创,公司主创团队中还包括多位前旷视科技中枢成员。设立不到一年,原力灵机已累计融资近10亿元,股东中包括阿里巴巴、蔚来本钱、欲望创投等机构。
2月10日,这家受到本钱市集意思的创企“交卷”设立以来首个模子DM0,以2.4B参数目登顶RoboChallenge榜首。天然,质疑也随之而来——“发起评测的东谈主,是否也能当选手”?对于先于模子发布Benchmark的考量、真机评测的首要性,以及业内的提问,唐文斌在圆桌论坛上也逐个作念出修起。
以下为本次圆桌对话内容,经作家整理:

△圆桌论坛嘉宾,图片:原力灵机
主理东谈主:从全球的范围来看,我们的具身智能的模子有哪些主流的时刻阶梯,我们咫尺处在一个什么样的阶段?
王仲远:在具身智能火热的背后,我看到蛮多隐忧。诚然硬件自身的特出很快,然则在结合踏实就业、安全性、电板等等方面,还有一系列的问题要科罚。
在模子方面,诚然昔日一年发布过一系列的具身模子,但我们合计还远莫得到具身的ChatGPT时刻。尤其当具身智能模子和硬件,在真机部署之后,我们发现离信得过但愿的大限制控制照旧有比拟大的Gap。
咫尺,具身模子的时刻阶梯仍然合座处于发展中,大家频繁洽商的有分模块式的比如VLM加阻挡,或者端到端的VLA,包括咫尺在研究上出奇火热的寰球模子等。但这些我认为齐还远莫得到不错出奇自恃地说具身智能照旧得到透澈冲破的阶段。
是以很有可能我们接下来会看到的情况是,通过VLA+强化学习,把一个一个场景科罚好。先干起活,在真机中蕴蓄更多的数据,变成数据的闭环,临了再来科罚泛化性的问题。
汪玉:我作念硬件多少量,包括算力、框架、旯旮、基础规律。从我的角度来看,咫尺的机器东谈主控制,诚然照旧有很大特出,但照旧局限在一个就业台上。基本上真要把大小脑配合起来完成一个再稍许长少量的任务,稍许跨多个模态之后(就比拟难了)。
我们组里会洽商到底具身干活得干到什么进程,比如说打理房子的任务,这不仅仅叠一个一稔,而是(机器东谈主)要去看统共这个词房子的景色,琢磨应该打理成什么样,然后运转少量点去干。干到临了把统共这个词房子打理干净了,这是一个很难的问题。
天然模子细目需要有冲破,但我也在琢磨,要是完成这样复杂的任务情况下,房子自身会不会也要发生变化。我是硬件出生,因此未必候会想在建这个房子的时候,建筑是不是应该要适配到有机器东谈主的畴昔生涯,毕竟正本只适配东谈主的生涯。就跟车路协吞并样,我们也不错有匡助机器东谈主的基础规律。
主理东谈主:汪憨厚讲的是我们下一代住宅尺度也许要把机器东谈主维度加进去。既然谈到了基础规律层面,汪憨厚如何看咫尺具身智能界限里,国内和硅谷的优谬误?
汪玉:好意思国在模子、数据等层面,更早地运转作念了一些事情,有了一些控制上的过问和冲破。然则真的到落地这个层面,我照旧确信中国不错很快地跟上,出奇是咫尺中国在具身这个维度照旧有媲好意思国更强的过问了。
有许多东谈主说具身是泡沫,我个东谈主是合计好窒碍易有一个宗旨,中国过问的强度媲好意思国大,我合计这可能是功德。因为中国的统共这个词产业链、供应链是无缺的。要是把控制绽开得再多少量,在模子和控制层面的过问再加大,是有可能媲好意思国在具身界限有更快的冲破。
此外,中国咫尺我合计学术界和产业界的联动逐渐变多了,就像我我方坐在这里。其实是产业界际遇的问题后,回头会跟研究机构再变成联动,而不是憨厚们坐在房子里面看论文作念研究。这样的联动线,我个东谈主合计这少量是和好意思国逐渐一致了,便是产学研在一谈去推动具身这个宗旨。
主理东谈主:不雅察到一个气候,前两天被誉为好意思国春晚的“超等碗”,上头有许多LLM(的宣传)。然则我们国度的春晚,要上台基本齐是机器东谈主。仲远院长对这个话题有莫得想要抒发的?
王仲远:我共享听到的两个小故事吧。
第一个是一位投资东谈主告诉我的小故事,好意思国那儿的具身智能投资东谈主,频繁会看创业团队里面有莫得华东谈主,好意思国投资东谈主认为有华东谈主智力确保这家创企搞的具身智能有可能得胜。
另外一个小故事,是我们我方在作念具身智能模子迭代的时候,一个很灾荒的点在于硬件会频繁损坏。硬件损坏了之后,一来一趟,频繁一修就得两个礼拜。然则我们神话好意思国那儿的机器东谈主硬件一坏得修三个月,短暂我们的心态就均衡许多。
是以一方面不错看到中国如实在制造业上有上风,这是我们作念具身智能方面的一个上风。另外,统共这个词行业依然处在早期,大家齐处在快速发展和迭代的阶段,是以远莫得到分出谁优谁劣。
主理东谈主:聊过了好意思国具身创业的“含华量”磋议。从统共这个词AI行业来看,很首要的里程碑叫“ChatGPT时刻”。是以大家认为“具身智能的ChatGPT时刻”是若何的?阶跃星辰的姜大昕总,您对于“ChatGPT时刻”应该有更深的感悟和体悟?
姜大昕:先说如何界说“ChatGPT时刻”,我合计最具标记性的便是“零样本”。零样土产货去作念泛化,给它任何一条领导,即使以前莫得见过,AI不错回答出问题。这是和正本的是实足不同样的,亦然为什么“ChatGPT时刻”让大家合计出奇昂然。
但要是对比天然谈话和具身只可,我合计“具身智能的ChatGPT时刻”会愈加讲求一些。
当先,从问题的界说自身,具身的泛化我合计不错从不同维度去界说。泛化的维度不同样,导致对于“具身智能的ChatGPT时刻”这件事情,不同东谈主之间会存在非共鸣。
第一个维度是场景的泛化,比如,它是封锁场景、半封锁场景照旧全绽开场景;第二个维度是任务,导航任务、握取任务照旧家务;第三个维度是宗旨的泛化,即使是一个节略的握取动作,握取的对象也分为钢铁、柔性。
其次,我合计从时刻角度来看,具身智能牵涉到揣摸机视觉,但在一些出奇根人道的问题上,大家莫得变成一个共鸣。比如,视觉究竟如何编码,如何作念自监督的预教化,比如说在3D空间里面如何作念推理,我合计这些事情可能畴昔照旧需要一些冲破,然后智力够到ChatGPT时刻。
主理东谈主:对于“具身智能的ChatGPT时刻”而言,界说是很重要的,是以作念具体具身智能的两位嘉宾,如何界说具身智能的ChatGPT时刻?
高继扬:我合计这个问题出奇值得洽商。我合计我们可能有一个更底层的问题,便是具身智能媾和话模子这两个产业,诚然底层齐是起原于AI时刻的立异冲破,然则具体到产业里面去看,二者还挺不同样的。
具身智能从时刻的产生到居品的磋议,再到买卖落地,链条更长。合座触及到高下流的零部件供应链和数据,而且具身智能的数据之前是莫得的。然后要作念算法。再之后,还会发现渠谈和结尾跟大谈话模子也不同样,大谈话模子的结尾是手机、电脑,渠谈是外交媒体的传播。
{jz:field.toptypename/}是以你会发咫尺统共这个词产业链条里面,大谈话模子最稀缺、亦然独一缺的一环便是模子自身。是以模子即居品,模子好了,统共这个词买卖化、产业化的链条齐运转具备了。
而具身智能,在刚才说的这几环里面,供应链、零部件齐很不熟识。莫得整机,也就莫得好的真机数据。具身智能的结尾便是机器东谈主自身,这也触及到要作念线下渠谈。
回到刚才的问题,对于“具身智能的ChatGPT时刻”界说,我认为要是从业务产线的角度来说,应该是我们真的看到了它在某些规章范围内具备买卖价值的这样一个时刻。
2026年我合计会是发生变化的一年,因为整机和供应链过程昔日两年的准备,发生了许多变化。数据我们也有许多,在模子、算法层面、后教化上的强化学习,预教化上的VLA以及最近的World Model(寰球模子)引入,齐给我们统共这个词预教化的泛化性和后教化的得胜率提了许多新的变化。
是以我合计本年是控制要闭环的一年。昨年2025年上半年,我们彰着看到智能的发展有所起步,2025年下半年智能彰着加快,重要磋议我们不错参考开源社区里的开源模子数目。
2026年会是智能爆发的一年,爆发的闭幕一定在某些控制界限变成控制的外溢,而且同期配合了供应链和整机。尤其是中国,权贵媲好意思国强得多,周期刚才提到了快5到10倍,成本低5到10倍。
唐文斌:我合计姜大昕讲的“ChatGPT时刻”条款蛮高的,这照旧是AGI时刻了。今天我们想想ChatGPT给我们带来最大的颤动是什么,我们也曾把它当成一个玩物,然则在那一刻,我们认为它是一个器具,它变成一个可用的东西。
是以我心中“具身智能ChatGPT时刻”的界说,是它变得灵验、确切赖的时刻。这照旧回到我们公司的责任想去作念的事情。
我们对灵验的界说出奇节略,它不错在规章场景,但要信得过闭环科罚统共的问题,要能够在ROI上头算瓦解,算瓦解ROI智力使得它能够被批量化控制。
闲适这样一个灵验的界说情况下,我们才信得过把一个玩物,或者说一个研究面孔变成了一个器具,这个时候我认为便是“具身智能的ChatGPT”时刻。我合计咫尺模子的才略施展如实出奇大,是以这并不是很远。
天然ChatGPT时刻之后,还有DeepSeek时刻,也便是说它什么时候能够出圈。今天具身智能机器东谈主不错在仓库、工场里打螺丝,但我合计老匹夫并弗成感知到,也许DeepSeek时刻可能是说全民齐有嗅觉。今天如何能够从工业物流走向商用、走向To C,这个时刻还要再晚一些,但我合计也不会太远。
主理东谈主:在旷视时期,原力灵机的主创团队履历了AI的1.0时期,咫尺到了具身智能的时期,你们并不是在一运转放出一个模子,而是先把RoboChallenge这样一个Benchmark放出来。是以是如何想考这个问题的?
唐文斌:模子是一个产物,它的闭幕,模子、算法、架构、数据齐在变化。当下其实统共这个词时刻架构口舌常缺失的,无论是数据,照旧仲远院长讲到的好用的硬件,以及评测尺度。
今天的统共这个词具身智能行业,我们统共作念算法的东谈主齐知谈,要是你不知谈如何评测它,你细目莫得办法让它特出。今天,我们能用的评测尺度可能有LIBERO、SimplerEnv、RoboTwin,它们的限制很小。许多Benchmark齐照旧被差未几刷爆了,但99点几分是代表刻下真实的才略吗?明显不是。
是以我们合计出奇需要来自物理寰球、基于物理寰球真实的、大限制的、真机的评测,智力够迷惑我们能够更好上前。
原力灵机里面花了许多力气在我们的具身框架Dexbotic上作念统共这个词基础规律的建筑,是但愿把一些东西放出来,能对行业作念一些孝顺。我们诚然是RoboChallenge的发起方,然则包括仲远院长、高继扬、清华汪憨厚等等,大家齐一谈在作念这个测评,是但愿行业里的更多东谈主加入一谈推动这个评测。
主理东谈主:今天在座的嘉宾也有多位是RoboChallenge的协作方。星海图算作第一批加入的企业,给RoboChallenge捐赠了硬件,这个想考是什么?
高继扬:然则信得过面向控制的、落地的具身评测尺度,一定是需要真机的。
我合计ChatGTP或者谈话模子的统共这个词发展,实足是买卖需求拉动的,Agentic、Coding、ChatBot这三大垂类有巨量的需求在拉动。
我们回头看具身智能,畴昔也会变成垂类的见识,垂类一定是来自真实需求,这些真实需求要落到真机的评测里面,智力够给我们作念研发的企业,还有包括畴昔的需求方变成比拟公允迭代的环境。
许多时候AI照旧实验科学,它有一定的旨趣、数学作念支援,但最终许多事照旧要试出来。“试”就要有响应,响应就要有评测。决定一个公司,一个组织,包括AI和其他的,很首要的一个磋议便是它的迭代效劳,是以我们想尽一切办法进步这个迭代效劳,响应的质地,这是为什么其时师兄提到说想作念RoboChallenge时,我出奇招供、出奇支援。
因为我们在公司里面有我方的一套Benchmark,大家可能10个场景不休去迭代。我合计我们也应该能够有一套统共这个词行业、统共这个词业界,齐能够普适的尺度,致使不错让学界参与进来,能够更好把产业界和学术界联动起来。
主理东谈主:RoboChallenge有出奇强的首要性,然则一运转出现的花式稍许有点怪。像是获利好的学生,我方出了测试题,然后我方去考试。汪憨厚如何评价学生的这种活动?(编者注:此处指原力灵机既是Benchmark评测尺度的发起方,我方也算作企业参与评测并得到了较好获利)
汪玉:我合计畴昔学习的模式可能会变,不一定是憨厚教的,可能学生便是我方学的。这亦然我们最近跟学校里面的共事在洽商,畴昔大学的发展可能真的不是憨厚教课,憨厚可能便是来考个试,然则考题的灵感不错来自于学生们,这个莫得任何问题。
回及其说,其扫尾在北京作念了一个很好的事情,便是作念亦庄的机器东谈主比赛,我们有两会一赛,有马拉松、机器东谈主大会和畅通会。正本更多锻真金不怕火实质才略,咫尺逐渐再加一些跟智能洽商的检测。
然则这样的面孔经常是低频的,每年可能就那么一次、两次。是以能弗成作念一个宽泛不错随时去测的真机测试,而况以相对公允的环境、教化场景,这个我还口舌常可爱的一种面孔。
把这种高频的、线上的,或者说无论在什么所在齐不错作念这件事情,成为现实,我合计这个才略还口舌常值得连续鼓吹的。
咫尺其实有十几位“勤学生”(参与方)一谈去共建这样一个RoboChallenge的平台,这个平台每个东谈主内心齐是公益的逻辑,在这样一个环境里面去竞赛。
什么时候能够以一个愈加公益的形态呈现,可能亦然我们不错连续盘考的。本来公益组织的建筑就需要许多期间。然则从发起到高频次真实寰球的评测,到大家一谈孝顺统共不同的场景,包括产业界、作念机器东谈主的、学术界一谈界说这些场景,再往后如何作念一个全开源的生态。这一套起来以后对于统共这个词行业是一个弘大的推动,是以我合计这事还口舌常值得去连续致力的。
唐文斌:我想插个话,如实我们在探讨这样一个事情,因为我们在此次DM0模子发布的时候,我们我方里面有一个小纠结。因为RoboChallenge是我们和Hugginface一谈发布的,诚然有许多同业的参与,但毕竟我们照旧发起方。是以,原力灵机我方到底应不应该提交我方发的模子,到底应不应该放这个获利,我们里面纠结了一阵子,伸开了很热烈的洽商,有不同的意见。
汪玉:OpenAI我方也有Benchmark,他们测完以后我方也发闭幕,这个我合计不矛盾。
唐文斌:因为OpenAI亦然这样干的,我们我方心里也漠然了。此次我们对团队提的条款开源一定要作念的出奇透澈,我们要保证大家下载了我们的code、DM0模子、Dexbotic(开导框架),径直去RoboChallenge提交就能拿到咫尺的分,这是我们在这个事情上这是一个很公开的事情,大家大大方方作念就好了。
主理东谈主:我们临了再来说一些预言性的问题。面向2026年,在具身智能界限,大家最期待看到的情况,或者能科罚的任务,会是什么?
汪玉:照旧从电子系角度来说,我真的但愿能变成一套云边端配合的体系,能够改动建筑,去构建面向机器和东谈主共生环境的基础规律。这套决策我合计本年可能有一个雏形出来,大家再一块去洽商。
王仲远:诚然我对硬件、模子齐有许多的期待,但可能我对2026年最期待的反而是在尺度上。
因为我合计咫尺无论是硬件的尺度、数据的尺度,包括模子输出的尺度,统共这个词生态出奇碎屑化,是以我蛮期待2026年在尺度上能够有一些冲破,它有可能极大促进统共这个词产业的发展。
因为智源一谈参与了RoboChallenge,我印象很深,其时和文斌交流的时候也说到数据大家各采各的数据,连花式、代码许多齐是不一致的,是以这就径直导致了许多时候模子也很难被疏通考据,直露说我们尝试下载和考据近期国表里发的许多的模子,临了我们部署起来齐很挺长途的,这里面有许多东西便是因为大家的尺度莫得和解。
2026年的时候,智源因为也在东谈主形和具身的标委会里,很大略率我们会牵头作念具身智能的尺度。
姜大昕:刚才听了文斌的共享很受启发,要是真的在职何场景、任何任务、任何宗旨上能够扫尾零样本的泛化,那便是“AGI时刻”了。
2026年我最期待原力灵机和阶跃星辰能够协作,扫尾文斌所说的ChatGPT时刻:能用、可靠的完成任务。
文斌要是合计这个任务莫得实足的挑战,那我们上半年扫尾ChatGPT时刻,下半年扫尾DeepSeek时刻。
高继扬:我合计照旧期待2026年真的能够在分娩力端看到一条明确的增长旅途。然后,在两年之内能够有单一场景,变成比如上万台这样的出货,我合计这是统共这个词行业齐首要需要的。
唐文斌:我的宗旨比高继扬小少量,我但愿看到在一个场景,有一千台赓续运行。
这里面我想说一下赓续运行是最重要的事情,而且不要场景许多,不是靠加法作念起来的,一个场景里面一千台赓续运行,某种进程上便是我们今天照旧走通了一个场景的限制化的闭环,我合计2026年有契机。
封面起原|AI生成