具身智能領(lǐng)域正經(jīng)歷一場(chǎng)從技術(shù)探索到產(chǎn)業(yè)落地的深刻變革,一系列關(guān)鍵問題與挑戰(zhàn)也隨之浮現(xiàn)。在2025商湯技術(shù)交流日具身智能論壇上,來(lái)自學(xué)界與產(chǎn)業(yè)界的重量級(jí)嘉賓齊聚一堂,圍繞具身智能與AI基礎(chǔ)設(shè)施的協(xié)同創(chuàng)新展開深入探討。
上海交通大學(xué)副教授、上海人工智能研究院首席科學(xué)家閆維新指出,具身智能在大小腦模型、仿真系統(tǒng)構(gòu)建及場(chǎng)景應(yīng)用方面取得了顯著進(jìn)展。得益于深度模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的深度協(xié)同,具身智能的小腦進(jìn)化迅速,機(jī)器人在不同環(huán)境中的魯棒性和泛化性大幅增強(qiáng)。同時(shí),大腦方面的創(chuàng)新也在加速,推動(dòng)具身智能在日常生活和工作場(chǎng)景中展現(xiàn)更多應(yīng)用潛能。
銀河通用合伙人、大模型負(fù)責(zé)人張直政同樣認(rèn)為,具身智能領(lǐng)域呈現(xiàn)出蓬勃發(fā)展的態(tài)勢(shì)。在數(shù)據(jù)層面,仿真合成數(shù)據(jù)與真實(shí)采集數(shù)據(jù)積累均呈現(xiàn)爆發(fā)式增長(zhǎng);在架構(gòu)層面,大小腦模型、分層端到端模型等創(chuàng)新理念不斷涌現(xiàn)。疊加國(guó)家政策的有力支持,行業(yè)對(duì)具身智能的規(guī)模化商業(yè)應(yīng)用充滿信心。
然而,具身智能仍面臨數(shù)據(jù)、成本、能力等方面的挑戰(zhàn)。庫(kù)帕思CEO黃海清指出,各企業(yè)間的數(shù)據(jù)難以互通,數(shù)據(jù)構(gòu)建成本居高不下,阻礙了模型的訓(xùn)練效率。高昂的成本也限制了機(jī)器人的普及速度。機(jī)器人在主動(dòng)思考和復(fù)雜環(huán)境適應(yīng)能力上與人類仍存較大差距,適用場(chǎng)景有限。
松應(yīng)科技創(chuàng)始人CEO聶凱旋強(qiáng)調(diào),物理AI仿真對(duì)促進(jìn)具身智能模型的訓(xùn)練起著關(guān)鍵作用。完善的物理AI仿真系統(tǒng)需要涵蓋各類組件,讓機(jī)器人能夠360度感知物理世界。通過物理AI仿真,可以加速技術(shù)的迭代和驗(yàn)證,推動(dòng)具身智能產(chǎn)業(yè)的發(fā)展。
在算法、算力、數(shù)據(jù)三要素方面,中美在具身智能領(lǐng)域存在哪些差距?嘉賓們一致認(rèn)為,在算法層面,中美差距并不大。張直政指出,VLA將成為具身智能未來(lái)的核心技術(shù)路徑,可大幅提升環(huán)境感知、任務(wù)規(guī)劃推理和動(dòng)作執(zhí)行能力。在算力層面,中美仍有差距,但隨著國(guó)產(chǎn)算力加速創(chuàng)新,正在加快追趕步伐。在數(shù)據(jù)層面,中國(guó)在物理場(chǎng)景和應(yīng)用數(shù)據(jù)采集上具有全棧優(yōu)勢(shì),是中國(guó)具身智能彎道超車的關(guān)鍵。
關(guān)于具身智能的“打臉時(shí)刻”,嘉賓們紛紛表達(dá)了自己的期待。張直政認(rèn)為,具身智能的“打臉時(shí)刻”將在各個(gè)行業(yè)悄然降臨,以多層次、全方位的方式在不同領(lǐng)域?qū)崿F(xiàn)突破。閆維新教授以烹飪機(jī)器人為例,展示了具身智能自主完成復(fù)雜任務(wù)的能力。黃海清提出了“打臉時(shí)刻”的兩個(gè)標(biāo)準(zhǔn):一是機(jī)器人在商業(yè)超市、工廠等場(chǎng)景中完成簡(jiǎn)單重復(fù)性任務(wù)的成本大幅降低;二是機(jī)器人具備共情能力,在情感陪護(hù)、康養(yǎng)養(yǎng)老等場(chǎng)景中給予人們情感關(guān)懷。
盡管具身智能領(lǐng)域熱度持續(xù)攀升,但前不久創(chuàng)投圈一位知名投資人“批量退出具身智能”的言論引發(fā)了熱議。面對(duì)這一質(zhì)疑,嘉賓們認(rèn)為,行業(yè)內(nèi)出現(xiàn)不同的討論聲音是正常現(xiàn)象,消滅泡沫是科技創(chuàng)新的驅(qū)動(dòng)力。只有直面質(zhì)疑、經(jīng)歷質(zhì)疑、克服質(zhì)疑,行業(yè)才能真正從實(shí)驗(yàn)探索階段走向產(chǎn)業(yè)落地階段。
盡管面臨多重挑戰(zhàn),但嘉賓們的共識(shí)是,泡沫爭(zhēng)議背后是產(chǎn)業(yè)突破的前奏。從烹飪機(jī)器人的自主操作到低成本工業(yè)場(chǎng)景的規(guī)模化落地,從情感交互的突破到跨行業(yè)效率的革命性提升,具身智能的“打臉時(shí)刻”或許不會(huì)一蹴而就,但已在細(xì)分領(lǐng)域悄然醞釀。唯有產(chǎn)學(xué)研協(xié)同攻堅(jiān)、開放共享基礎(chǔ)設(shè)施、直面質(zhì)疑并迭代價(jià)值,才能將具身智能從資本的“想象力試驗(yàn)”轉(zhuǎn)化為推動(dòng)社會(huì)進(jìn)步的“生產(chǎn)力引擎”。