具身智能領域正經歷一場從技術探索到產業落地的深刻變革,一系列關鍵問題與挑戰也隨之浮現。在2025商湯技術交流日具身智能論壇上,來自學界與產業界的重量級嘉賓齊聚一堂,圍繞具身智能與AI基礎設施的協同創新展開深入探討。
上海交通大學副教授、上海人工智能研究院首席科學家閆維新指出,具身智能在大小腦模型、仿真系統構建及場景應用方面取得了顯著進展。得益于深度模仿學習與強化學習的深度協同,具身智能的小腦進化迅速,機器人在不同環境中的魯棒性和泛化性大幅增強。同時,大腦方面的創新也在加速,推動具身智能在日常生活和工作場景中展現更多應用潛能。
銀河通用合伙人、大模型負責人張直政同樣認為,具身智能領域呈現出蓬勃發展的態勢。在數據層面,仿真合成數據與真實采集數據積累均呈現爆發式增長;在架構層面,大小腦模型、分層端到端模型等創新理念不斷涌現。疊加國家政策的有力支持,行業對具身智能的規模化商業應用充滿信心。
然而,具身智能仍面臨數據、成本、能力等方面的挑戰。庫帕思CEO黃海清指出,各企業間的數據難以互通,數據構建成本居高不下,阻礙了模型的訓練效率。高昂的成本也限制了機器人的普及速度。機器人在主動思考和復雜環境適應能力上與人類仍存較大差距,適用場景有限。
松應科技創始人CEO聶凱旋強調,物理AI仿真對促進具身智能模型的訓練起著關鍵作用。完善的物理AI仿真系統需要涵蓋各類組件,讓機器人能夠360度感知物理世界。通過物理AI仿真,可以加速技術的迭代和驗證,推動具身智能產業的發展。
在算法、算力、數據三要素方面,中美在具身智能領域存在哪些差距?嘉賓們一致認為,在算法層面,中美差距并不大。張直政指出,VLA將成為具身智能未來的核心技術路徑,可大幅提升環境感知、任務規劃推理和動作執行能力。在算力層面,中美仍有差距,但隨著國產算力加速創新,正在加快追趕步伐。在數據層面,中國在物理場景和應用數據采集上具有全棧優勢,是中國具身智能彎道超車的關鍵。
關于具身智能的“打臉時刻”,嘉賓們紛紛表達了自己的期待。張直政認為,具身智能的“打臉時刻”將在各個行業悄然降臨,以多層次、全方位的方式在不同領域實現突破。閆維新教授以烹飪機器人為例,展示了具身智能自主完成復雜任務的能力。黃海清提出了“打臉時刻”的兩個標準:一是機器人在商業超市、工廠等場景中完成簡單重復性任務的成本大幅降低;二是機器人具備共情能力,在情感陪護、康養養老等場景中給予人們情感關懷。
盡管具身智能領域熱度持續攀升,但前不久創投圈一位知名投資人“批量退出具身智能”的言論引發了熱議。面對這一質疑,嘉賓們認為,行業內出現不同的討論聲音是正常現象,消滅泡沫是科技創新的驅動力。只有直面質疑、經歷質疑、克服質疑,行業才能真正從實驗探索階段走向產業落地階段。
盡管面臨多重挑戰,但嘉賓們的共識是,泡沫爭議背后是產業突破的前奏。從烹飪機器人的自主操作到低成本工業場景的規模化落地,從情感交互的突破到跨行業效率的革命性提升,具身智能的“打臉時刻”或許不會一蹴而就,但已在細分領域悄然醞釀。唯有產學研協同攻堅、開放共享基礎設施、直面質疑并迭代價值,才能將具身智能從資本的“想象力試驗”轉化為推動社會進步的“生產力引擎”。