在2024年的科技浪潮中,具身智能的創業熱潮正席卷機器人行業,但一場關于機器人技術路徑的“內部分歧”也逐漸顯現。
在深入訪談了眾多機器人企業后,我們觀察到了一種行業內的“階層劃分”。多位業內人士透露,軟件開發者往往輕視硬件開發者,而大模型專家則對強化學習研究者持保留態度。這種認知差異,深刻影響著機器人創業者的切入點和戰略選擇。
據英諾天使基金合伙人王晟介紹,當前國內的機器人創業公司大致分為三類:一是傳統機器人背景的團隊,他們聚焦于硬件能力,如控制和電機技術,尤其重視機器人本體的研發,如人形或四足機器人;二是軟件背景團隊,他們更看重機器人的智能化和泛化能力,這類團隊又可細分為從AI熱潮轉型而來的創業者,如計算機視覺、強化學習專家,以及擁有大模型背景的新玩家,后者在行業內處于較為領先的位置。
宇樹 Unitree G1
一家具身智能大腦公司的創始人直言不諱地表示,軟件才是機器人發展的關鍵瓶頸,但目前硬件公司在AI軟件方面的投入嚴重不足,往往只是簡單接入開源的大模型。相比之下,宇樹科技等硬件派企業則對AI投入持謹慎態度,認為硬件才是他們的核心競爭力,甚至歡迎客戶僅使用其硬件。
這種“軟硬之爭”導致國內機器人行業呈現出一種分裂狀態。大部分硬件公司仍采用傳統的硬件思維,對“大腦”的運用淺嘗輒止;而大部分專注于“大腦”的公司則選擇從頭開始研發硬件。兩者各自為政,缺乏統一的行業共識。
更令人驚訝的是,盡管大模型在手機、電腦等終端上表現出色,但在機器人領域卻未能發揮預期效果。多位投資人和業內人士透露,許多機器人廠商展示的酷炫demo背后,往往隱藏著大量的失敗嘗試和“不誠實”的剪輯。大模型與機器人所需的“空間智能”之間存在巨大差距,語言大模型甚至可能因數據量過大而產生“幻覺”,干擾任務執行。
Figure 02
據了解,目前大部分硬件公司對大模型的理解和應用并不深入,主要停留在簡單接入通用語言大模型的階段。而真正適配具身智能的大模型在國內尚屬空白。為了解決這一問題,機器人行業曾嘗試在多模態大模型和機器人身體之間引入“小腦”作為中間層,但這一方法又帶來了新的問題,如子任務的無限預設和數據匱乏等。
智元遠征A2-max
面對這一困境,機器人行業開始了一場集體“糾偏”。投資風向在2024年下半年悄然變化。此前,投資人普遍傾向于投資人形機器人硬件公司,但隨著人形機器人公司的估值飆升,這些公司變得“貴到投不起”。與此同時,專注于機器人小腦/大腦的公司則面臨融資困境,不得不重新思考市場定位。然而,今年下半年以來,這一趨勢開始逆轉,投資人開始轉向具身智能領域。
硬件廠商也開始反思過去的模式,逐漸意識到通用基礎模型能力的重要性。盡管大模型尚未真正應用于機器人領域,但它給這一行業帶來的啟示是,或許需要先構建通用的基礎模型能力,再在此基礎上發展專用的能力,以系統性地解決通用性問題。
機器人領域的“軟硬之爭”暴露了AI沖擊下機器人行業的混沌狀態。然而,不確定性中的確定性是,機器人的終局必然是硬件與具身智能的結合,軟硬件缺一不可。無論是從軟件還是硬件出發,最終的目標都是相似的,關鍵在于誰的商業效率更高。而在AGI時代,機器人公司需要既懂AI又懂硬件的團隊,更重要的是,團隊成員之間需要相互認同。