近期,科技界迎來(lái)了一則令人矚目的消息:Figure公司宣布與Open AI的合作終止,并預(yù)告將在接下來(lái)的30天內(nèi)推出一項(xiàng)人形機(jī)器人領(lǐng)域的創(chuàng)新技術(shù)。這一預(yù)告迅速引發(fā)了廣泛的好奇與期待。
終于,F(xiàn)igure揭開(kāi)了神秘面紗,推出了其自主研發(fā)的具身模型Helix,并將其首次應(yīng)用于Figure機(jī)器人中。據(jù)Figure創(chuàng)始人兼CEO Brett Adcock介紹,搭載了Helix“大腦”的機(jī)器人,能夠輕松拾取各種家庭物品。
在一則展示視頻中,兩臺(tái)Figure機(jī)器人正協(xié)同工作,一臺(tái)桌子和一臺(tái)冰箱旁,它們將各種未見(jiàn)過(guò)的物品分類整理得井井有條,動(dòng)作流暢且高效。尤其是兩臺(tái)機(jī)器人在傳遞物品時(shí)默契的對(duì)視,讓眾多網(wǎng)友驚嘆不已,仿佛機(jī)器人擁有了某種意識(shí)。
這一切得益于Helix對(duì)機(jī)器人上半身的全控制,包括手腕、軀干、頭部和各個(gè)手指,實(shí)現(xiàn)了高速率的連續(xù)控制。視頻還罕見(jiàn)地展示了多機(jī)器人之間的協(xié)作,盡管這次的任務(wù)相對(duì)簡(jiǎn)單,但多機(jī)協(xié)作的交互和規(guī)劃無(wú)疑是未來(lái)機(jī)器人技術(shù)的一個(gè)重要課題。
在具體任務(wù)執(zhí)行上,F(xiàn)igure表示,只需向機(jī)器人發(fā)出指令,它便能拾起各種從未見(jiàn)過(guò)的家庭用品,如玩具、杯子等。這一能力得益于Helix強(qiáng)大的泛化能力。
Helix是一個(gè)集感知、語(yǔ)言理解和學(xué)習(xí)控制于一體的“視覺(jué)-語(yǔ)言-感知”(VLA)模型,實(shí)現(xiàn)了多項(xiàng)首創(chuàng)。它不僅能控制機(jī)器人上半身進(jìn)行高速連續(xù)動(dòng)作,還能實(shí)現(xiàn)多機(jī)器人協(xié)作,解決共享的遠(yuǎn)程操作任務(wù)。同時(shí),只需按照自然語(yǔ)言提示,就能拿起幾乎任何小型家居物品,包括數(shù)千種從未遇到過(guò)的物品。
更令人驚嘆的是,Helix使用一組神經(jīng)網(wǎng)絡(luò)權(quán)重來(lái)學(xué)習(xí)所有行為,無(wú)需針對(duì)特定任務(wù)進(jìn)行微調(diào)。這意味著,機(jī)器人能夠靈活應(yīng)對(duì)各種任務(wù),無(wú)需進(jìn)行額外的訓(xùn)練或編程。Helix還是首款完全在嵌入式低功耗GPU上運(yùn)行的VLA,具備立即進(jìn)行商業(yè)部署的條件。
在機(jī)器人上半身的控制上,Helix能以200Hz的頻率協(xié)調(diào)35個(gè)自由度的動(dòng)作空間,實(shí)現(xiàn)手指、手腕到頭部的流暢高效動(dòng)作。視頻中,機(jī)器人用頭部平穩(wěn)地跟蹤雙手,同時(shí)調(diào)整軀干以獲得最佳范圍,同時(shí)保持精確的手指控制以抓握物品。這種程度的實(shí)施協(xié)調(diào)和多任務(wù)泛化能力,在此前的VLA中還未曾見(jiàn)過(guò)。
Figure還展示了Helix在高難度多智能體操作場(chǎng)景中的應(yīng)用:兩臺(tái)Figure機(jī)器人之間協(xié)作實(shí)現(xiàn)零樣本雜貨存放。兩臺(tái)機(jī)器人采用相同的Helix模型權(quán)重進(jìn)行操作,無(wú)需訓(xùn)練或分配角色,就能通過(guò)自然語(yǔ)言進(jìn)行合作。這種能力使得機(jī)器人在非結(jié)構(gòu)化環(huán)境中的部署成為可能。
Brett Adcock表示,團(tuán)隊(duì)花費(fèi)了一年多的時(shí)間研發(fā)出了Helix,讓人形機(jī)器人無(wú)需經(jīng)過(guò)任何訓(xùn)練或代碼,就能抓取幾乎任何家庭用品。這一創(chuàng)新技術(shù)無(wú)疑為機(jī)器人領(lǐng)域帶來(lái)了新的突破和可能性。