在科技界的矚目下,埃隆·馬斯克通過其社交平臺(tái)X,預(yù)告了一款名為Grok 3的人工智能模型即將面世,并自信地宣稱這將是“地球上最聰明的AI”。
兩天后的北京時(shí)間2025年2月18日中午,馬斯克攜手xAI團(tuán)隊(duì)的工程師與研究人員,通過一場(chǎng)直播活動(dòng),正式揭開了Grok 3的神秘面紗。這場(chǎng)發(fā)布會(huì)細(xì)致入微地展示了Grok 3的多項(xiàng)突破性進(jìn)展。
發(fā)布會(huì)首先聚焦于Grok 3在訓(xùn)練過程中的巨大投入。據(jù)馬斯克透露,Grok 3是在名為Colossus的超級(jí)計(jì)算機(jī)上完成訓(xùn)練的,這臺(tái)僅用八個(gè)月時(shí)間便迅速搭建起的超級(jí)計(jì)算機(jī),配備了驚人的10萬(wàn)顆英偉達(dá)H100 GPU,提供了超過2億GPU小時(shí)的計(jì)算資源,這一數(shù)量是Grok 2的十倍之多。
發(fā)布會(huì)現(xiàn)場(chǎng),xAI團(tuán)隊(duì)展示了Grok 3與ChatGPT在數(shù)據(jù)上的對(duì)比,以及Grok 3在LMSYS(大模型競(jìng)技場(chǎng))中的卓越排名,進(jìn)一步證明了其強(qiáng)大的實(shí)力。從數(shù)學(xué)、科學(xué)到編程,Grok 3在各種基準(zhǔn)測(cè)試中均超越了主流模型,包括GPT-4、Claude 3.5 Sonnet等。
更引人注目的是,xAI團(tuán)隊(duì)現(xiàn)場(chǎng)演示了Grok 3的實(shí)際應(yīng)用能力。在接到生成一段關(guān)于太空發(fā)射的3D動(dòng)畫代碼的指令后,Grok 3僅用了大約兩分鐘的時(shí)間便生成了可運(yùn)行的Python代碼,并成功展示了3D動(dòng)畫效果。它還完成了一款類似俄羅斯方塊和寶石迷陣的游戲設(shè)計(jì)任務(wù)。
發(fā)布會(huì)上,xAI團(tuán)隊(duì)還推出了一款基于Grok 3的全新搜索引擎——DeepSearch。這款搜索引擎不僅能夠搜索網(wǎng)頁(yè)和查找現(xiàn)有資料,還能“推測(cè)用戶的真實(shí)意圖”并進(jìn)行深度思考,通過交叉對(duì)比多個(gè)信息源,確保返回最準(zhǔn)確的答案。
直播結(jié)束后,網(wǎng)友們對(duì)Grok 3展開了熱烈討論。AI領(lǐng)域?qū)<铱ㄅ廖鞣窒砹似洹跋刃邪妗笔褂皿w驗(yàn),指出Grok 3在解決復(fù)雜問題、創(chuàng)建棋盤游戲網(wǎng)頁(yè)等方面表現(xiàn)出色,甚至嘗試解決黎曼假設(shè)等難題。同時(shí),Grok 3還具備強(qiáng)大的搜索功能,能夠提供高質(zhì)量的研究問題答案。然而,在某些情況下,它也可能產(chǎn)生錯(cuò)誤的信息。
Imarena.ai官方在經(jīng)過測(cè)試后發(fā)文稱,Grok-3在所有類別中排名第一,突破了1400分的里程碑,這是一個(gè)前所未有的成就。
網(wǎng)友們對(duì)Grok 3的評(píng)價(jià)褒貶不一。有人認(rèn)為,Grok 3可能是現(xiàn)實(shí)世界中物理層面處理得最好的基礎(chǔ)大語(yǔ)言模型;而也有人認(rèn)為,Grok 3在編程方面并不擅長(zhǎng)。首批獲得Grok 3訪問權(quán)限的將是X平臺(tái)上的Premium+訂閱者,普通用戶何時(shí)能用上尚不清楚。