在人工智能領(lǐng)域,一場關(guān)于技術(shù)革新與生態(tài)構(gòu)建的盛宴于近日拉開帷幕。在這場備受矚目的生態(tài)開放日上,階躍星辰,一家被業(yè)界譽(yù)為“AI六小虎”的成員,以其獨(dú)特的姿態(tài)和前瞻性的布局,成為了全場焦點(diǎn)。
回顧2024年,階躍星辰無疑是模型層競爭中的佼佼者。這家起步較晚的公司,卻以驚人的速度發(fā)布了涵蓋語言、語音、視覺、推理等多個(gè)模態(tài)的11款模型,展現(xiàn)了其在多模態(tài)技術(shù)上的深厚積累。
階躍星辰的模型矩陣,如同一顆顆璀璨的星辰,照亮了AI探索的征途。
階躍星辰的CEO姜大昕曾透露,公司自成立之初便明確了AGI(通用人工智能)的發(fā)展路徑:從單模態(tài)到多模態(tài),再到多模態(tài)理解和生成的統(tǒng)一,最終邁向世界模型和AGI。而2024年,正是階躍星辰邁向多模態(tài)關(guān)鍵節(jié)點(diǎn)的一年。
然而,在階躍星辰開啟“多模態(tài)理解和生成的統(tǒng)一”探索之前,一條名為DeepSeek的“鯰魚”攪動(dòng)了整個(gè)大模型賽道。DeepSeek不僅通過API價(jià)格戰(zhàn)將大模型價(jià)格拉低至1元/百萬tokens,還開源了推理模型R1,引發(fā)了業(yè)界對(duì)Scaling Law暴力美學(xué)的深刻反思。
DeepSeek的崛起,對(duì)階躍星辰等六小虎構(gòu)成了不小的挑戰(zhàn)。R1等高性能模型的開源,讓閉源模型的商業(yè)化之路變得更加艱難。同時(shí),R1采用的低投入強(qiáng)化學(xué)習(xí)訓(xùn)練范式,也讓六小虎的高估值和燒錢模式受到了質(zhì)疑。
面對(duì)DeepSeek的沖擊,階躍星辰選擇了以開源作為回應(yīng)。在R1發(fā)布后不久,階躍星辰便開源了兩款多模態(tài)模型,這一舉動(dòng)被視為其捍衛(wèi)技術(shù)地位的無聲宣言。這兩款模型,一款是參數(shù)量達(dá)到300億的圖生視頻模型Step-Video-T2V,另一款則是1300億參數(shù)的語音交互模型Step-Audio,它們與DeepSeek注重的文本模型形成了鮮明對(duì)比。
階躍星辰開源的多模態(tài)模型,無疑為行業(yè)注入了新的活力。
在探索AGI的征途中,階躍星辰將多模態(tài)推理視為模型發(fā)展的重要方向。這一觀點(diǎn)在行業(yè)內(nèi)得到了廣泛認(rèn)同。百度集團(tuán)執(zhí)行副總裁沈抖就曾預(yù)測(cè),行業(yè)的重心將從訓(xùn)練轉(zhuǎn)移到推理,多模態(tài)將成為主流需求。
階躍星辰在多模態(tài)推理模型上的進(jìn)展令人矚目。在生態(tài)開放日上,階躍星辰宣布與清華大學(xué)聯(lián)合研發(fā)的Open-Reasoner-Zero,這是首個(gè)從預(yù)訓(xùn)練模型直接進(jìn)行大規(guī)模強(qiáng)化學(xué)習(xí)的開源推理模型,其效率是DeepSeek-R1-Zero的25倍。階躍星辰還在推進(jìn)一項(xiàng)內(nèi)部項(xiàng)目——視覺推理模型,該模型能夠?qū)崿F(xiàn)視覺空間下的慢思考,能夠理解和解答復(fù)雜的視覺問題。
階躍星辰在多模態(tài)推理模型上的突破,為AI的發(fā)展開辟了新的道路。
在模型落地方向,階躍星辰看好AI Agent的潛力。姜大昕認(rèn)為,2025年將是Agent的爆發(fā)年。他提到,影響Agent發(fā)展的兩個(gè)關(guān)鍵因素——多模態(tài)和慢思考,在2024年都取得了顯著進(jìn)展。階躍星辰將Agent分為垂類Agent和智能終端Agent兩大類,并積極與下游客戶進(jìn)行生態(tài)共創(chuàng)。
階躍星辰的Agent合作生態(tài),展現(xiàn)了其在智能終端和垂類領(lǐng)域的廣泛布局。
在生態(tài)開放日的圓桌論壇上,曠視科技創(chuàng)始人印奇以自動(dòng)駕駛公司“千里科技”董事長的身份亮相。他認(rèn)為,目前最成功的AI產(chǎn)品仍是特斯拉和抖音,但大模型將為應(yīng)用帶來更大的市場空間。印奇的出席,無疑為這場生態(tài)開放日增添了更多看點(diǎn)。