在人工智能領(lǐng)域,一場關(guān)于通用人工智能(AGI)的競爭正悄然改變著中國大模型行業(yè)的格局。隨著多家初創(chuàng)公司在下一代超大規(guī)模模型競爭中顯露疲態(tài),大廠們則憑借雄厚的資本和技術(shù)實力,逐漸占據(jù)了主導(dǎo)地位。
2024年,中國大模型行業(yè)迎來了分水嶺。大廠與初創(chuàng)公司在技術(shù)、產(chǎn)品、商業(yè)化及生態(tài)建設(shè)等方面的戰(zhàn)略選擇開始明顯分化,不再沿著同一條路線發(fā)展。初創(chuàng)公司中,估值超過200億人民幣的五大模型公司中,百川智能已轉(zhuǎn)向醫(yī)療等垂直行業(yè)模型,月之暗面與MiniMax則更注重C端產(chǎn)品與應(yīng)用,僅有智譜與階躍星辰仍堅持向AGI大模型發(fā)力。而估值較低的二線模型公司也早已轉(zhuǎn)向,深耕細分領(lǐng)域。
與此同時,國內(nèi)外多家大模型的強勢發(fā)布,如Claude 3.5 Sonnet等,不僅在性能上大幅提升,甚至在某些指標(biāo)測試中超越了GPT-4,使得大模型成為像“電力”一樣的基礎(chǔ)資源。一家專注于AI代碼生成的創(chuàng)業(yè)公司表示,過去他們需要緊密圍繞單一大模型開發(fā),但如今已能在應(yīng)用開發(fā)中搭建容錯系統(tǒng),同時接入多個底層模型,根據(jù)產(chǎn)品需求調(diào)用不同模型的優(yōu)勢。
在此背景下,大模型市場的商機逐漸清晰,分為三層:底層基座模型提供商(類比發(fā)電廠)、中間云廠商(類比國家電網(wǎng))、上層AI軟硬產(chǎn)品應(yīng)用(類比電子產(chǎn)品)。在這三個層級中,無論是模型還是應(yīng)用的創(chuàng)業(yè)公司,由于資金、人才與資源的限制,大多只能選擇兩個戰(zhàn)場,甚至只能專注于一個賽道。而基座模型訓(xùn)練的難度和資源要求極高,使得更多創(chuàng)業(yè)公司的機會可能僅限于應(yīng)用層,如AIGC軟件應(yīng)用和AI智能硬件。
OpenAI在2024年繼續(xù)發(fā)布新模型,但GPT-5的遲遲未公布,加上過去一年人才流失和模型訓(xùn)練技巧的傳播,使得下一代基座大模型的發(fā)展充滿變數(shù)。推出下一代基座大模型的公司可能不再是OpenAI,也不再只有OpenAI。行業(yè)共識是,具備頂尖人才團隊、充足資金和大量訓(xùn)練數(shù)據(jù)的公司,才有可能在這場競爭中脫穎而出。
國內(nèi)大廠中,百度、阿里和字節(jié)在基座模型上具有較大機會。盡管有報道稱DeepSeek V3的訓(xùn)練成本不到600萬美元,但行業(yè)公認下一代基座大模型的訓(xùn)練成本仍是天文數(shù)字。大模型的成本走向兩個極端:一方面,基于已有大模型進行二次訓(xùn)練或優(yōu)化的成本在下降;另一方面,推出下一代參數(shù)規(guī)模更大、智識水平更高的基座模型成本則在上升。
2023年,國內(nèi)大廠在模型、云與應(yīng)用方面的布局尚不明顯。到了2024年,阿里將AI應(yīng)用通義從阿里云分拆,開始在C端發(fā)力;字節(jié)則在豆包推廣上投入大量預(yù)算,并招入大批人才;百度則在行業(yè)大模型與C端應(yīng)用上共同發(fā)力,實現(xiàn)了多個場景的商業(yè)化驗證。至此,百度、字節(jié)、阿里形成了大廠集體陣容,與創(chuàng)業(yè)公司形成了明顯的優(yōu)勢差。
大廠們在基座模型、云服務(wù)與應(yīng)用端均有布局,這是他們押注大模型浪潮、應(yīng)對不確定性的安全牌。百度、阿里、字節(jié)在基座模型層展現(xiàn)出不同的優(yōu)勢:百度投入堅決,團隊穩(wěn)定;阿里、字節(jié)則在文本、圖文或視頻上存在資源競爭與團隊競爭,賽馬制明顯。在云服務(wù)層,火山引擎綁定豆包與即夢,同時獲取其他公司的基座模型授權(quán);百度重點打頭部國央企等客戶;阿里云則一貫兇猛投資。
在應(yīng)用層,百度與阿里同時發(fā)力B、C端。百度與行業(yè)頭部客戶共創(chuàng)行業(yè)大模型,C端則有AI搜索、文庫、網(wǎng)盤等業(yè)務(wù);阿里則以夸克搜索、通義App為主要抓手。百度、阿里、字節(jié)也都使用自家基座大模型升級內(nèi)部產(chǎn)品。在AGI真正到來之前,最終贏家還未確定。大廠全面布局的優(yōu)勢是能保底增收、以守為攻,難點在于資源分配、組織協(xié)調(diào)與執(zhí)行效率。
百度在競爭下一代基座模型上勝率較高,關(guān)鍵在于其要保持甚至超越原有優(yōu)勢。算法積累時間長、技術(shù)系統(tǒng)完善、團隊人才資深穩(wěn)定、資金雄厚,都決定了百度可能是接下來極少數(shù)幾家能夠推出下一代基座大模型的中國公司之一。近期發(fā)布的《2024深度學(xué)習(xí)專利全景報告》顯示,從2011年到2023年,百度在深度學(xué)習(xí)和大模型領(lǐng)域申請專利數(shù)位居全球第一。
百度從2010年前后開始全力轉(zhuǎn)向人工智能,多年來一直將超過收入所得的20%用于人工智能等技術(shù)的研發(fā)。在戰(zhàn)略驅(qū)動的勝利下,百度在2023年3月推出中國第一個類ChatGPT產(chǎn)品文心一言,同時基于文心大模型與各行各業(yè)共創(chuàng)行業(yè)大模型。百度C端AI應(yīng)用的發(fā)展迅猛,以百度文庫為例,付費用戶已突破4000萬,AI功能的月活躍用戶數(shù)已超過9000萬。
百度在C端產(chǎn)品上的先發(fā)優(yōu)勢仍在持續(xù)起作用,對用戶心智的搶先占領(lǐng),決定了市場份額。尤其在付費的情況下,用戶極少會更換產(chǎn)品使用。百度在C端應(yīng)用上的優(yōu)勢,不僅是商業(yè)化成功的驗證,從數(shù)據(jù)的角度來說,也是百度的籌碼之一。百度搜索引擎帶來的大規(guī)模中文數(shù)據(jù)、百度智能云積累的企業(yè)場景數(shù)據(jù)、C端應(yīng)用產(chǎn)生的用戶交互數(shù)據(jù)等,都將成為百度在下一代基座模型競爭中的重要資源。
百度在中間層的算力與API服務(wù)方面也具有優(yōu)勢。飛槳平臺為文心大模型提供高效的訓(xùn)練和推理支持,為開發(fā)者提供完整工具鏈和開發(fā)環(huán)境。百度自建數(shù)據(jù)中心和AI專用加速硬件,增強了技術(shù)自主性,也能很大程度上規(guī)避外界因素的影響。在2025年,中國大模型格局將從百模大戰(zhàn)進入大浪淘沙的快速洗牌期,百度、字節(jié)、阿里等大廠將穩(wěn)坐“大模型牌桌”,競爭也將就此打開全新的局面。