商湯科技近日揭曉了其2024年全年業(yè)績財報,數(shù)據(jù)顯示公司總收入實現(xiàn)了10.8%的增長,達到37.7億元人民幣。尤為引人注目的是,生成式AI業(yè)務(wù)異軍突起,收入躍升至24億元人民幣,同比激增103.1%,連續(xù)兩年保持三位數(shù)的驚人增速,穩(wěn)坐集團業(yè)務(wù)頭把交椅。
自大型語言模型面世以來,行業(yè)經(jīng)歷了從盲目追求規(guī)模擴張到如今對算力效率、訓(xùn)練至推理轉(zhuǎn)換及應(yīng)用落地等多方面的深刻反思,標(biāo)志著大模型技術(shù)已進入了一個嶄新的發(fā)展階段。這一轉(zhuǎn)變不僅預(yù)示著產(chǎn)業(yè)的日益成熟,也對工程技術(shù)實力及場景融合能力提出了更為嚴(yán)苛的要求。
作為AI領(lǐng)域的先行者,商湯科技早在數(shù)年前便開始布局AI基礎(chǔ)設(shè)施,其后更是將戰(zhàn)略升級為涵蓋“大裝置-大模型-應(yīng)用”三位一體的核心框架,這一前瞻性布局正逐漸顯現(xiàn)出其深遠影響。所謂“大裝置”,即商湯的AI基礎(chǔ)設(shè)施,它不僅為大模型提供堅實的算力支撐,還驅(qū)動技術(shù)創(chuàng)新,并通過應(yīng)用端推動AI技術(shù)的商業(yè)化落地,三者協(xié)同,形成了一個良性循環(huán)的生態(tài)系統(tǒng)。
2024年5月,國內(nèi)權(quán)威大模型測評機構(gòu)SuperCLUE榜單發(fā)布,商湯科技的“日日新5.0”(SenseChat V5)以總分80.03分的優(yōu)異成績奪得中文基準(zhǔn)測評榜首,更是在中文綜合表現(xiàn)上超越了GPT-4 Turbo,這是國內(nèi)大模型在該測評中首次登頂,標(biāo)志著國內(nèi)AI技術(shù)的重大突破。
商湯之所以能在SuperCLUE測評中取得如此佳績,離不開其在AI基礎(chǔ)設(shè)施上的提前布局。隨著全國智算中心建設(shè)的加速推進,算力資源的重要性日益凸顯,但算力分散、標(biāo)準(zhǔn)不一、使用效率低下等問題也隨之浮現(xiàn)。商湯針對這一痛點,著手算力運營,通過連接不同標(biāo)準(zhǔn)的計算卡,靈活適配多樣化的客戶需求,有效提升了算力的利用率。
商湯科技董事長兼CEO徐立指出,當(dāng)前AI領(lǐng)域競爭激烈,商湯提供的基礎(chǔ)服務(wù)更加貼近AI的發(fā)展現(xiàn)狀,不拘泥于單一生態(tài)的產(chǎn)品和平臺,而是根據(jù)實際需求,快速整合并利用最優(yōu)資源。過去三年間,商湯持續(xù)加大在AIDC基礎(chǔ)設(shè)施上的投入,其自持的上海臨港AIDC智算中心,通過創(chuàng)新的運營模式,將算力規(guī)模擴大至23,000PetaFlops。
商湯的大裝置旨在成為“最懂大模型的AI基礎(chǔ)設(shè)施”,它不僅服務(wù)于日日新大模型的訓(xùn)練與推理,還廣泛應(yīng)用于互聯(lián)網(wǎng)、金融、能源等多個成熟行業(yè),并拓展至具身智能、AIGC、AI4S(AI For Science)等高潛力領(lǐng)域,展現(xiàn)了強大的跨行業(yè)服務(wù)能力。
算力僅是生態(tài)構(gòu)建的一環(huán),大模型產(chǎn)業(yè)的高效運轉(zhuǎn)還需上下游的緊密協(xié)同。徐立強調(diào),“三位一體”戰(zhàn)略通過整合大裝置、大模型與應(yīng)用,將資源以最優(yōu)方式整合利用,打破了傳統(tǒng)商業(yè)模式中資源消耗的局限。這一戰(zhàn)略不僅顯著提升了大模型的訓(xùn)練和推理效率,還通過自動化多維并行策略和FP8混合精度訓(xùn)練等技術(shù),樹立了行業(yè)標(biāo)桿。
在應(yīng)用層面,商湯的日日新大模型在生產(chǎn)力工具和交互工具兩大方向上取得了顯著進展。生產(chǎn)力工具直接提升了企業(yè)辦公、金融、政務(wù)等場景的效率,客戶付費意愿大幅提升;交互工具則通過2B2C模式賦能業(yè)務(wù)伙伴,顯著增強了用戶體驗,滿足了智能陪伴、智能硬件交互、智能營銷等多場景需求。
商湯日日新大模型在保持市場領(lǐng)先地位的同時,不斷迭代升級。自2023年4月首次推出SenseNova大模型體系以來,至2024年7月已完成五次重大版本更新。最新發(fā)布的日日新5.5版本在多模態(tài)能力上實現(xiàn)了顯著提升,成為國內(nèi)首個對標(biāo)GPT-4o的多模態(tài)實時交互大模型,實現(xiàn)了語音、視頻和語言模型的深度融合。
商湯在原生融合多模態(tài)技術(shù)上投入重資,這一技術(shù)被認為是AI未來發(fā)展的必然趨勢。與傳統(tǒng)的多模態(tài)模型不同,商湯的技術(shù)實現(xiàn)了從數(shù)據(jù)層到模型架構(gòu)層的全流程融合,涵蓋了感知、思考到輸出的完整過程。在2024年全球CVPR大會上,商湯共有50篇論文入選,展現(xiàn)了其在視覺語言基礎(chǔ)模型及自動駕駛、機器人等前沿領(lǐng)域的深厚積累。
商湯的多元化AI產(chǎn)品已在多個領(lǐng)域取得應(yīng)用成效,“小浣熊家族”智能輔助服務(wù)已為數(shù)十萬用戶提供數(shù)十億次服務(wù),而商湯絕影也在行業(yè)內(nèi)率先實現(xiàn)了原生多模態(tài)大模型的車端部署。通過底層基礎(chǔ)設(shè)施與上層應(yīng)用的協(xié)同優(yōu)化,商湯構(gòu)建起了堅實的技術(shù)壁壘。