商湯科技近日揭曉了其2024年全年業績財報,數據顯示公司總收入實現了10.8%的增長,達到37.7億元人民幣。尤為引人注目的是,生成式AI業務異軍突起,收入躍升至24億元人民幣,同比激增103.1%,連續兩年保持三位數的驚人增速,穩坐集團業務頭把交椅。
自大型語言模型面世以來,行業經歷了從盲目追求規模擴張到如今對算力效率、訓練至推理轉換及應用落地等多方面的深刻反思,標志著大模型技術已進入了一個嶄新的發展階段。這一轉變不僅預示著產業的日益成熟,也對工程技術實力及場景融合能力提出了更為嚴苛的要求。
作為AI領域的先行者,商湯科技早在數年前便開始布局AI基礎設施,其后更是將戰略升級為涵蓋“大裝置-大模型-應用”三位一體的核心框架,這一前瞻性布局正逐漸顯現出其深遠影響。所謂“大裝置”,即商湯的AI基礎設施,它不僅為大模型提供堅實的算力支撐,還驅動技術創新,并通過應用端推動AI技術的商業化落地,三者協同,形成了一個良性循環的生態系統。
2024年5月,國內權威大模型測評機構SuperCLUE榜單發布,商湯科技的“日日新5.0”(SenseChat V5)以總分80.03分的優異成績奪得中文基準測評榜首,更是在中文綜合表現上超越了GPT-4 Turbo,這是國內大模型在該測評中首次登頂,標志著國內AI技術的重大突破。
商湯之所以能在SuperCLUE測評中取得如此佳績,離不開其在AI基礎設施上的提前布局。隨著全國智算中心建設的加速推進,算力資源的重要性日益凸顯,但算力分散、標準不一、使用效率低下等問題也隨之浮現。商湯針對這一痛點,著手算力運營,通過連接不同標準的計算卡,靈活適配多樣化的客戶需求,有效提升了算力的利用率。
商湯科技董事長兼CEO徐立指出,當前AI領域競爭激烈,商湯提供的基礎服務更加貼近AI的發展現狀,不拘泥于單一生態的產品和平臺,而是根據實際需求,快速整合并利用最優資源。過去三年間,商湯持續加大在AIDC基礎設施上的投入,其自持的上海臨港AIDC智算中心,通過創新的運營模式,將算力規模擴大至23,000PetaFlops。
商湯的大裝置旨在成為“最懂大模型的AI基礎設施”,它不僅服務于日日新大模型的訓練與推理,還廣泛應用于互聯網、金融、能源等多個成熟行業,并拓展至具身智能、AIGC、AI4S(AI For Science)等高潛力領域,展現了強大的跨行業服務能力。
算力僅是生態構建的一環,大模型產業的高效運轉還需上下游的緊密協同。徐立強調,“三位一體”戰略通過整合大裝置、大模型與應用,將資源以最優方式整合利用,打破了傳統商業模式中資源消耗的局限。這一戰略不僅顯著提升了大模型的訓練和推理效率,還通過自動化多維并行策略和FP8混合精度訓練等技術,樹立了行業標桿。
在應用層面,商湯的日日新大模型在生產力工具和交互工具兩大方向上取得了顯著進展。生產力工具直接提升了企業辦公、金融、政務等場景的效率,客戶付費意愿大幅提升;交互工具則通過2B2C模式賦能業務伙伴,顯著增強了用戶體驗,滿足了智能陪伴、智能硬件交互、智能營銷等多場景需求。
商湯日日新大模型在保持市場領先地位的同時,不斷迭代升級。自2023年4月首次推出SenseNova大模型體系以來,至2024年7月已完成五次重大版本更新。最新發布的日日新5.5版本在多模態能力上實現了顯著提升,成為國內首個對標GPT-4o的多模態實時交互大模型,實現了語音、視頻和語言模型的深度融合。
商湯在原生融合多模態技術上投入重資,這一技術被認為是AI未來發展的必然趨勢。與傳統的多模態模型不同,商湯的技術實現了從數據層到模型架構層的全流程融合,涵蓋了感知、思考到輸出的完整過程。在2024年全球CVPR大會上,商湯共有50篇論文入選,展現了其在視覺語言基礎模型及自動駕駛、機器人等前沿領域的深厚積累。
商湯的多元化AI產品已在多個領域取得應用成效,“小浣熊家族”智能輔助服務已為數十萬用戶提供數十億次服務,而商湯絕影也在行業內率先實現了原生多模態大模型的車端部署。通過底層基礎設施與上層應用的協同優化,商湯構建起了堅實的技術壁壘。