在人工智能領域,最新一期的《2025年人工智能指數報告》由斯坦福大學人工智能研究所隆重發布,揭示了全球AI技術的最新進展。報告顯示,在2024年度全球重要大模型的貢獻中,中國以15項成果脫穎而出。在這些重要機構中,谷歌與OpenAI以各占7席的成績并列榜首,而阿里巴巴則以6個入選模型緊隨其后,位列第三。
這份備受矚目的年度報告,自2017年首次發布以來,已連續八年由斯坦福人工智能實驗室主任李飛飛教授領銜編制。其多維度的評估框架和跨年度的數據追蹤,為全球學術界和產業界提供了觀察AI技術演進的重要視角。
斯坦福報告指出,中美兩國在全球AI領域的影響力最為顯著。值得注意的是,中美模型的性能差距在近年來顯著縮小。從2023年的17.5%驟降至2025年的0.3%,這一變化表明兩國在AI技術上的實力已日趨接近。
阿里巴巴作為中國科技公司中的佼佼者,在入選的重要大模型數量上獨占鰲頭。其6款入選模型,包括Qwen-72B、Qwen1.5-72B、Qwen2-72B、Qwen2.5-72B、Qwen2.5-32B和QwQ-32B,不僅展示了中國AI技術的強大實力,也推動了中國AI在全球范圍內的崛起。
阿里巴巴通義實驗室在開源模型方面的貢獻同樣令人矚目。至今,該實驗室已開源了200多款模型,其中千問模型在全球的衍生模型數量已突破10萬,超越了美國的Llama模型,成為世界上最大的開源大模型。這一成就不僅彰顯了阿里巴巴在AI技術上的領先地位,也為中國AI生態的繁榮做出了重要貢獻。
報告還指出,中美兩國在AI模型性能上的差距縮小,阿里巴巴的通義千問模型功不可沒。近年來,中國模型的性能逐步逼近美國,這一趨勢在LMSYS聊天機器人競技場上得到了體現。從2024年1月美國頂級模型優于中國最佳模型9.26%,到2025年2月這一差距縮小至僅1.70%,中國AI技術的快速進步顯而易見。
在具體性能表現上,中國模型也在逐步縮小與美國模型的差距。以MMLU、MMMU、MATH和Humaneval等基準測試為例,美國領先模型在2023年底的表現顯著優于中國同類模型。然而,到了2024年底,這些差異已顯著縮小。這一轉變的背后,離不開阿里巴巴和DeepSeek等中國企業的持續努力和爆發。
在訓練數據量和算力需求方面,中國模型也展現出了獨特的優勢。以Qwen2.5-72B為例,其訓練數據量略高于Llama-405B和DeepSeek-V3,成為截至2024年訓練數據量最大的模型。同時,中國模型在實現頂尖性能的同時,所需計算資源顯著低于多數主流大語言模型。這一優勢使得中國AI技術在全球競爭中更具競爭力。
阿里巴巴在AI領域的投入也堪稱激進。今年年初,阿里巴巴CEO吳泳銘宣布未來三年將在AI和云計算領域投入3800億元人民幣,以加速云和AI硬件基礎設施建設、提升AI基礎模型的研發、推動AI應用的轉型升級。這一舉措不僅彰顯了阿里巴巴對AI技術的重視,也為中國AI生態的繁榮注入了強勁動力。
在開源生態方面,阿里巴巴同樣取得了顯著成就。從2022年開始,阿里巴巴采取開源措施,將自家的基礎模型開放給AI社區,構建了強大的開源生態。目前,通義已接入29萬家企業,包括90%的互聯網公司、90%的上市商業銀行和90%的汽車品牌等。Qwen開源模型在國內備受青睞,成為眾多科研機構和創業公司開發自己模型和產品的重要基礎。
除了阿里巴巴外,DeepSeek等中國企業也在AI領域取得了顯著進展。DeepSeek發布的DeepSeek-R1模型在性能上同樣表現出色,成為中國AI在全球舞臺上的又一重要力量。如今,阿里巴巴和DeepSeek已成為中國AI在全球競爭中激烈角逐的兩股領先力量。
在AI技術的應用方面,中國也取得了諸多突破。例如,中國科學院國家天文臺基于Qwen開源模型發布了新一代天文大模型“星語3.0”,為中國天文學研究提供了強有力的支持。同時,中國科學院地球化學研究所與阿里云基于Qwen開發了國際首個“月球科學多模態專業大模型”,為月球科學研究提供了新的視角和方法。
阿里巴巴的通義千問模型在AI for Science科研領域也備受歡迎。該模型已服務300多家科研院所和高校,為科學研究提供了強有力的支持。這一成就不僅彰顯了阿里巴巴在AI技術上的領先地位,也為中國科研事業的發展做出了重要貢獻。
展望未來,隨著AI技術的不斷發展和應用領域的不斷拓展,中美兩國在AI領域的競爭將更加激烈。然而,無論競爭結果如何,中國AI技術的快速進步和全球影響力的不斷提升已成為不爭的事實。在這一背景下,我們有理由相信,中國AI將在未來發揮更加重要的作用,為人類社會的進步和發展做出更大的貢獻。