近日,據(jù)CNBC報道,中國人工智能初創(chuàng)公司DeepSeek發(fā)布了一項震撼業(yè)界的聲明,稱其新研發(fā)的人工智能模型性能可媲美OpenAI,但構(gòu)建成本卻僅為后者的一小部分。這一消息迅速在科技界引發(fā)軒然大波。
DeepSeek聲稱,其大型語言模型的訓(xùn)練成本僅為560萬美元,這一數(shù)字遠(yuǎn)低于科技巨頭在訓(xùn)練和運行高級AI工作負(fù)載上所需的高額計算基礎(chǔ)設(shè)施費用。這一斷言讓投資者對科技巨頭現(xiàn)有的投入產(chǎn)生了擔(dān)憂,進(jìn)而影響了市場表現(xiàn),例如英偉達(dá)市值在消息傳出后的首個交易日大幅下跌。
然而,并非所有人都對DeepSeek的聲明持樂觀態(tài)度。業(yè)內(nèi)專家對此反應(yīng)不一,有人對DeepSeek的技術(shù)突破表示贊賞,同時也有人對其聲明的真實性表示懷疑。CNBC就此事咨詢了多位業(yè)內(nèi)專家,以獲取對DeepSeek及其與OpenAI之間對比的深入見解。
DeepSeek由專注于人工智能的量化對沖基金High-Flyer的聯(lián)合創(chuàng)始人梁文鋒于2023年創(chuàng)立,公司致力于大型語言模型和通用人工智能(AGI)的研究。AGI作為一個概念,指的是人工智能在廣泛任務(wù)上能夠等同于或超越人類智力的水平。
DeepSeek最新發(fā)布的推理模型R1,可與OpenAI的同類產(chǎn)品相媲美。R1將提示分解為較小的部分,并在生成響應(yīng)前考慮多種方法,旨在以類似于人類的方式處理復(fù)雜問題。盡管R1背后的技術(shù)并非全新,但DeepSeek是首個將其部署到高性能AI模型中的公司,并據(jù)稱大大降低了功耗要求。
DeepSeek的V3和R1兩大系統(tǒng)引起了AI社區(qū)的廣泛關(guān)注。這兩個模型均為開源,意味著它們的底層代碼可免費獲取,并可公開供其他開發(fā)人員定制和重新分發(fā)。在性能方面,DeepSeek表示R1在推理任務(wù)上實現(xiàn)了與OpenAI同類產(chǎn)品的相當(dāng)性能,并引用了多項基準(zhǔn)測試結(jié)果作為證明。
盡管DeepSeek聲稱其訓(xùn)練成本遠(yuǎn)低于競爭對手,但關(guān)于其運行成本的具體數(shù)字尚不清楚。科技洞察公司The Futurum Group的首席執(zhí)行官丹尼爾·紐曼雖然認(rèn)為這些發(fā)展表明了一個巨大的突破,但他對DeepSeek所給出的具體數(shù)字表示懷疑。
咨詢公司DGA Group中國區(qū)高級副總裁兼技術(shù)政策負(fù)責(zé)人Paul Triolio指出,很難直接比較DeepSeek的模型成本與美國主要開發(fā)商的模型成本。他強(qiáng)調(diào),DeepSeek所給出的560萬美元數(shù)字僅代表一次訓(xùn)練運行的成本,而非開發(fā)該模型的總體研發(fā)成本。
在價格方面,DeepSeek和OpenAI均在其網(wǎng)站上披露了模型計算的定價。DeepSeek的R1模型在處理文本單元的成本上遠(yuǎn)低于OpenAI的同類產(chǎn)品,這使得DeepSeek在性價比方面具有一定優(yōu)勢。
然而,DeepSeek的聲明也引發(fā)了一些爭議。特別是在美國限制向中國出口先進(jìn)AI芯片的背景下,DeepSeek聲稱其模型是在使用成熟的Nvidia芯片上取得的突破,這引發(fā)了關(guān)于其是否使用了被禁芯片的質(zhì)疑。盡管Nvidia隨后表示DeepSeek使用的GPU完全符合出口要求,但這一爭議仍未平息。
業(yè)內(nèi)專家對DeepSeek所取得的成就普遍表示印象深刻,但一些人對這家中國公司的部分說法表示懷疑。例如,Oculus和Anduril的創(chuàng)始人帕爾默·盧基在社交媒體上表示,他認(rèn)為DeepSeek所給出的500萬美元成本數(shù)字是假的,并指責(zé)該公司試圖減緩對美國人工智能初創(chuàng)企業(yè)的投資。
盡管如此,仍有一些人對DeepSeek持樂觀態(tài)度。總部位于倫敦的初創(chuàng)公司NetMind的首席商務(wù)官Seena Rejal表示,他沒有理由不相信DeepSeek的聲明。他認(rèn)為,即使存在一定的誤差,DeepSeek的效率仍然很高,并且其解釋的邏輯非常合理。
人工智能的商品化趨勢日益明顯,DeepSeek的成功被廣泛認(rèn)為是該行業(yè)積極發(fā)展的一個標(biāo)志。meta首席人工智能科學(xué)家Yann LeCun表示,DeepSeek的成功代表了開源AI模型的勝利,而不一定代表中國戰(zhàn)勝美國。他認(rèn)為,DeepSeek受益于開放研究和開源項目,如meta的PyTorch和Llama等。
“對于那些看到DeepSeek的表現(xiàn)并認(rèn)為‘中國在人工智能領(lǐng)域正在超越美國’的人來說,你們理解錯了。”LeCun在LinkedIn上的一篇帖子中寫道,“正確的理解是:開源模型正在超越專有模型。DeepSeek受益于開放研究和開源項目,他們提出了新的想法,并在其他人的工作基礎(chǔ)上構(gòu)建了這些想法。由于他們的工作已發(fā)表并開源,因此每個人都可以從中受益。這就是開放研究和開源的力量。”