近期,據(jù)國外媒體報道,DeepSeek AI因其高效的訓(xùn)練效率而備受矚目。與Open AI的ChatGPT及其他機器學(xué)習(xí)平臺相比,DeepSeek AI在過去一周內(nèi)人氣急劇上升。
技術(shù)行業(yè)分析師Ben Thompson在其網(wǎng)站Stratechery上發(fā)布的報告中指出,DeepSeek AI的設(shè)計雖面臨諸多限制,但這些限制卻激發(fā)了機器學(xué)習(xí)計算能力上的創(chuàng)新。DeepSeek由一家位于中國的初創(chuàng)公司開發(fā),而該公司因貿(mào)易禁運無法獲取美國Nvidia公司生產(chǎn)的高質(zhì)量半導(dǎo)體芯片。面對這一困境,DeepSeek的開發(fā)團隊采用了多種人工智能優(yōu)化技術(shù),使得他們的機器學(xué)習(xí)平臺在性價比上實現(xiàn)了顯著提升。
據(jù)斯坦福大學(xué)2024年人工智能指數(shù)報告顯示,DeepSeek的開發(fā)團隊聲稱,其最新版本的AI訓(xùn)練成本僅為560萬美元,相比之下,ChatGPT 4的訓(xùn)練成本高達7800萬美元,而谷歌的Gemini Ultra更是達到了1.91億美元。這一數(shù)據(jù)無疑彰顯了DeepSeek在降低訓(xùn)練成本方面的顯著成就。
華盛頓大學(xué)圣路易斯分校的科學(xué)家和消費者也將從這一成本降低中受益。計算機科學(xué)與工程助理教授烏馬爾·伊克巴爾表示,他的實驗室在使用這些平臺時需要花費數(shù)萬美元,而中國初創(chuàng)公司的競爭有望降低這一價格。
Stratechery的文章中提到,DeepSeek降低訓(xùn)練成本的一個關(guān)鍵方法是蒸餾。他們利用像ChatGPT這樣的成熟生成式AI系統(tǒng)來“教導(dǎo)”自己的系統(tǒng)如何完成工作。McKelvey Engineering的博士生也嘗試了這種方法來改進大型語言模型,且無需額外的訓(xùn)練。
“要讓技術(shù)得到大規(guī)模采用,它們必須價格低廉。”伊克巴爾強調(diào),“這表明使用模型可以變得非常便宜。”他還表示,這將使得他們能夠進行更多大規(guī)模的實驗。
然而,伊克巴爾也指出了DeepSeek等人工智能平臺存在的潛在問題。他主要研究的課題是互聯(lián)網(wǎng)安全和隱私,他警告說,運行這些模型需要訪問大型硬件,而數(shù)據(jù)在傳輸?shù)皆贫说娜斯ぶ悄軝C器上時,用戶可能會失去對數(shù)據(jù)的控制。這是一個非常嚴重的問題。
伊克巴爾進一步指出,人工智能系統(tǒng)可以構(gòu)建龐大的監(jiān)控基礎(chǔ)設(shè)施,其中一些已經(jīng)以搜索引擎的形式存在,追蹤來自整個網(wǎng)絡(luò)的用戶數(shù)據(jù),以促進電子商務(wù)。所有這些數(shù)據(jù)都會被發(fā)送給不同的人工智能供應(yīng)商,他們可以利用這些信息來分析用戶、推斷興趣、監(jiān)視甚至影響用戶。
另一個令人擔(dān)憂的趨勢是人工智能語言模型越來越多地融入移動應(yīng)用。例如,人工智能在規(guī)劃假期方面的應(yīng)用越來越廣泛。當(dāng)人工智能使用各種應(yīng)用程序來完成這項任務(wù)時,如果存在惡意軟件,它就有可能從用戶那里收集更多的數(shù)據(jù)并操縱人工智能尋求的結(jié)果。
“當(dāng)這些技術(shù)具有巨大潛力時,它們會發(fā)展得非常快。”伊克巴爾說,“你需要在設(shè)計中埋設(shè)護欄和保護措施。而當(dāng)前的人工智能系統(tǒng)卻沒有做到這一點。”