近期,DeepSeek R1在全國范圍內(nèi)迅速走紅,從智能手機(jī)應(yīng)用到新能源汽車,眾多產(chǎn)品紛紛接入這一技術(shù)。對于內(nèi)容編輯而言,DeepSeek R1無疑是一個強(qiáng)大的助手,從大綱制定到內(nèi)容審閱,都能大幅提升工作效率。然而,官方滿血版的DeepSeek R1雖然功能強(qiáng)大,但頻繁掉線的問題讓人頭疼,平均每小時僅能穩(wěn)定使用一次。第三方滿血版雖然掉線較少,但用戶對于上傳隱私或保密數(shù)據(jù)至云端仍心存顧慮。
鑒于上述情況,不少用戶開始考慮自行搭建DeepSeek R1。然而,滿血版DeepSeek R1模型體積龐大,達(dá)到了404GB,遠(yuǎn)遠(yuǎn)超出了普通消費(fèi)級顯卡的顯存容量。即便是32B的蒸餾模型,也需要20GB的顯存空間。這對顯卡性能提出了極高的要求,例如,擁有32GB顯存的英偉達(dá)RTX 5090 D公版顯卡,官方售價高達(dá)16999元,而實(shí)際購買成本往往還要高出萬元。
面對高昂的硬件成本,用戶開始探索經(jīng)濟(jì)實(shí)惠且高效的解決方案。多顯卡協(xié)同工作成為了一個不錯的選擇,但AMD新顯卡已不再支持交火,英偉達(dá)SLI技術(shù)也不支持顯存疊加。幸運(yùn)的是,Intel的Arc顯卡不僅支持交火,而且顯存可以疊加,價格也相對親民。兩張Arc A770 16GB顯卡的價格大約在3600元左右,即可獲得32GB的顯存。本次測試選擇了兩張藍(lán)戟Intel Arc A770 Photon 16G OC顯卡進(jìn)行交火,以部署DeepSeek R1的32B蒸餾模型。
藍(lán)戟Intel Arc A770顯卡分為8GB和16GB兩個版本,本次選擇的16GB版本配備了GDDR6顯存,顯存帶寬高達(dá)512GB/s,擁有32個Xe核心,最高頻率可達(dá)2400Mhz。由于采用雙卡方案,主板和電源的配置也需特別注意。主板需至少具備兩個PCIe顯卡插槽,且每個插槽需支持PCIe 4.0 x8傳輸速率。電源方面,單張藍(lán)戟Intel Arc A770 Photon 16G OC的TBP為285W,兩張顯卡總功耗接近600W。因此,選擇了海韻1300W電源進(jìn)行測試,該電源不僅能滿足功率需求,還能提供兩張顯卡所需的4個PCIe 8Pin接口。模型部署方面,選擇使用IPEX-LLM工具在Linux系統(tǒng)上運(yùn)行,相比Windows系統(tǒng),Linux系統(tǒng)的運(yùn)行效率更高。
搭建完成后,通過另一臺電腦在局域網(wǎng)內(nèi)訪問后端進(jìn)行測試。在測試過程中,盡量避免對測試電腦進(jìn)行截圖或錄屏操作,以減少對GPU資源的占用。
在性能與效果方面,本次測試使用了32B模型,要求模型編寫一個包含特定功能的HTML貪吃蛇游戲。模型迅速生成了代碼,兩張Arc A770顯卡的風(fēng)扇全力運(yùn)轉(zhuǎn),后端顯示平均生成吞吐量穩(wěn)定在26 tokens/s以上。相比之下,單張RTX 5090 D運(yùn)行32B模型的性能約為46 tokens/s,而本次測試以不到兩成的價格獲得了五成以上的性能,表現(xiàn)令人驚喜。
生成的HTML貪吃蛇游戲可以直接預(yù)覽運(yùn)行,但在實(shí)際操作中發(fā)現(xiàn),使用上下方向鍵會滾動網(wǎng)頁,影響了游戲體驗(yàn)。因此,要求模型對代碼進(jìn)行修改,用A、S、D、W鍵代替方向鍵。DeepSeek R1準(zhǔn)確理解了需求,并成功完成了修改。隨后,又要求生成更為復(fù)雜的俄羅斯方塊HTML代碼,雖然參數(shù)量僅為32B,但DeepSeek R1生成的游戲幾乎無Bug,表現(xiàn)同樣出色。
在邏輯能力測試方面,選擇了兩個問題對雙A770搭建的DeepSeek R1進(jìn)行測試。對于“神父去世是離職還是升職?”這一令人一愣的問題,32B的DeepSeek R1能從現(xiàn)實(shí)與信仰兩種角度出發(fā)給出分析與解釋,展現(xiàn)出強(qiáng)大的邏輯能力。而對于“變形金剛應(yīng)該交車險(xiǎn)還是人險(xiǎn)?”這一二選一的提問,DeepSeek R1并沒有死板地做出選擇,而是理解了變形金剛不同形態(tài)的特征,給出了兩種保險(xiǎn)都買的絕佳答案。