近日,北京市商湯科技開發有限公司發布了一則重要通知,宣布其企業客戶與開發者能夠通過商湯大裝置萬象平臺迅速部署DeepSeek-V3、DeepSeek-R1等一系列先進模型。這些用戶還將享受到一項特別福利:在三個月內,他們將獲得高達1000萬tokens的免費使用權。
商湯大裝置此次的升級服務尤為引人注目。該公司依托其強大的技術平臺和專家資源,構建了一個從“場景定義”到“訓練”、“部署”再到“迭代”的全方位閉環服務體系。這一體系旨在更好地滿足企業客戶的多樣化需求。
對于追求輕量化模型定制的企業而言,商湯大裝置提供了基于場景強化學習的解決方案。這一方案能夠在特定場景下對基模型進行提升,并支持將其蒸餾到小模型中,從而實現高效推理。這無疑為企業帶來了更加靈活和高效的模型應用選擇。
對于有私有化需求的企業,商湯大裝置同樣提供了全面的綜合解決方案。該方案涵蓋了模型定制、模型開發平臺以及Agent應用開發平臺三大核心模塊,能夠適配多種國產化硬件,并提供從開發到部署的全鏈路支持。這為企業客戶在數據安全與自主可控方面提供了強有力的保障。
在部署方式上,商湯大裝置同樣展現出了極高的靈活性和兼容性。它支持公有云、私有化以及一體機等多種部署方式,能夠滿足不同企業的實際需求。在硬件層面,商湯大裝置兼容英偉達與國產異構芯片,通過軟硬件的深度協同優化,實現了多種芯片的高效混合部署和流量智能分發。
在推理層面,商湯大裝置支持多款主流推理引擎,并對緩存進行了針對性的加速優化。官方還計劃在未來推出PD(Prefill-Decode)分離式推理架構。這一架構將計算任務智能拆分,并分別調度至最適合的算力單元執行,從而進一步提升能效比。
商湯大裝置還支持包括商湯“日日新”融合大模型SenseNova、DeepSeek、Qwen、Llama等在內的多款大模型。這一舉措將為企業客戶提供更加豐富和多樣的模型選擇,助力他們在各自領域取得更加卓越的成績。