阿里巴巴(中國)有限公司近日宣布了一項重要更新,其旗下的阿里云PAI Model Gallery平臺現已全面支持DeepSeek-V3、DeepSeek-R1以及所有經過蒸餾的小參數模型(DeepSeek-R1-Distill)的一鍵部署功能。
Model Gallery作為阿里云PAI人工智能平臺的核心組件,一直致力于整合全球AI開源社區中的優質預訓練模型。這一平臺涵蓋了LLM、AIGC、計算機視覺(CV)、自然語言處理(NLP)等多個領域,為用戶提供了豐富的模型選擇。
為了方便用戶快速部署所需模型,阿里云PAI提供了詳細的操作步驟。用戶首先需要登錄PAI控制臺,并根據實際需求選擇相應的地域。隨后,在工作空間列表中選定目標工作空間,進入快速開始模塊下的Model Gallery頁面。
在Model Gallery的模型列表中,用戶可以輕松找到并點擊自己感興趣的模型卡片,例如“DeepSeek-R1-Distill-Qwen-7B”。點擊后,系統將跳轉至該模型的詳情頁面,為用戶提供更多關于模型的信息。
部署過程同樣簡便快捷。用戶只需在模型詳情頁面右上角點擊“部署”按鈕,即可根據模型類型選擇合適的部署方式。目前,DeepSeek-R1支持vLLM加速部署,而DeepSeek-V3則支持vLLM加速部署和Web應用部署。對于DeepSeek-R1的蒸餾小模型,用戶還可以選擇使用阿里云PAI自研的高性能推理框架BladeLLM和vLLM進行加速部署。選定部署方式和資源后,系統將一鍵完成部署,并生成一個PAI-EAS服務。
部署成功后,用戶可以在服務頁面查看并獲取調用的Endpoint和Token。為了更方便地使用推理服務,用戶還可以點擊“查看調用信息”鏈接,返回模型介紹頁面查看詳細的調用方式說明。這一功能極大地提升了用戶的操作便捷性和模型應用效率。