近期,DeepSeek在全球范圍內的熱度持續攀升,引發廣泛關注。上海超算計算中心攜手上海昇騰人工智能創新中心,成功在其依托的昇騰硬件上部署了DeepSeek大模型,這一舉措為行業市場帶來了全方位的強大支持,依托于上海市人工智能公共算力服務平臺。
在模型部署方面,DeepSeek推出了兩款重量級模型——DeepSeek-R1-Distill-Qwen-32與Janus-Pro-7B。前者專注于復雜推理任務,通過先進的蒸餾技術,模型體積大幅縮減,同時保持了高質量的推理能力。其靈活性與適用性顯著增強,能夠以更加合理的資源占用,為自然語言處理、智能推薦系統等應用場景提供高效、精準的服務。這款模型能夠迅速應對各類復雜任務,充分滿足了不同行業對于復雜推理的嚴苛需求。
而Janus-Pro-7B作為DeepSeek推出的前沿多模態理解和生成模型,在圖像理解與生成方面展現出了卓越的性能。該模型采用了獨特的獨立編碼方法,直接利用文本到圖像數據進行訓練,并引入了合成美學數據,進一步提升了圖像生成的質量。無論是從文本生成圖像,還是理解圖片并生成精準描述,Janus-Pro-7B都能表現出色。盡管在圖像分辨率方面存在一定的局限,但在近景、特寫等特定場景下,其優勢尤為明顯。
在部署方式上,DeepSeek采用了區域本地化部署策略,充分利用本地服務器資源,不依賴云服務。這一舉措為企業提供了DeepSeek-R1和Janus-Pro兩款模型的接口調用服務,實現了開箱即用,極大地提高了企業的運營效率,并滿足了其個性化業務場景的需求。
上海市人工智能公共算力服務平臺作為貫徹落實國家戰略、加快實施“東數西算”工程、深化發展數字經濟的重要舉措,由上海超級計算中心負責建設和運營。該平臺致力于為廣大科研機構和中小企業提供具有公信力的普惠算力服務,全部采用昇騰AI軟硬件平臺,計算峰值能力高達100PFLOPS(FP16)。這一平臺的建立,為科研探索與產業創新領域提供了強大的算力底座與模型支持。