国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

英偉達Blackwell DGX系統刷新DeepSeek推理性能世界紀錄

   時間:2025-03-19 08:53 來源:ITBEAR作者:沈瑾瑜

英偉達在NVIDIA GTC 2025大會上宣布,其最新推出的NVIDIA Blackwell DGX系統在DeepSeek-R1大模型推理性能上創造了世界紀錄。這一突破性進展標志著英偉達在人工智能推理技術上的又一次飛躍。

據悉,在單個搭載八塊Blackwell GPU的DGX系統上,DeepSeek-R1模型以6710億參數的滿血狀態運行,實現了每用戶每秒超過250 token的響應速度,系統整體吞吐量更是突破了每秒3萬token的大關。這一數據不僅彰顯了Blackwell GPU的強大性能,也展示了英偉達在優化大型語言模型推理方面的深厚實力。

英偉達強調,隨著Blackwell Ultra GPU和Blackwell GPU的不斷升級,NVIDIA平臺將繼續在推理性能上實現新的突破。這一承諾不僅體現在硬件上,還體現在軟件優化上。英偉達通過結合硬件和軟件的力量,自2025年1月以來,成功將DeepSeek-R1 671B模型的吞吐量提高了約36倍。

在會上,英偉達還展示了不同配置下的DGX系統性能。包括DGX B200(8塊GPU)和DGX H200(8塊GPU)在內的單節點配置,在采用TensorRT-LLM軟件的最新內部版本進行測試時,展現了出色的推理性能。測試參數包括輸入1024 token和輸出2048 token,并發性達到最大。在計算精度上,B200采用了FP4精度,而H200則采用了FP8精度。

英偉達還對比了Blackwell架構與Hopper架構在推理性能上的差異。結果顯示,Blackwell架構與TensorRT軟件相結合,可以顯著提升推理性能。在DeepSeek-R1、Llama 3.1 405B和Llama 3.3 70B等模型上,使用FP4精度的DGX B200平臺和DGX H200平臺相比,推理吞吐量提高了3倍以上。

英偉達還展示了不同數據集上DeepSeek-R1模型的精度表現。在FP4和FP8精度下,DeepSeek-R1模型在MMLUG、SM8K、AIME 2024、GPQA和DiamondMATH-500等數據集上的表現均十分出色。值得注意的是,在使用TensorRT Model Optimizer的FP4訓練后量化(PTQ)技術時,DeepSeek-R1模型在不同數據集上的精度損失微乎其微,這進一步證明了英偉達在量化技術上的領先地位。

英偉達表示,在對模型進行量化以利用低精度計算優勢時,確保精度損失最小化是生產部署的關鍵。通過不斷的技術創新和優化,英偉達將繼續為客戶提供更高效、更準確的AI推理解決方案。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 一区二区三区精品视频 | 四虎4hu永久免费视频大全 | 亚洲国产片| 久久国产精品久久久久久久久久 | 亚洲视频综合网 | 日韩欧美亚洲视频 | 欧美亚洲视频在线观看 | 欧美专区日韩专区 | 亚洲国产精品免费观看 | 自拍偷拍导航 | 自拍偷拍第一页 | 亚洲女人性视频 | 色月阁 | 亚洲国产午夜看片 | 亚洲国产中文字幕在线观看 | 亚洲欧美日韩高清 | 一区二区三区四区免费视频 | 欧美日韩视频在线 | 在线成人免费视频 | 羞羞视频免费网站男男 | 永久免费在线 | 亚洲视频在线观看网站 | 香蕉在线视频高清在线播放 | 综合成人| 日韩视频免费在线 | 伊人狠狠色丁香婷婷综合下载 | 国产欧美曰韩一区二区三区 | 欧美日韩亚洲国产 | 在线午夜视频 | 免费在线观看一区二区 | 亚洲视频国产 | 国内精品久久久久影院一蜜桃 | 伊人激情久久综合中文字幕 | 中文国产成人精品久久一 | 免费激情视频网站 | 两性视频网站 | 自拍偷拍一区 | 亚洲高清成人欧美动作片 | 在线欧美色 | 男男羞羞视频网站国产 | 国产成人亚洲精品大帝 |