国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

蘋果英偉達合作開源ReDrafter,LLM推理速度飆升2.7倍!

   時間:2024-12-19 08:07 來源:ITBEAR作者:趙云飛

蘋果公司近期宣布與英偉達攜手合作,共同推出了一項名為Recurrent Drafter(簡稱ReDrafter)的創新技術,這項技術旨在顯著提升人工智能大語言模型(LLM)的推理速度。這一消息是在12月18日通過蘋果公司的官方博文發布的。

據悉,ReDrafter技術已經成功融入英偉達的TensorRT-LLM推理加速框架中。這一整合使得在英偉達GPU上運行的LLM模型,每秒生成的tokens數量最高可提升2.7倍。這一顯著的性能提升,不僅有效減少了用戶在使用過程中的延遲感受,還大幅度降低了計算成本。

蘋果公司的機器學習專家強調,隨著LLM在生產應用程序中的廣泛應用,提高推理效率已經成為降低計算成本和減少用戶延遲的關鍵因素。ReDrafter技術的推出,正是對這一需求的積極響應。

ReDrafter的核心在于其獨特的RNN草稿模型,該模型結合了波束搜索(beam search)和動態樹注意力(dynamic tree attention)技術。這一創新設計使得開源模型在每一步生成過程中最多可以產生3.5個tokens,從而超越了以往推測性解碼技術的性能表現。

為了將ReDrafter技術應用于實際生產環境,蘋果公司與英偉達展開了深度合作。雙方共同努力,將ReDrafter成功集成到英偉達的TensorRT-LLM框架中。這一合作不僅展現了蘋果與英偉達在技術創新方面的深厚實力,也體現了雙方在推動AI技術發展方面的共同愿景。

為了支持ReDrafter技術的集成,英偉達對其TensorRT-LLM框架進行了多項優化。這包括添加新的運算符以及公開現有運算符,以增強框架對復雜模型和解碼方法的適應能力。這些優化措施為ReDrafter技術的順利應用提供了有力保障。

基準測試結果顯示,在使用集成了ReDrafter的TensorRT-LLM框架的英偉達GPU上,數百億參數規模的生產模型的解碼速度得到了顯著提升,最高可達2.7倍。這一成果不僅顯著降低了用戶體驗延遲,還減少了GPU的使用數量和功耗,從而進一步降低了運營成本。

這一合作成果的發布,標志著蘋果與英偉達在AI技術領域的合作邁出了重要一步。未來,雙方將繼續攜手共進,共同推動AI技術的創新與發展,為更多用戶提供更加高效、智能的服務。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 中文字幕国产亚洲 | 欧美性一区二区三区 | 亚洲五月六月丁香激情 | 亚洲自拍高清 | 羞羞视频免费看 | 九九电视剧免费观看完整版 | 狠狠se| 九九电视剧免费观看完整版 | 日本国产一区二区三区 | 亚洲美女福利视频 | 婷婷成人丁香五月综合激情 | 亚洲六月丁香色婷婷综合久久 | 男人的天堂精品国产一区 | 国产网站麻豆精品视频 | 中文字幕 自拍偷拍 | 五月天丁香色 | 亚洲免费成人在线 | 亚洲一区二区在线成人 | 狠狠狠色丁香婷婷综合久久俺 | 日韩欧美一及在线播放 | 波多野结衣3p | 亚洲人成电影 | 欧美靠逼视频 | 国内自拍区 | 香蕉视频在线观看男女 | 亚洲精品午夜在线观看 | 亚洲69 | 亚洲欧美在线综合一区二区三区 | 亚洲一区视频在线 | 福利视频第一区 | 亚洲精品男人天堂 | 在线国产中文字幕 | 欧美日韩一区二区视频图片 | 亚洲国产高清视频 | 欧美视频在线免费播放 | 国色天香社区视频高清在线 | 亚洲高清免费在线观看 | 久久免费视频播放 | 中文字幕亚洲 综合久久 | 亚洲视频免费 | 亚洲综合色站 |