国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

Meta發(fā)布Llama 4系列AI,混合專家架構(gòu)能否助其效率飆升?

   時間:2025-04-06 06:00 來源:ITBEAR作者:柳晴雪

meta近期推出了其最新的Llama 4系列AI模型,這一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。據(jù)meta透露,這些模型均經(jīng)過了龐大的未標注文本、圖像和視頻數(shù)據(jù)的訓練,旨在賦予它們廣泛的視覺理解能力。

目前,meta已將Scout和Maverick兩款模型上架至Hugging Face平臺。而Behemoth模型仍在緊鑼密鼓的訓練中。Scout模型能夠在單個英偉達H100 GPU上運行,而Maverick則需要更高配置的英偉達H100 DGX AI平臺或性能相當?shù)脑O(shè)備。

值得注意的是,Llama 4系列是meta首次采用混合專家(MoE)架構(gòu)的模型。這種架構(gòu)通過將數(shù)據(jù)處理任務分解為多個子任務,再將這些子任務分配給更小的、專門化的“專家”模型,從而在訓練和回答用戶查詢時展現(xiàn)出更高的效率。例如,Maverick模型擁有4000億個參數(shù),但在128個“專家”模型中,只有170億個參數(shù)處于活躍狀態(tài)。

相比之下,Scout模型擁有170億個活躍參數(shù),分布在16個“專家”模型中,總參數(shù)數(shù)為1090億個。盡管Llama 4系列模型在性能上有所提升,但它們并非像OpenAI的o1和o3-mini那樣的“推理模型”。推理模型會對答案進行事實核查,通常能更可靠地回答問題,但響應時間相對較長。

meta內(nèi)部測試顯示,Maverick模型在通用AI助手和聊天等應用場景中表現(xiàn)出色,尤其在創(chuàng)意寫作、代碼生成、翻譯、推理、長文本上下文總結(jié)和圖像基準測試等方面,其性能超過了OpenAI的GPT-4和谷歌的Gemini 2.0等模型。然而,與谷歌的Gemini 2.5 Pro、Anthropic的Claude 3.7 Sonnet和OpenAI的GPT-4.5等更強大的最新模型相比,Maverick仍有一定的提升空間。

Scout模型則擅長總結(jié)文檔和基于大型代碼庫進行推理。該模型支持處理1000萬個詞元,這意味著它一次能夠處理數(shù)百萬字的文本。meta還預告了其Behemoth模型。據(jù)透露,Behemoth擁有2880億個活躍參數(shù),分布在16個“專家”模型中,總參數(shù)數(shù)接近2萬億個。meta內(nèi)部基準測試顯示,在一些衡量解決數(shù)學問題等科學、技術(shù)、工程和數(shù)學(STEM)技能的評估中,Behemoth的表現(xiàn)優(yōu)于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro,但略遜于Gemini 2.5 Pro。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 爱爱爱视频网站 | 亚洲永久免费 | 自拍偷拍亚洲图片 | 伊人伊人影院 | 永久免费视频v片www | 欧美午夜性视频 | 日韩免费精品视频 | 四虎永久免费在线观看 | 日本精品一区二区三区在线视频 | 日韩欧美在线免费观看 | 亚洲第一视频在线观看 | 亚洲欧美色一区二区三区 | 麻豆传煤入口麻豆公司传媒 | 欧美日韩在线视频观看 | 五月天丁香婷婷开心激情五月 | 亚欧成人中文字幕一区 | 中文字幕电影资源网站大全 | 婷婷六月综合网 | 亚洲人成影院77777 | 日本高清视频一区二区三区 | 羞羞视频网 | 羞羞草影院| 五月婷婷六月丁香 | 亚欧精品一区二区三区 | 国内精品 大秀视频 日韩精品 | 欧美日韩精品一区二区视频在线观看 | a级午夜 | 狠狠丁香激情久久综合 | 国内精品区一区二区三 | 嫩草影院黄 | 亚洲国产欧美日韩一区二区三区 | 亚洲精品福利在线观看 | 亚洲精品午夜视频 | 麻豆国产精品视频 | 久久99精品久久久久久首页 | 国产一二三四区在线观看 | 日韩一级精品久久久久 | 色月阁| 九九电视剧免费观看完整版 | 欧美日韩一区二区在线观看视频 | 一区二区三区欧美日韩 |