国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

微軟開源OmniParser,GPT-4V秒解析屏幕截圖,智能新突破!

   時間:2024-10-29 10:38 來源:ITBEAR作者:楊凌霄

微軟近日宣布了一項重大開源項目——OmniParser,這是一款專為解析和識別屏幕上可交互圖標設計的AI工具。傳統自動化方法受限于HTML或視圖層次結構,而現有的視覺語言模型在處理復雜GUI元素時又顯得力不從心。為此,微軟推出了這款純視覺基礎的工具,旨在解決當前屏幕解析技術的局限性。

OmniParser結合了可交互區域檢測模型、圖標描述模型和OCR模塊,無需依賴HTML標簽或視圖層次結構等顯式基礎數據。這一特性使得它能夠在桌面、移動設備和網頁等多種平臺上跨平臺工作,顯著提高了用戶界面的解析準確性。OmniParser還能將識別出的屏幕元素轉換成結構化的數據。

在實際測試中,OmniParser展現出了卓越的性能。在ScreenSpot數據集中,它的準確率提高了73%,遠超依賴HTML解析的模型。同時,當GPT-4V使用OmniParser的輸出后,圖標的正確標記率從70.5%提升至93.8%。這些改進充分證明了OmniParser在解決當前GUI交互模型根本缺陷方面的有效性。

微軟已在Hugging Face上發布了OmniParser,這一舉措將有助于普及這一前沿技術,進一步推動多模態AI的發展,特別是在無障礙、自動化和智能用戶輔助等領域。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 亚洲最新中文字幕 | 波多野结衣网站 | 国产羞羞羞视频在线观看 | 国产乱理 | 国产黄视频在线观看 | 婷婷丁香在线视频 | 国产精品久久久久久搜索 | 亚洲欧美日韩视频一区 | 四虎最新网址入口 | 久久精品视频免费播放 | 欧美专区在线视频 | 毛片免费播放无需下载 | 亚洲不卡av不卡一区二区 | 亚洲一区欧美 | 在线视频网站www色 亚洲女人在线 | 婷婷四房综合激情五月性色 | 国产一区免费在线观看 | 久99频这里只精品23热 视频 | 亚洲电影免费在线看精品国产 | 激情六月丁香婷婷四房播 | 日本欧美在线观看 | 亚洲欧美综合久久 | 永久免费在线观看视频 | 国色天香论坛视频高清在线 | 最近免费最新高清中文字幕韩国 | 欧美一级久久 | 欧美精品专区免费观看 | 中文字幕一视频97色伦 | 一区二区国产精品 | 欧美成人生活最新国产网址 | 久久婷婷五夜综合色频 | 五月综合激情 | 免费羞羞视频网站 | 国色天香一区三区四区小说 | 亚洲福利视频一区二区 | 五月天丁香婷婷综合 | 五月天欧美激情午夜情 | 日韩专区在线 | 精品中文字幕乱码一区二区 | 日韩在线视频在线 | 亚洲毛片免费看 |