国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

智譜技術開源CogAgent-9B模型,賦能AI智能體精準“解讀”GUI界面

   時間:2024-12-27 09:18 來源:ITBEAR作者:馮璃月

近日,智譜技術團隊在官方公眾號上宣布了一項重大進展,正式開源了名為CogAgent-9B-20241220的基座模型。這款模型是基于GLM-4V-9B進行訓練的,專為智能體(Agent)任務設計,具有極高的實用價值。

CogAgent-9B-20241220的最大特點是其獨特的輸入方式。與以往需要HTML等文本表征的模型不同,它僅需屏幕截圖作為輸入,便能根據用戶指定的任意任務,結合歷史操作,精準預測下一步的GUI(圖形用戶界面)操作。這一特性使得CogAgent能夠廣泛應用于個人電腦、手機、車機設備等基于GUI交互的各類場景。

相較于去年12月開源的第一版CogAgent模型,新版本在多個方面實現了顯著提升。在GUI感知、推理預測準確性、動作空間完善性、任務普適性和泛化性等方面,CogAgent-9B-20241220均展現出了卓越的性能。它還支持中英文雙語的屏幕截圖和語言交互,進一步拓寬了其應用范圍。

CogAgent的輸入簡潔明了,僅包含三部分:用戶的自然語言指令、已執行的歷史動作記錄和GUI截圖。無需任何文本形式表征的布局信息或附加元素標簽,這使得模型的輸入處理更加高效和便捷。

CogAgent的輸出則涵蓋了四個方面,包括思考過程、下一步動作的自然語言描述、下一步動作的結構化描述以及下一步動作的敏感性判斷。其中,思考過程部分顯式輸出了模型理解GUI截圖和決定下一步操作的思考過程,包括狀態和計劃兩部分,輸出內容可通過參數進行控制。自然語言形式的動作描述被加入歷史操作記錄,便于模型理解已執行的動作步驟。結構化描述則以類似函數調用的形式,描述了下一步操作及其參數,便于端側應用解析并執行。

在動作空間方面,CogAgent包含了GUI操作和擬人行為兩類。GUI操作是基礎動作,如左鍵單擊、文本輸入等;而擬人行為則是高級動作,如應用啟動、調用語言模型等。模型還對下一步動作的敏感性進行了判斷,將動作分為“一般操作”和“敏感操作”兩類,后者指可能帶來難以挽回后果的動作。

為了驗證CogAgent-9B-20241220的性能,智譜技術團隊在多個數據集上進行了測試,并與GPT-4o-20240806、Claude-3.5-Sonnet、Qwen2-VL、ShowUI、SeeClick等模型進行了比較。結果顯示,CogAgent在多個數據集上均取得了領先的結果,充分證明了其在GUI Agent領域的強大實力。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 国产精品久久亚洲一区二区 | 五月天激情啪啪 | 蓝导航福利视频 | 国产性一交一乱一伦一色一情 | 亚洲第一免费播放区 | 国产日产欧美一区二区三区 | 亚洲精品高清中文字幕完整版 | 亚洲成人国产 | 迪米电影网| 男女男精品视频免费观看 | 在线观看国产一区亚洲bd | 丁香婷婷激情 | 一区二区不卡久久精品 | 亚洲高清在线播放 | 亚洲第一视频在线观看 | 久久久高清国产999尤物 | 最近电影免费观看在线 | 成人丁香乱小说 | 亚洲国产天堂久久综合226 | 亚洲a成人网77777在线 | 欧美精彩狠狠色丁香婷婷 | 亚洲福利午夜 | 福利视频99| 国产大学生自拍视频 | 一级毛片直播 | 欧美日在线观看 | 亚洲午夜国产片在线观看 | 九月丁香婷婷亚洲综合色 | 色婷五月 | 国产伦精一区二区三区视频 | 亚洲四虎在线 | 亚洲情人| 亚洲国产欧美在线 | 亚洲综合久| 国产欧美精品区一区二区三区 | 日本在观线免费观看 | 在线观看男女爱视频网站 | 欧美日本高清视频在线观看 | 久久国产精品最新一区 | 国产成人一区二区三区精品久久 | 亚洲国产天堂久久九九九 |