近期,一款名為Operator的創(chuàng)新工具引起了廣泛關(guān)注。這款應(yīng)用能夠利用用戶的瀏覽器,自動執(zhí)行一系列繁瑣的在線任務(wù),從填寫各類表單到在線訂購雜貨,甚至制作個性化的表情包,無所不能。
Operator目前已向美國地區(qū)的Pro版訂閱用戶開放,用戶可通過訪問operator.chatgpt.com體驗其強大功能。據(jù)透露,Operator的服務(wù)范圍將逐步擴展至Plus、Team和Enterprise用戶,并有望在未來與ChatGPT深度融合,為用戶提供更為便捷、智能的使用體驗。
Operator的核心驅(qū)動力來自一個名為Computer-Using Agent(CUA)的新型模型。這一模型巧妙融合了GPT-4的視覺功能以及通過強化學習獲得的卓越推理能力,使其能夠輕松與圖形用戶界面(GUI)進行交互。GUI,即人們?nèi)粘T谄聊簧峡吹降母鞣N按鈕、菜單和文本字段,都是CUA的“操作舞臺”。
Operator的工作方式頗具創(chuàng)意。它能夠“看到”瀏覽器中的內(nèi)容,就像人們通過屏幕截圖獲取信息一樣。更重要的是,Operator還能“操作”這些內(nèi)容,利用鼠標和鍵盤允許的所有動作,在網(wǎng)絡(luò)上執(zhí)行各種任務(wù),而無需任何自定義API集成。這一特性使得Operator在自動化處理在線事務(wù)方面,展現(xiàn)出了前所未有的靈活性和高效性。