国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

OpenAI用Reddit數據測AI說服力,擔憂太強反成隱患

   時間:2025-02-03 10:05 來源:ITBEAR作者:任飛揚

近期,OpenAI在其最新推出的“推理”模型o3-mini的系統文檔中,揭示了一個引人注目的測試細節:該公司利用Reddit的子論壇r/ChangeMyView來評估其AI模型的說服力。r/ChangeMyView是一個匯聚了數百萬用戶的Reddit社區,用戶在這里發布個人觀點,并期待通過交流探討來拓寬視野,接納不同的見解。其他用戶則積極回應,運用有說服力的論據,試圖轉變原帖作者的觀點。

對于OpenAI等科技巨頭而言,r/ChangeMyView等Reddit社區無疑是高質量人類生成數據的寶庫,為AI模型的訓練提供了寶貴的資源。OpenAI透露,他們從r/ChangeMyView中收集用戶帖子,并要求AI模型在封閉的測試環境中撰寫回復,旨在改變Reddit用戶對某一話題的看法。隨后,這些AI生成的回復會被展示給測試者進行評估,并與人類回復進行對比,以此衡量AI模型的說服力。

盡管OpenAI與Reddit已經簽署了內容授權協議,允許其使用Reddit用戶帖子進行訓練并在其產品中展示,但此次基于r/ChangeMyView的評估并不受該協議約束。關于OpenAI如何獲取r/ChangeMyView的數據,目前尚不清楚,且該公司表示暫時沒有向公眾公布這一評估結果的計劃。

值得注意的是,Reddit近年來與多家AI公司達成了數據授權合作,但同時也曾公開譴責部分AI公司未經許可抓取其內容。Reddit首席執行官史蒂夫·霍夫曼去年曾指出,微軟、Anthropic和Perplexity等公司拒絕與其進行談判,并表示阻止這些公司抓取數據“十分棘手”。OpenAI也因被指控未經授權抓取《紐約時報》等網站內容以訓練ChatGPT及其底層AI模型而卷入多起法律糾紛。

在r/ChangeMyView基準測試中,o3-mini的表現并未明顯超越o1或GPT-4o。然而,OpenAI的最新AI模型在說服力方面似乎已經超越了r/ChangeMyView社區中的大多數用戶。OpenAI在o3-mini的系統文檔中提及:“GPT-4o、o3-mini和o1均展現出了強大的說服性論證能力,達到了人類前80%-90%的水平。目前,我們尚未發現模型的表現遠超人類或具備明顯的超人類能力。”

OpenAI的目標并非開發出具有極致說服力的AI模型,而是確保AI模型的說服力保持在合理范圍內。隨著推理模型在說服和欺騙方面的能力日益增強,OpenAI已經研發出新的評估方法和保障措施來應對這一挑戰。OpenAI擔憂,如果AI模型過于擅長說服人類用戶,可能會帶來潛在的風險。理論上,這可能導致高級AI按照自己的意愿或其控制者的意愿行動,而不一定符合人類的整體利益。

盡管OpenAI已經抓取了大量公共互聯網數據,并通過授權獲取了其他數據,但r/ChangeMyView基準測試表明,AI模型開發者仍在不懈尋找高質量數據集來測試其模型。然而,獲取這些數據并非易事,需要克服諸多挑戰。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 久久一区二区三区免费播放 | 精品综合在线 | 伊人国产在线 | a级免费看 | 亚洲精品美女在线观看 | 亚洲免费网址 | 国产黄色网 | 亚洲国产精品乱码一区二区三区 | 自拍偷拍亚洲第一页 | 丁香婷婷在线观看 | 中文字幕久热精品视频免费 | 每日影院 | 久久高清免费视频 | 羞羞网站免费观看 | 自拍三区播 | 黄色影音| 亚洲69视频 | 精品国产综合区久久久久久 | 久久一区二区三区免费播放 | 亚洲最大的黄色 | 欧美日韩亚洲国产一区二区三区 | 中文字幕在线精品不卡 | 欧美精品99久久久久久人 | 中文字幕国产精品 | 亚洲精品国产成人专区 | 在线观看欧美精品 | 色五月激情五月 | 国产视频网站在线观看 | 亚洲天堂成人在线 | 亚洲 欧洲 另类 综合 自拍 | 久久精品免费 | 中文字幕第一页在线视频 | 综合精品在线 | 欧美 日韩 成人 | 欧美日韩亚洲视频 | 久久久一本精品99久久精品66 | 亚洲国产天堂久久综合2261144 | 在线观看网址你懂的 | 国产噜噜噜视频在线观看 | 最近在线观看免费完整视频 | 精品国产高清久久久久久小说 |