国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

AI語言模型上演“狼人殺”,誰才是推理之王?

   時間:2025-03-08 18:49 來源:ITBEAR作者:馮璃月

近日,國外知名科技媒體Tom's Hardware報道了一項別開生面的AI實驗。開發(fā)者Guzus創(chuàng)新性地搭建了一個平臺,讓多個AI語言模型在同一空間內(nèi)展開經(jīng)典的社交推理游戲“Mafia”,也就是人們熟知的“天黑請閉眼”或“狼人殺”的前身。

在這個平臺上,不僅每局游戲的勝負一目了然,連對話記錄也詳盡無遺。更有趣的是,Guzus還設(shè)計了一個排名系統(tǒng),根據(jù)AI們在游戲中的表現(xiàn),評選出最擅長扮演各種角色的模型。

“Mafia”的游戲規(guī)則簡單明了:一群村民中隱藏著兩名Mafia成員和一名醫(yī)生。白天,村民們需要通過推理和投票找出Mafia;夜晚,醫(yī)生可以保護一名村民,而Mafia則暗殺一人。若Mafia被全部找出,村民獲勝;反之,若所有無辜村民被殺,Mafia則取得勝利。

當(dāng)這些AI模型被置于這樣的游戲規(guī)則之下,一場場充滿戲劇性的社交博弈隨即上演。在一場游戲中,AI們開始自我介紹并討論是否公開身份,然而Gryphe / Mythomax-l2-13b模型卻突然“自爆”,直接承認自己是Mafia的一員,并透露了自己的目標(biāo)。

這一舉動立即引起了其他AI的警覺,Claude-3.7-sonnet模型迅速指出,這要么是真實身份的暴露,要么就是一種前所未有的奇怪策略。

然而,劇情并未就此結(jié)束。當(dāng)Mythomax被淘汰后,它居然“拖下水”了自己的隊友Hermes-3-llama-3-1-405b,直接指認對方是自己的同伙。Mythomax試圖用夸張的“團結(jié)宣言”來轉(zhuǎn)移注意力,但這場AI間的社交混戰(zhàn)已經(jīng)讓人捧腹大笑,盡管它們的推理能力顯然還有待提高。

在這場AI的“Mafia”大戰(zhàn)中,Claude 3.7 Sonnet模型無疑是最耀眼的明星。Anthropic的最新AI推理模型在扮演Mafia角色時勝率高達100%,即便作為村民,其勝率也遙遙領(lǐng)先其他對手,達到了45%。

Guzus透露,他計劃不久后開放該游戲的Github代碼倉庫,希望這一邏輯能被應(yīng)用于更多類型的游戲中。目前,該模擬并未在本地AI模型上運行,而是依賴于Openrouter API。但一旦代碼開放,項目有望改進為支持本地語言模型集群,前提是用戶的硬件能夠同時運行多個AI。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 四虎影院在线免费 | 欧美日本综合一区二区三区 | 精品视频一区在线观看 | 久久亚洲伊人成综合人影院 | 国产免费一区二区三区在线观看 | 亚洲精品影院 | 91精品乱码一区二区三区 | 亚洲视频日韩视频 | 丁香六月网| 国产亚洲欧美一区 | 男女免费高清在线爱做视频 | 欧美色伊人 | 日本视频三区 | 羞羞视频在线观看免费 | 国色天香社区在线观看免费直播 | 精品国产一区二区三区久久 | 在线观看国产精品入口 | 欧美一区亚洲二区 | 日本强在线播放一区 | 亚洲网站色 | 久久久久久人精品免费费看 | 婷婷综合在线观看丁香 | 在线观看日韩欧美 | 亚洲国产成人久久综合一区 | 激情五月婷婷综合网 | 欧美成人看片一区二区三区 | 国产成人亚洲综合一区 | 日韩极品视频 | 国产成人精品日本 | 九色在线视频观看 | 欧美在线免费播放 | 久久国内免费视频 | 在线激情网 | 日本精品一区二区三区在线视频 | 99久久精品无码一区二区毛片 | きみをペット波多野结衣 | 综合精品 | 亚洲一成人毛片 | 四虎影视最新网站在线播放 | 亚洲综合视频在线 | 亚洲一级片在线播放 |