騰訊研究院近期揭曉了一項(xiàng)創(chuàng)新成果——DRT-o1系列模型,該模型憑借獨(dú)特的長(zhǎng)思維鏈(CoT)技術(shù),在文學(xué)作品翻譯領(lǐng)域取得了突破性進(jìn)展,特別是針對(duì)比喻和隱喻等復(fù)雜修辭的處理,顯著提升了翻譯質(zhì)量。
在神經(jīng)機(jī)器翻譯(NMT)技術(shù)日益成熟的背景下,日常文本的翻譯效率與質(zhì)量均已達(dá)到較高水準(zhǔn)。然而,文學(xué)作品,特別是富含比喻和明喻修辭的文本,仍然是翻譯領(lǐng)域的一大難題。這些修辭往往承載著深厚的文化內(nèi)涵和語境信息,簡(jiǎn)單的直譯難以精準(zhǔn)傳達(dá)其深層含義。騰訊的DRT-o1系統(tǒng)正是為解決這一挑戰(zhàn)而生。
為了訓(xùn)練這一模型,研究人員精心挑選了古騰堡計(jì)劃中的400本公共領(lǐng)域英文書籍,并從中提取了577,600個(gè)句子。經(jīng)過嚴(yán)格篩選,最終確定了63,000個(gè)包含比喻和隱喻的句子作為訓(xùn)練素材。這些句子被用于引導(dǎo)模型進(jìn)行深度思考,從而提升其理解和翻譯復(fù)雜修辭的能力。
DRT-o1模型采用了創(chuàng)新的多智能體框架,包括翻譯員、顧問和評(píng)估員三個(gè)角色。翻譯員負(fù)責(zé)初步翻譯,顧問則提供修改建議,評(píng)估員則根據(jù)預(yù)設(shè)的評(píng)分標(biāo)準(zhǔn)對(duì)翻譯質(zhì)量進(jìn)行客觀評(píng)價(jià)。這一流程通過反復(fù)迭代,不斷優(yōu)化翻譯結(jié)果,直至達(dá)到預(yù)設(shè)的評(píng)分閾值或迭代次數(shù)上限。
在具體的工作流程中,模型首先識(shí)別句子中的關(guān)鍵詞并進(jìn)行翻譯,然后基于源句子和關(guān)鍵詞的雙語對(duì)應(yīng)關(guān)系,生成初步的翻譯結(jié)果。接著,顧問對(duì)初步翻譯進(jìn)行評(píng)估,并提供反饋意見。評(píng)估員則根據(jù)預(yù)定義的評(píng)分標(biāo)準(zhǔn),對(duì)翻譯的整體質(zhì)量進(jìn)行打分。翻譯員根據(jù)反饋和評(píng)分,再次提供新的翻譯。這一過程循環(huán)往復(fù),直至翻譯質(zhì)量達(dá)到最佳。
最終,經(jīng)過深度思考的翻譯結(jié)果會(huì)由GPT-4o進(jìn)行進(jìn)一步的潤(rùn)色,以確保其流暢性和可讀性。這一流程產(chǎn)生的數(shù)據(jù)集包含了22,264個(gè)高質(zhì)量的機(jī)器翻譯樣本。
在騰訊研究院提供的示例中,原文“The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.”中的“struck her all of a heap”是一個(gè)成語,表示某事產(chǎn)生了強(qiáng)烈的影響。DRT-o1模型通過長(zhǎng)思維鏈過程,將其翻譯為“母親將雙腳搭在凳子上,似乎在努力探究那個(gè)答案,那答案中女性特有的深刻性令她猛然心生震撼?!边@一翻譯不僅準(zhǔn)確傳達(dá)了原文的意思,還保留了原文的情感色彩。
相比之下,谷歌翻譯的版本為“母親雙腳撐在凳子上,似乎想弄清楚這個(gè)答案的真相,其女性的深刻性讓她大吃一驚?!倍鳧eepl的翻譯則是“母親把腳支在凳子上,似乎想弄清這個(gè)答案的來龍去脈,而這個(gè)答案的女性化深刻性讓她茅塞頓開?!彪m然這兩個(gè)版本也基本傳達(dá)了原文的意思,但在情感表達(dá)和細(xì)膩程度上,DRT-o1的翻譯顯然更勝一籌。
在性能表現(xiàn)方面,DRT-o1系列推出了DRT-o1-7B和DRT-o1-14B兩個(gè)規(guī)模版本。實(shí)驗(yàn)結(jié)果顯示,與Qwen2.5-7B-Instruct相比,DRT-o1-7B在BLEU分?jǐn)?shù)上提高了8.26分,CometScore提高了3.36分;與Qwen2.5-14B-Instruct相比,DRT-o1-14B的BLEU分?jǐn)?shù)提高了7.33分,CometScore提高了1.66分。DRT-o1-7B的性能甚至超過了更大的模型QwQ-32B,BLEU分?jǐn)?shù)高出7.82分,CometScore高出1.46分,充分展示了其在處理復(fù)雜語言結(jié)構(gòu)方面的卓越能力。
騰訊研究院的這一創(chuàng)新成果,不僅為文學(xué)作品翻譯領(lǐng)域帶來了新的希望,也為人工智能技術(shù)在語言處理領(lǐng)域的應(yīng)用開辟了新的方向。