阿里國(guó)際最新研發(fā)的翻譯大模型Marco今日正式上線,支持包括中文、英文、日文、韓文、西班牙文、法文等在內(nèi)的15種全球主流語(yǔ)種。據(jù)官方介紹,基于廣泛使用的開源評(píng)測(cè)數(shù)據(jù)集Flores,Marco在BLEU自動(dòng)評(píng)測(cè)指標(biāo)上表現(xiàn)出色,超越了市面上的標(biāo)桿翻譯產(chǎn)品,如Google翻譯、DeepL、GPT-4等。
“你的寶貝正在路上”將不再被直譯為“Your baby is on the way”。以網(wǎng)絡(luò)用語(yǔ)“尊嘟喜歡”為例,部分AI翻譯產(chǎn)品會(huì)將其譯為“Zundu likes it”,而Marco則能更地道地翻譯為“I really like it”。
Marco通過(guò)多語(yǔ)言的數(shù)據(jù)篩選技術(shù),如多語(yǔ)種混合語(yǔ)料甄別、多維度數(shù)據(jù)質(zhì)量評(píng)估,獲取了高質(zhì)量、大規(guī)模的多語(yǔ)言數(shù)據(jù)。再結(jié)合多語(yǔ)言的混合專家、參數(shù)擴(kuò)張方法,在主導(dǎo)語(yǔ)言(如中、英)性能不下降的情況下,提升了其他語(yǔ)種的質(zhì)量。
對(duì)于個(gè)人用戶而言,Marco不僅能夠提供高質(zhì)量的翻譯和良好的可讀性,還支持不同的翻譯風(fēng)格,以滿足多樣化的翻譯需求。無(wú)論是日常交流還是專業(yè)學(xué)習(xí),Marco都能成為用戶的得力助手。