科大訊飛在線上隆重推出了訊飛星火4.0 Turbo的全新升級版,標(biāo)志著其在人工智能領(lǐng)域邁出了重要一步。此次升級不僅顯著增強(qiáng)了數(shù)學(xué)運算、行業(yè)知識理解、圖文識別以及長文本處理等多方面的能力,還首次引入了混域知識搜索技術(shù),直擊行業(yè)痛點,為企業(yè)帶來了前所未有的智能體驗。
科大訊飛通過與多個行業(yè)領(lǐng)軍企業(yè)的深度合作,使得訊飛星火4.0 Turbo在金融、油氣、能源、電力、鋼鐵及航空等關(guān)鍵領(lǐng)域的應(yīng)用效能實現(xiàn)了顯著提升,綜合能力提升幅度均超過10%,充分展示了其在推動產(chǎn)業(yè)智能化轉(zhuǎn)型方面的巨大潛力。
在當(dāng)前大模型市場趨于平緩,眾多公司減緩底座模型迭代速度的背景下,科大訊飛堅守初心,持續(xù)加大投入,訊飛星火4.0 Turbo的七大核心能力實現(xiàn)了全面提升。這一成果不僅彰顯了科大訊飛在AI領(lǐng)域的深厚積累與強(qiáng)大實力,更是對市場需求和行業(yè)痛點精準(zhǔn)把握的體現(xiàn)。
訊飛星火4.0 Turbo的升級,充分融合了行業(yè)龍頭企業(yè)的實際需求以及超過2億C端用戶的真實反饋,使得大模型能夠處理更長的文本、理解更復(fù)雜的圖文信息,并大幅減少了幻覺問題。這一改進(jìn)使得大模型在行業(yè)理解能力上邁上了新的臺階。
在數(shù)學(xué)能力方面,訊飛星火4.0 Turbo的進(jìn)步尤為顯著,提升幅度達(dá)到了10.5%。這一進(jìn)步不僅提升了模型在數(shù)學(xué)教育和金融分析等領(lǐng)域的應(yīng)用能力,更為科研工作的深入提供了強(qiáng)有力的支持。圖文識別能力的提升也是此次升級的一大亮點,通用文檔版面分析和文字識別的準(zhǔn)確率提高了40%,對于復(fù)雜表格結(jié)構(gòu)和潦草手寫文字的識別準(zhǔn)確率更是提升了60%。
發(fā)布會現(xiàn)場,科大訊飛的研究員通過生動的案例展示了訊飛星火4.0 Turbo的強(qiáng)大功能。在醫(yī)療領(lǐng)域,模型能夠準(zhǔn)確識別體檢報告中的復(fù)雜表格和手寫文字;在法律領(lǐng)域,法院文書、印章手寫合同等復(fù)雜文檔也能被迅速解析。無論是學(xué)術(shù)論文中的長表格,還是企業(yè)合同中的復(fù)雜版式,訊飛星火4.0 Turbo都能輕松應(yīng)對,展現(xiàn)出卓越的識別與處理能力。
訊飛星火4.0 Turbo的圖文識別能力不僅在國內(nèi)領(lǐng)先,還超越了國際最優(yōu)競品。模型還針對性地提升了文檔要素檢測能力,知識切分和構(gòu)建的粒度更加精細(xì)、準(zhǔn)確,有效防止了大模型幻覺問題的發(fā)生。同時,面向大規(guī)模掃描文檔解析的極速版本也同步發(fā)布,文檔理解速度提升了10倍以上,使得處理500頁項目文件的全過程僅需2分鐘即可完成。
在長文本處理方面,訊飛星火4.0 Turbo也實現(xiàn)了重大突破。模型采用了全新的長文本框架,并首發(fā)了句子級溯源功能。這一新框架優(yōu)化了超長注意力機(jī)制,并利用大規(guī)模網(wǎng)頁和書籍?dāng)?shù)據(jù)進(jìn)行知識關(guān)聯(lián)式合成,使得知識回復(fù)的錯誤率降低了40%,句子級知識溯源準(zhǔn)確率達(dá)90%,甚至超越了GPT-4的表現(xiàn)。這一改進(jìn)大幅緩解了問答搜索服務(wù)中因大模型幻覺而需要反復(fù)溯源確認(rèn)的問題。
科大訊飛在發(fā)布會上還展示了訊飛星火2024年的成績單。數(shù)據(jù)顯示,科大訊飛在去年的大模型招投標(biāo)中表現(xiàn)出色,中標(biāo)數(shù)量和中標(biāo)金額均位居第一,成為名副其實的“標(biāo)王”。在應(yīng)用類項目中,數(shù)字人與客服、知識問答與知識平臺、智能編程等應(yīng)用場景表現(xiàn)尤為突出。特別是在中標(biāo)金額方面,科大訊飛以絕對優(yōu)勢領(lǐng)先,超過了第二名到第六名的中標(biāo)金額之和,充分展示了其在市場中的強(qiáng)大競爭力和品牌影響力。
這份成績單的背后,是科大訊飛在多個行業(yè)的廣泛布局和深耕細(xì)作。公司在通信、金融、能源、教育、政務(wù)和醫(yī)療等領(lǐng)域均取得了顯著成果,主要客戶均為央國企等重量級單位。通過與客戶共同打磨近百個智能體應(yīng)用,科大訊飛積累了豐富的行業(yè)經(jīng)驗和數(shù)據(jù)資源。
基于圖文、長文本能力的提升和行業(yè)應(yīng)用能力的積累,科大訊飛在此次發(fā)布會上還首發(fā)了混域知識搜索技術(shù)。該技術(shù)能夠?qū)崿F(xiàn)對個人知識、企業(yè)知識、業(yè)務(wù)系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)信息的綜合搜索。用戶只需一次提問,即可獲得綜合搜索后的結(jié)果,大幅提升了信息搜索效率。
通過“技術(shù)+應(yīng)用”的不斷正向循環(huán),訊飛星火學(xué)習(xí)到了豐富的行業(yè)高價值知識。研發(fā)團(tuán)隊通過收集大量高質(zhì)量的行業(yè)數(shù)據(jù),自制高質(zhì)量數(shù)據(jù)集,不斷打磨出更加精準(zhǔn)、高效的行業(yè)大模型。基于此,訊飛星火4.0 Turbo在金融、油氣、能源、電力、鋼鐵、航司等多個關(guān)鍵領(lǐng)域均取得了顯著成果,成為了“最懂行業(yè)的大模型”。