科大訊飛近日宣布了一項重大技術進展,對其深度推理大模型星火X1進行了全面升級,并同步推出了一系列新品,其中包括備受矚目的星火一體機。
此次升級,星火X1的數學能力尤為引人注目,其表現已全面對標業界領先的DeepSeek R1和OpenAI的o1模型。科大訊飛表示,升級后的星火X1在數學答題效果上有了顯著提升,特別是在解決競賽級難題時,展現出了卓越的能力。星火X1在中小學數學作業的批改、輔導以及題目推薦等應用場景中,也顯現出了顯著的優勢。
為了驗證星火X1的升級效果,科大訊飛采用了涵蓋廣泛的測試集,其中包括2023/2024年各學段考試的真題、模擬題和競賽題,以及來自國際數學競賽AIME 2024/2025和MATH 500的英文測試集。
在星火X1的賦能下,科大訊飛的多個應用與產品也迎來了升級。其中,訊飛曉醫首次引入了星火醫療大模型X1,該模型在回答復雜醫療問題時,能夠逐步解釋循證過程,大幅降低了醫療幻覺問題,提高了醫療復雜場景推理的邏輯正確性、專業性和可解釋性。據悉,星火醫療大模型X1在診斷推薦、健康咨詢、檢查檢驗報告解讀等任務上的表現,均已超越了GPT-4o和DeepSeek R1。
訊飛曉醫與個人健康檔案的融合更加深入,能夠深度洞察用戶健康狀況并思考潛在需求,從而給出更加個性化、具體且實用的醫療建議。例如,在咨詢疾病用藥時,訊飛曉醫能夠循證指出正確的用藥原則,并結合個人健康狀況,給出更詳盡的處理意見和注意事項。
面向教育領域的星火教師助手也迎來了全面升級。基于星火X1的升級,星火教師助手在備課和授課過程中,能夠給出更清晰、更詳實的AI教學思路。在備課時,星火教師助手能夠結合教師意圖,明確教學的重難點和目標,并在教學設計生成過程中逐步說明,便于教師理解生成內容的邏輯性,激發創新靈感。
在授課過程中,星火教師助手通過思維鏈顯性化呈現,讓師生能夠實時觀測認知思維的構建過程,使課堂互動更加直觀,更易于開展探究式學習。目前,這些能力已在數學、語文、歷史等多個學科上得到了應用,有助于教學創新和學生高階思維能力的培養。
在法律領域,科大訊飛也推出了升級版的AI法官助理。該助理將星火長思維鏈深度推理技術、法律法規和司法解釋等專業知識以及法律專家思維鏈深度融合,不僅解決了傳統大模型存在的知識幻覺問題,還提升了證據審查、量刑輔助、裁判觀點總結等復雜場景下的法律推理能力。例如,在裁判觀點總結場景中,AI法官助理能夠根據卷宗材料總結案件事實,逐條分析對比事實與匹配的法律法規和案例,并將過程可視化,輸出附有法理依據的裁判觀點,為辦案提供有力的決策依據。
目前,星火大模型的能力已經貫穿案情分析、證據審查、庭審提綱輔助生成、裁判輔助等多個環節,為法律領域的智能化發展注入了新的動力。