螞蟻集團近日宣布了一項重要開源舉措,正式推出了Ling-Coder-Lite,這是一款基于MoE(混合專家)架構的代碼大語言模型。
據官方詳細闡述,Ling-Coder-Lite在推理效率上實現了顯著提升,具體提升幅度達到了1.5至2倍。這一成果無疑為代碼生成和處理領域帶來了新的突破。
值得注意的是,螞蟻集團此次不僅開源了Ling-Coder-Lite,還同步推出了其輕量級版本Ling-Coder-Lite-Base。這兩款模型均已在Hugging Face與ModelScope平臺上對外開放,供開發者和研究人員自由使用。
為了支持社區對這兩款模型進行更深入的研究和開發,螞蟻集團還慷慨地開源了大量相關數據。這包括用于退火訓練的SyntheticQA數據集,以及用于后訓練的SFT(監督微調)和DPO(直接偏好優化)數據集,總數據量高達約3000萬條。
Ling-Coder-Lite基于先進的Ling-MoE架構打造,其總參數量達到了16.8B(十六十八億),但在推理過程中實際激活的參數僅為2.75B(二十七億五千萬)。這一設計使得模型在保持強大性能的同時,也具備了高效的推理能力。
在功能方面,Ling-Coder-Lite展現出了極高的多樣性和實用性。它支持Python、Java、C++等數十種常用編程語言,能夠滿足開發者在不同場景下的需求。除了簡單的代碼生成和多語言支持外,Ling-Coder-Lite還擅長競賽類和應用類高級代碼生成、代碼理解和輸入輸出推理、數據科學和SQL類數據分析,以及代碼修復等復雜任務。