社交媒體巨頭meta正加速推進其人工智能語音功能的研發進程,據內部消息透露,公司計劃在不久的將來推出最新的開源大語言模型——Llama 4,并將語音交互功能置于其核心位置。
meta的這一舉動,旨在通過AI技術推動商業化進程,據可靠信息,meta期望在2025年實現AI產品的重要突破。meta首席執行官馬克·扎克伯格曾多次公開表示,他的目標是使meta成為AI領域的領航者,并希望通過AI技術開辟新的收入增長渠道。
與傳統的問答模式不同,meta的語音功能開發聚焦于實現更自然的雙向對話體驗。用戶可以在對話中自由打斷,這種靈活性將極大地提升用戶與AI交互的流暢度和自然度。扎克伯格曾透露,他計劃打造一個具備中級工程師編程和解決問題能力的人工智能工程代理,并認為這擁有巨大的市場潛力。
為了實現這一目標,meta正在積極探索多種商業化路徑。據消息人士透露,公司正在考慮推出針對其AI助手meta AI的高級訂閱服務,該服務將涵蓋諸如餐廳預訂和視頻創作等代理任務。meta還在研究在其AI助手的搜索結果中引入付費廣告或贊助帖子的可能性,以進一步挖掘商業價值。
meta的產品負責人克里斯·考克斯在近期的一次會議上強調,Llama 4將是一個功能全面的模型,語音交互將被設計為其原生功能,而非簡單的語音轉文本處理。這一設計將極大地提升語音交互的效率和用戶體驗。
隨著競爭對手如OpenAI和xAI不斷推出新的AI產品,meta在技術與倫理之間尋找平衡點的討論也日益激烈。據知情人士透露,meta正在深入探討Llama模型在輸出內容方面的限制設置問題,以及是否需要適當放寬這些限制。
值得注意的是,meta的語音交互功能也是其Ray Ban智能眼鏡的核心賣點之一。這款產品在市場上取得了顯著的成功,進一步堅定了meta加速開發輕量級頭戴設備,以期取代智能手機成為消費者主要計算設備的決心。