OpenAI近期推出了其視頻生成服務(wù)的兩個新訂閱層級——ChatGPT Plus和ChatGPT Pro,為用戶提供了將文本轉(zhuǎn)化為視頻的新方式。
ChatGPT Plus訂閱允許用戶生成最多50個優(yōu)先視頻,這些視頻的分辨率最高可達720p,時長限制為5秒。這些視頻生成服務(wù)需要消耗1,000個積分。相比之下,ChatGPT Pro訂閱則更為高端,每月收費200美元,提供無限生成功能,并可將視頻數(shù)量提升至最多500個,分辨率也提高到了1080p,時長則增加到了20秒。
對于追求更高品質(zhì)的創(chuàng)作者,ChatGPT Pro還提供了額外的優(yōu)勢,如允許下載無水印的視頻,并同時支持最多五次生成操作。這些高級功能為專業(yè)視頻創(chuàng)作者提供了更多的靈活性和創(chuàng)作空間。
OpenAI在2月份首次發(fā)布了其文本轉(zhuǎn)視頻AI模型Sora。在最近的直播中,OpenAI展示了Sora的新探索頁面,頁面上展示了由其他社區(qū)成員利用AI生成的視頻。OpenAI重點介紹了兩個新功能:故事板功能,可以根據(jù)一系列提示生成視頻;以及將照片轉(zhuǎn)換為視頻的功能。OpenAI還演示了一個混音工具,允許用戶通過文本提示調(diào)整Sora的輸出,并展示了如何使用AI將兩個場景混合在一起。
值得注意的是,所有通過Sora生成的視頻都會帶有可見的水印和C2PA元數(shù)據(jù),以表明它們是AI制作的。在上傳圖像或視頻到Sora之前,用戶需要同意一項協(xié)議,確保上傳內(nèi)容不包含18歲以下人士、露骨或暴力內(nèi)容以及受版權(quán)保護的材料。濫用媒體上傳可能會導(dǎo)致帳戶被禁止或暫停。
OpenAI研究副總裁Aditya Ramesh在直播中表示,OpenAI面臨著巨大的壓力,需要在阻止非法活動與促進創(chuàng)造性表達之間找到平衡。他承認,這將是一個持續(xù)的挑戰(zhàn),OpenAI可能無法在第一天就做到完美,因此他們希望用戶能提供反饋以改進審核系統(tǒng)。
OpenAI首席執(zhí)行官Sam Altman在直播聲明中強調(diào)了視頻在文化中的重要性,并表示不希望世界只有文字。盡管Sora目前已在美國和許多國家/地區(qū)推出,但Altman透露,在歐洲大部分地區(qū)和英國的推出可能還需要一段時間。
就在Sora發(fā)布一周前,一群自稱參與OpenAI alpha測試計劃的藝術(shù)家泄露了該產(chǎn)品,以抗議OpenAI將他們的勞動成果用于無償研發(fā)和公關(guān)。這一事件為Sora的發(fā)布增添了一些波折。
在競爭方面,ChatGPT的制造商OpenAI希望通過Sora與meta和谷歌等公司的視頻生成AI工具展開競爭。谷歌在1月宣布推出Lumiere,而其他初創(chuàng)公司如Stability AI也推出了類似的AI工具,如Stable Video Diffusion。亞馬遜也發(fā)布了Create with Alexa,這是一種專門生成基于提示的兒童短動畫內(nèi)容的模型。
YouTuber Marques Brownlee在其頻道發(fā)布的視頻中透露了Sora的消息,并搶先體驗了這一新工具。據(jù)Brownlee介紹,Sora的主頁滾動展示了最近生成并由OpenAI策劃的Sora視頻。用戶可以將視頻收藏到已保存選項卡中,以便以后查看,還可以組織到文件夾中,并查看制作視頻時使用的文本提示。
Brownlee表示,Sora可以根據(jù)上傳的圖片和提示生成視頻,并允許用戶編輯現(xiàn)有的Sora制作的視頻。使用重新混合功能,用戶可以描述他們希望在視頻中看到的更改,Sora會嘗試將這些更改合并到新生成的剪輯中。重新混合功能還提供了一個“強度”設(shè)置,讓用戶指定他們希望Sora對目標視頻進行多大程度的更改。
然而,Brownlee也指出了Sora存在的一些問題,如與物體永久性相關(guān)的問題,以及在涉及長時間行走的人和動物時出現(xiàn)的腿部問題。盡管有這些缺陷,Sora仍然為視頻創(chuàng)作者提供了一個新的創(chuàng)作工具,并有可能成為生成式人工智能的下一個前沿。
隨著聊天機器人和圖像生成器逐漸進入消費者和商業(yè)領(lǐng)域,視頻生成可能會成為下一個重要的生成式人工智能應(yīng)用。然而,這也帶來了嚴重的虛假信息問題。據(jù)機器學習公司Clarity的數(shù)據(jù)顯示,人工智能生成的深度偽造視頻數(shù)量同比增長了900%。因此,OpenAI在推廣其視頻生成服務(wù)的同時,也需要加強審核和監(jiān)管,以防止非法活動和虛假信息的傳播。
OpenAI將多模態(tài)性(即文本、圖像和視頻生成的結(jié)合)作為其提供更廣泛的AI模型套件的一個突出目標。隨著Sora的推出,OpenAI正朝著這一目標邁進,為用戶提供更多樣化的AI服務(wù)。