當(dāng)?shù)貢r(shí)間周一,OpenAI宣布正式向用戶開放人工智能(AI)視頻生成模型Sora,該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻,這距離OpenAI首次公開預(yù)覽這款產(chǎn)品已過(guò)去了10個(gè)月時(shí)間。
根據(jù)OpenAI的介紹,Sora將于當(dāng)天晚些時(shí)候向美國(guó)及其他市場(chǎng)的ChatGPT付費(fèi)用戶開放。新版工具Sora Turbo可以生成最長(zhǎng)達(dá)20秒的視頻,并且可以提供這些視頻的多種變體。
自今年2月首次預(yù)告Sora以來(lái),OpenAI便開始與電影制片廠、媒體高管以及經(jīng)紀(jì)公司展開會(huì)談。OpenAI還允許一些藝術(shù)家、知名演員和導(dǎo)演試用該服務(wù)。
OpenAI聲稱Sora是一項(xiàng)理解和模擬現(xiàn)實(shí)的基礎(chǔ)性AI技術(shù),是開發(fā)能夠與物理世界互動(dòng)模型的重要一步。
然而,Sora在早期測(cè)試中顯示出明顯的局限性。據(jù)悉,在一次測(cè)試中,Sora存在“多余肢體”的問(wèn)題,并對(duì)物理現(xiàn)象的理解不夠準(zhǔn)確。此外,與圖像生成器或聊天機(jī)器人相比,Sora生成每個(gè)視頻所需的時(shí)間和算力明顯更多了。
OpenAI首席執(zhí)行官奧爾特曼表示,初期Sora的使用仍然受限,ChatGPT Plus訂閱用戶可以每月生成50個(gè)低分辨率視頻,ChatGPT Pro訂閱用戶可以無(wú)限制的“較慢”生成高分辨率視頻,以及500個(gè)快速生成的視頻。
除了視頻生成的數(shù)量和速度會(huì)有限制之外,Sora在歐洲大部分地區(qū)也無(wú)法使用,因?yàn)闅W洲的科技監(jiān)管更嚴(yán)格。
在周一的演示中,OpenAI還展示了Sora的新功能。該公司表示,該工具不僅可以通過(guò)文本提示生成視頻,還能夠基于靜態(tài)圖片和已有視頻創(chuàng)建新的內(nèi)容。例如,用戶可以上傳一段視頻剪輯,Sora會(huì)生成擴(kuò)展這個(gè)片段的后續(xù)畫面,使視頻變得更長(zhǎng)、更完整。
Sora還包含一個(gè)名為Storyboard的選項(xiàng),用戶可以通過(guò)它詳細(xì)描述希望視頻在不同時(shí)間點(diǎn)發(fā)生的內(nèi)容,從而更好地指導(dǎo)一系列片段的生成。此外,Sora還提供了一個(gè)功能,讓用戶可以瀏覽其他人創(chuàng)作的視頻集錦。
Sora的發(fā)布是OpenAI為期12天的產(chǎn)品直播活動(dòng)的一部分,上周已推出了更昂貴的ChatGPT Pro訂閱選項(xiàng),可無(wú)限制訪問(wèn)OpenAI最強(qiáng)大的AI模型。
雖然Sora是世界上第一個(gè)視頻生成模型,但自它問(wèn)世以來(lái),同類產(chǎn)品已經(jīng)是百花齊放,比如Google的Veo、快手可靈、Runway的Gen-3、字節(jié)跳動(dòng)PixelDance等。
與此同時(shí),這些可以快速地制作視頻的工具正在顛覆影視行業(yè),人們已經(jīng)開始探索如何將這項(xiàng)技術(shù)應(yīng)用于電影制作。