在經(jīng)歷了去年AI大模型爆發(fā)式增長后,AI技術迎來新一輪更新迭代。文生視頻模型Sora的出現(xiàn),開啟了AI的新時代,也對企業(yè)的算力提出更高的要求。
浙江大學國際聯(lián)合商學院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林對《證券日報》記者表示,Sora的出現(xiàn),讓國內(nèi)AI企業(yè)趨之若鶩,但實現(xiàn)Sora同等級應用的難度并不小,對算力的需求會越來越大,所以各大AI企業(yè)應從現(xiàn)實出發(fā),考慮應用落地的難易度。
AI發(fā)展步伐加快
大模型驅(qū)動的生成式AI具有極為廣闊的應用前景,有望為眾多行業(yè)帶來強大的賦能效應。隨著Sora的出現(xiàn),AI發(fā)展的步伐將進一步加快。
“Sora在視頻處理領域有巨大潛力,為未來更復雜、更精細的視頻處理任務提供了可能性。”艾媒咨詢CEO兼首席分析師張毅對《證券日報》記者表示,Sora的文生視頻、圖生視頻等功能需要AI模型具備強大的泛化能力,這要求AI模型能夠?qū)W習和理解視頻內(nèi)容的內(nèi)在規(guī)律和結構,從而生成更加逼真、生動的視頻內(nèi)容。這也將推動AI模型在泛化能力方面進一步發(fā)展。
“Sora的出現(xiàn)不僅為人工智能領域提供了新的可能性,也將促進人工智能與其他技術的融合。例如,可以將Sora與虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)等技術結合,創(chuàng)建更加逼真的虛擬場景和交互體驗;也可以將Sora與深度學習、計算機視覺等技術結合,提高視頻處理和分析的準確性和效率!睆堃氵M一步表示。
天風證券研報表示,隨著OpenAI發(fā)布Sora,文生視頻模型能力大幅提升,內(nèi)容創(chuàng)作工作流有望被顛覆,下一個億級用戶的互聯(lián)網(wǎng)平臺雛形已然出現(xiàn)。2000億美元的短視頻創(chuàng)作生態(tài)有望率先被顛覆,生成式AI在視頻創(chuàng)作和世界模型的大踏步進步將實現(xiàn)對視頻、3D、游戲等下游應用場景的滲透。
算力或成AI企業(yè)門檻
生成式AI模型的訓練是一個計算極為密集的過程。這些模型包含數(shù)百萬乃至數(shù)十億個參數(shù),需要在龐大的數(shù)據(jù)集上進行多輪迭代訓練。在訓練過程中,涉及大量矩陣運算和梯度計算等計算密集型操作。因此,為確保訓練過程的順利進行,必須依賴強大的計算資源來加速。
例如,ChatGPT的訓練參數(shù)達到了1750億、訓練數(shù)據(jù)45TB,每天生成45億字的內(nèi)容,支撐其算力至少需要上萬顆英偉達的GPUA100,單次模型訓練成本超過1200萬美元。
而Sora的出現(xiàn)對企業(yè)的算力提出了更高的要求。近日,360創(chuàng)始人周鴻祎提到,Sora的技術路線如果被開源,國內(nèi)將能很快趕上,但在追趕Sora時,算力有可能成為門檻。“Sora能生成一分鐘的視頻,就意味著也能生成10分鐘、60分鐘的視頻,但不做更長的視頻,或因算力和成本的限制。”周鴻祎猜測。
銀河證券研報稱,據(jù)相關研究推測,Sora參數(shù)規(guī)模估算在30B,如果按此參數(shù)測算,推演出Sora訓練單次算力需求或可達到8.4×10^23Flops,相當于GPT-3的2.7倍。伴隨Sora不斷迭代,訓練數(shù)據(jù)集規(guī)模增大,未來算力需求將呈現(xiàn)指數(shù)級爆發(fā)式增長。
盤和林也表示,鑒于Sora設立時間并不久,估計現(xiàn)階段參數(shù)量不大,但由于模型本身是一個不斷積累的過程,未來幾年參數(shù)量還會不斷增長,Sora需要的參數(shù)量更為龐大,對算力的需求勢必更大。
“算力或?qū)⒊蔀锳I企業(yè)的門檻與瓶頸,因為目前國內(nèi)AI企業(yè)算力存在缺口,算力主要依賴于軟件生態(tài)的CUDA和硬件生態(tài)的GPU,所以國內(nèi)AI產(chǎn)業(yè)應該努力解決算力的問題,為AI應用的研發(fā)提供強有力的基礎保障。”盤和林進一步表示。