首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網|量子|元宇宙|博客|特約記者
手機|互聯(lián)網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網|會展
首頁 >> 人工智能 >> 正文

中國人工智能視頻生成產品密集上線

2024年8月2日 07:10  新華社  作 者:張漫子

北京8月1日電 在對話框中輸入一句話或添加一張照片,點擊“生成視頻”按鈕,不到一分鐘,一條6秒的短視頻立馬生成!翱,照片動起來了。”第一撥嘗鮮國產自研視頻生成產品“清影”的“00后”用戶施司羽說。

今年初,文生視頻大模型Sora在全球人工智能業(yè)內外引發(fā)廣泛關注。近日,多個中國科技企業(yè)自主研發(fā)的視頻生成產品扎堆上線,引發(fā)關注。這意味著中國人工智能大模型的“應用試驗田”又多了一塊。

  圖片通過視頻大模型Vidu自動生成一段動畫視頻(視頻截圖)。新華社發(fā)

生數(shù)科技今年4月聯(lián)合清華大學發(fā)布了視頻大模型Vidu,并于7月底正式上線。“此次Vidu正式上線,并全面開放了文生視頻、圖生視頻兩大功能,提供4s、8s兩種時長選擇,分辨率最高達1080P,將讓更多人感受文生視頻、圖生視頻的美好體驗!鄙鷶(shù)科技聯(lián)合創(chuàng)始人兼首席執(zhí)行官唐家渝說。

Vidu上線前數(shù)天,北京另一家人工智能公司智譜AI也上線了基于其自研大模型開發(fā)的視頻生成產品Ying(清影)。“清影不僅支持文本生成視頻、圖片生成視頻,還支持視頻生成視頻!敝亲VAI首席執(zhí)行官張鵬說。

今年6月,快手發(fā)布的視頻生成大模型“可靈”,在文生視頻、圖生視頻方面展現(xiàn)出了創(chuàng)造逼真運動場景、精確模擬物理特性的能力與潛力。

唐家渝和張鵬表示,當前中國視頻生成產品的主流技術路線,采用的是深度學習模型與擴散模型相結合的架構,遵從“規(guī)模定律”,強依賴算法、算力、數(shù)據(jù)。

  視頻生成產品Ying(清影)用戶登錄界面。新華社發(fā)

當前,全球范圍內文本、圖片生成視頻模型賽道上已有多家科技企業(yè)參與競逐。除OpenAI的Sora之外,還有Runway的Gen系列、微軟的Nuwa、Meta的Emu、谷歌的Phenaki等。中國最早的入局者有生數(shù)科技的Vidu、智譜AI的清影、快手的可靈、商湯的日日新等。

張鵬說,目前中國的視頻生成技術還處于起步階段,并不完美;接下來還有高質量數(shù)據(jù)、算法等一系列問題有待逐一破解。然而加速人工智能技術發(fā)展的最好方式就是并行加速技術的研發(fā)與應用,而不是把技術關在實驗室里閉門造車。

“從今天的技術實現(xiàn)角度,視頻大模型的迭代將顛覆影視動畫制作在內的內容產業(yè)!碧萍矣孱A判,未來十年,影視創(chuàng)作生產的門檻與影視動畫制作的成本將進一步降低,更好地將想象力、創(chuàng)造力轉化為生產力。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯(lián)系,我們將在第一時間刪除內容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
尚冰:中國互聯(lián)網應用蓬勃發(fā)展,多項關鍵指標位居全球第一
精彩專題
CES 2024國際消費電子展
2023年信息通信產業(yè)盤點暨頒獎禮
飛象網2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像