首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

快手可靈AI面向全球發(fā)布1.5模型 新增“運動筆刷”效果業(yè)內(nèi)領(lǐng)先

2024年9月20日 09:46  CCTIME飛象網(wǎng)  

9月19日,可靈AI迎來重磅升級,視頻生成新增可靈1.5模型,在畫質(zhì)質(zhì)量、動態(tài)質(zhì)量、美學(xué)表現(xiàn)、運動合理性以及語義理解等方面均有顯著提升。與此同時,可靈AI還引入了全新的“運動筆刷”功能,進(jìn)一步提升視頻生成的精準(zhǔn)控制能力。

首先是基座模型再次升級,新增可靈1.5模型,支持在高品質(zhì)模式下,直出1080p高清視頻,挑戰(zhàn)大屏清晰度與質(zhì)感。與可靈 1.0 模型相比,1.5模型在畫面質(zhì)量、動態(tài)質(zhì)量、文本響應(yīng)度等方面有顯著效果提升,其內(nèi)部評測整體效果提升95%。

此前,可靈1.0模型在高品質(zhì)模式可生成720p視頻,本次升級后,1.5模型高品質(zhì)模式可直接生成1080p高清視頻。通過輸入提示詞“女孩看著車窗”,對比左右兩個版本視頻生成的效果,可以發(fā)現(xiàn),可靈1.5新模型的畫面質(zhì)量提升顯著:畫面清晰度有直觀可感,畫面右側(cè)的女孩面部細(xì)節(jié)更清晰豐富,車窗的水霧、整體光影表現(xiàn)等也都更加出色。同時,新模型下畫面整體構(gòu)圖也進(jìn)一步優(yōu)化,畫面更具美感。

在動態(tài)質(zhì)量方面,新模型也有顯著提升。例如,對比可靈AI此前火爆出圈的吃面案例,輸入提示詞“小男孩吃面”,右側(cè)1.5模型生成的視頻中,面條從被夾起到入口這一過程中,在彈性、垂墜感等方面有非常真實的物理表現(xiàn),同時小男孩右手握住筷子和吃面時的咀嚼動作,也都較左側(cè)1.0模型更加自然流暢,整體運動合理性大大增強。

在圖生視頻方面,可靈全新的1.5模型可以響應(yīng)更復(fù)雜的文本描述要求。例如通過一張沒有人物的食物照片和提示詞“鏡頭拉遠(yuǎn),一個小男孩走到桌前拿起勺子開始吃飯”。在生成的視頻中,隨著鏡頭的微微晃動,一個勺子“入場”,然后畫面聚焦到握著勺子的小男孩,看他將一勺飯菜送到嘴里,勺子在碗里撥開飯粒的細(xì)節(jié)也都被細(xì)致地呈現(xiàn)了出來,顯示出強大的圖生視頻理解能力。

本次升級,可靈AI還帶來了強大的“運動筆刷”功能,大幅提升了圖生視頻時創(chuàng)作者對運動效果的控制能力!斑\動筆刷”功能支持為圖片中的元素(人或物體等)指定運動軌跡,用戶只需將圖片中需要控制運動方向的部分勾勒出來,然后畫一個示意運動方向箭頭,就可實現(xiàn)精準(zhǔn)運動控制。該功能支持上傳圖片后最多為圖中的 6 個元素(人或物體等)指定運動軌跡。此外,還可以為某些元素額外指定靜止區(qū)域,讓視頻內(nèi)容有更好的運動控制及運動表現(xiàn)。

目前,橫屏(16:9、4:3)、豎屏(9:16、3:4)、方屏(1:1)等多種尺寸格式的圖片,都支持使用「運動筆刷」生成視頻,生成視頻時長為5秒。大量用戶和媒體的評測顯示,可靈AI的運動筆刷功能,在易用性、效果表現(xiàn)等方面均為業(yè)內(nèi)領(lǐng)先。

實際上,可靈AI近期還進(jìn)行了一系列其他功能升級,諸如支持一次性生成最多 4 條視頻,方便創(chuàng)作者快速選取到最優(yōu)生成結(jié)果;“圖生視頻”功能新增支持 10 秒時長并在標(biāo)準(zhǔn)模式下支持增加尾幀;“AI圖片”功能支持“畫質(zhì)增強”。此外,官方還上線了使用指南,幫助用戶更好地掌控可靈AI。

自今年6月發(fā)布以來,這已經(jīng)是可靈AI累計第9次迭代升級。本次升級也將同步面向全球展開,今年7月,可靈AI宣布國際版1.0正式上線,正式面向全球用戶開放,隨后又推出了全球會員體系。目前,可靈AI目前已經(jīng)累積了大量的國內(nèi)外用戶,快手高級副總裁、主站業(yè)務(wù)與社區(qū)科學(xué)線負(fù)責(zé)人蓋坤此前在快手投資者日上披露,已有累計超260萬人使用過可靈AI,并累計生成超2700萬個視頻、5300萬張圖片。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國電信邵廣祿:面向AI大模型的智算集群及網(wǎng)絡(luò)的實踐和展望
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像