美國科技巨頭Meta近日發(fā)布了Movie Gen,號稱是“最先進(jìn)的媒體基礎(chǔ)模型”。據(jù)悉,Movie Gen可生成1080P、16秒、每秒16幀的高清長視頻,其不但可以通過文本輸入生成視頻,還可以通過文本對現(xiàn)有視頻進(jìn)行編輯修改,據(jù)稱逼真程度超越大半年前掀起一波文生視頻熱潮的Sora。不過,也僅此而已。行業(yè)并沒有掀起太大波瀾。
事實上,不只是Movie Gen被冷落,曾經(jīng)全球爆紅的快手可靈,字節(jié)的即夢AI,國外的Runway、Luma AI、Pika等都日漸降溫,而Sora則至今未能正式上線。
一度熾熱的AI視頻生成賽道,難道真如百度董事長兼CEO李彥宏最新點(diǎn)評般,“Sora這種視頻生成的投入周期太長,10年、20年都可能拿不到業(yè)務(wù)收益”,就此“涼涼”了?
1
視頻生成的AI熱
2024年2月,Sora的橫空出世給AI及視頻創(chuàng)作領(lǐng)域都帶來一波新沖擊。Sora不僅對文本理解更深刻,可以準(zhǔn)確地呈現(xiàn)提示詞,而且能在一個生成的視頻中創(chuàng)建多個鏡頭,準(zhǔn)確地保留角色和視覺風(fēng)格,生成長達(dá)1分鐘的質(zhì)量驚艷的視頻,讓無數(shù)人驚嘆:“以后可能不需要人拍電影了!”
據(jù)德邦證券統(tǒng)計,自Sora首次亮相以來,全球已有十多家公司發(fā)布或更新了視頻生成模型。
2024年夏天以來,AI視頻生成賽道變得異常熾熱。Runway、Pika、Luma AI、Stability AI等新興項目搶先推出比Sora更好用的AI視頻生成工具,并免費(fèi)提供給用戶。
其中,Runway9月的新品已將視頻生成時長延長至40秒,幾乎追平Sora展示的效果;Luma AI比Sora效果更真實還免費(fèi),在全球知名數(shù)據(jù)機(jī)構(gòu)SimilarWeb統(tǒng)計的全球AI產(chǎn)品訪問量為AI視頻生成類工具排名第一;Pika也在2024年10月推出Pika 1.5,更真實的運(yùn)動效果和大屏幕鏡頭堪稱驚艷;直到Meta最新發(fā)布的自帶配音的文生視頻模型Movie Gen,直接用一個完整的評測體系宣告自己打敗Sora。
在中國,AI創(chuàng)企和科技巨頭也已推出多款“中國造Sora”。愛詩科技、生數(shù)科技、智象未來、Morph Studio、智譜AI、Minimax等AI創(chuàng)企都已推出了公眾可用的AI視頻生成工具,具有高壓縮率、優(yōu)良的文本響應(yīng)能力以及多樣化風(fēng)格,能夠生成媲美電影質(zhì)感的高分辨率、高幀率視頻。
字節(jié)跳動、快手、騰訊等科技巨頭也都相繼入場攪局。快手今年7月推出的可靈AI,8月訪問量已達(dá)1448萬,環(huán)比增長591.54%,在AI視頻生成賽道排名僅次于Luma AI,成為全球現(xiàn)象級爆紅產(chǎn)品,而字節(jié)推出的即夢AI憑借CapCut(剪映)也已成為許多短視頻博主創(chuàng)作必備工具。
2
大家“玩”厭了?
然而,在項目首次曝光8個月后的今天,Sora并沒有如OpenAI的其他AI產(chǎn)品般普及開來,而是不斷傳出“難產(chǎn)”消息。
實際上,據(jù)外媒近期報道,一些試用了Sora的電影制作人透露體驗并不太理想,問題包括Sora生成的視頻在呈現(xiàn)提示詞上不夠準(zhǔn)確,生成視頻耗時久、一致性保持不足等。此外,“恐怖谷”效應(yīng)多發(fā),如生成的視頻總是包含奇怪的物理現(xiàn)象,比如憑空出現(xiàn)一把椅子,或者錯誤地解剖分割事物,等等。換句話說,市面上AI視頻生成工具有的“翻車”場面,Sora也都有。
與此同時,今年入秋以來,不少紅極一時的類Sora產(chǎn)品同樣熱度驟降。
今年9月,根據(jù)InfoQ等科技媒體聯(lián)合推出的AI產(chǎn)品榜·全球降速榜,上榜的前五名中有兩名都是AI視頻生成工具:Luma AI 9月訪問量環(huán)比下降38.49%,Viggle 9月訪問量環(huán)比下跌36.13%。
另據(jù)SimilarWeb數(shù)據(jù),全球眾多AI產(chǎn)品2024年8月訪問量繼續(xù)上漲,卻未出現(xiàn)一個AI視頻生成工具。排名22的Luma AI,訪問量僅1920萬,環(huán)比下跌14.9%。
在科技巨頭方面,無論是國外的Meta、谷歌,還是國內(nèi)的阿里、騰訊、百度等,至今沒有推出全民級的AI視頻生成產(chǎn)品,最多只是些試水式動作。
有視頻創(chuàng)作者表示,單以產(chǎn)品來說,這些AI視頻工具各具優(yōu)點(diǎn)。比如海螺AI以其優(yōu)秀的動畫、鏡頭運(yùn)用和人物情感表達(dá)而著稱;Vidu在語義理解、特效2D動畫、一致性等表現(xiàn)出色;Runway則以其較高的分辨率、優(yōu)秀的畫面質(zhì)感成為廣告行業(yè)的理想選擇;而可靈則因其平衡的性能而被視為多面手。
不過,上述創(chuàng)作者還指出,文生視頻大多時候更像是愛好者的“玩具”,難以滿足商業(yè)需求。因為在短劇制作中,需要確保人物形象和其他元素的一致性,而文生視頻往往只能生成幾秒鐘的內(nèi)容,且下一秒的內(nèi)容可能會發(fā)生變化,這顯然無法滿足專業(yè)制作的要求。此外,視頻中的物理規(guī)律是否符合常識也是一個難點(diǎn)。
3
商業(yè)化前景嚴(yán)峻
近日,百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光,凸顯了AI視頻生成產(chǎn)品面臨的嚴(yán)峻挑戰(zhàn),也引發(fā)了“中國版Sora值不值得做”等更多相關(guān)話題的爭論。
李彥宏在內(nèi)部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業(yè)務(wù)收益,無論多火爆,百度都不去做。
有批評者指出,除了前述的技術(shù)成熟度不足的共性問題外,生成式AI技術(shù)大幅降低視頻生成門檻的同時,也對計算成本和效率提出了嚴(yán)峻的挑戰(zhàn)。比如在Luma AI的Dream Machine發(fā)布后,由于大量用戶涌入使用,服務(wù)器壓力過大,很多用戶需要排隊等待數(shù)小時才能得到生成的視頻,從而大大消耗了用戶的耐心,讓體驗打折扣。從企業(yè)角度來說,提供AI視頻生成服務(wù)是一項遠(yuǎn)比聊天機(jī)器人更耗費(fèi)算力的工作,成本壓力大。
另外,雖然各家AI視頻生成工具都推出了免費(fèi)服務(wù),但大多都有次數(shù)和質(zhì)量的限制。以Dream Machine為例,其有29.99美元的標(biāo)準(zhǔn)檔、99.99美元的專業(yè)檔以及499.99美元的高級檔,高昂的價格使得當(dāng)下AI視頻生成工具的性價比大打折扣,影響其熱度進(jìn)一步提升。
從現(xiàn)實來講,在經(jīng)濟(jì)增長放緩的背景下,無論是消費(fèi)端用戶還是各行各業(yè)企業(yè)對AI投入都會更加謹(jǐn)慎。
以短視頻創(chuàng)作UGC市場為例,今年7月抖音和快手兩大短視頻廠商都親自下場,分別推出《三星堆:未來啟示錄》《山海奇鏡之劈波斬浪》兩部AI生成短劇,盡管在平臺的帶動下兩部AI短劇迅速播放破億,并吸引了不少創(chuàng)作者開始嘗試AI視頻生成。然而,時隔三個月,在各大平臺上并未看到AI生成短劇扎堆跟進(jìn)出現(xiàn)的勢頭。
一些嘗試過AI的短視頻創(chuàng)作者表示,主要因為當(dāng)下內(nèi)容賽道競爭激烈,變現(xiàn)更加艱難,他們更愿意從話題、內(nèi)容質(zhì)量等方面去提升而非增大技術(shù)成本投入。
支持者一方如火山引擎視頻云人士表示,當(dāng)前視頻數(shù)據(jù)的規(guī)模飛速增長,IDC預(yù)計,2025年全球數(shù)據(jù)量將達(dá)到175ZB,其中絕大部分將來自視頻數(shù)據(jù),而這一趨勢,還將繼續(xù)加速。技術(shù)的成熟,疊加應(yīng)用的爆發(fā),AI視頻的戰(zhàn)爭,正迎來市場化為導(dǎo)向的下半場。
中信建投一份最新研報則認(rèn)為,近期快手可靈、智譜、Runway等模型均開放視頻模型API,平均生成一段5s的視頻收費(fèi)在0.5—2元不等。展望未來,隨著AI視頻在C端娛樂社交、B端影視內(nèi)容制作等場景之下,應(yīng)用滲透率提升,疊加API成本的持續(xù)下降,AI視頻的商業(yè)化空間將打開。