欧美在线观看天堂一区二区三区_99re66热这里只有精品4_国产午夜亚洲精品不卡_欧美国产视频在线观看

首頁 > 實用技巧 > 干貨教程 > 北大快手攻克復雜視頻生成難題!新框架輕松組合各種細節,將開源

北大快手攻克復雜視頻生成難題!新框架輕松組合各種細節,將開源

發布時間:2024-06-16 17:07:28

如何生成高難度、指令超復雜的視頻呢?

北大與快手AI有解了,他們提出新框架VideoTetris,就像拼俄羅斯方塊一樣,輕松組合各種細節~

在復雜視頻生成任務中,超過了Pika,Gen-2等一眾商用模型。

 

這個框架不僅能夠直接增強現有模型的組合生成,還能夠支持涵蓋多復雜指令、多場景變更等更高難度的長視頻生成。

首次定義組合視頻生成

文生圖領域,RPG、Omost等項目已經實現了復雜的組合式多物體多場景圖片生成。而在文生視頻領域,組合生成自然地擴展到時間和空間維度,這樣的場景還未被廣泛探索。

團隊首次定義了組合視頻生成任務,包括兩個子任務:
1、跟隨復雜組合指令的視頻生成。2、跟隨遞進的組合式多物體指令的長視頻生成。

目前經團隊測試發現,幾乎所有開源模型,包括商用模型在內都未能生成正確的視頻。

比如輸入“左邊一個可愛的棕色狗狗,右邊一只打盹的貓在陽光下小憩”,結果生成的都是融合了兩個物體信息的奇怪視頻。

 

而使用VideoTetris,生成出的視頻是這樣,成功保留了所有的位置信息和細節特征。

 

在長視頻生成中,目前的方法支持的可變指令目前還停留在“春夏秋冬”的轉化,或單物體從走到跑到騎馬的場景變化階段。

團隊輸入一個簡單的多指令:“從一只可愛的棕色松鼠在一堆榛子上過渡到一只可愛的棕色松鼠和一只可愛的白色松鼠在一堆榛子上”。

結果VideoTetris成功搞定,出現順序也與Prompt一致,最后兩只松鼠還在自然地交換食物。

干貨教程更多>>

比亞迪率先實現媲美L4級智能泊車,天神之眼B和C即將OTA;華為乾崑ADS 4升級全新WEWA架構 小米汽車銷量暴跌46%!雷軍遭遇地獄級難題 差距太大了,一臺吉利星愿干掉所有A0級電車! 大眾汽車計劃今年年底關閉南京工廠?上汽大眾回應來了! 奇瑞風云A9L與吉利星耀8,15萬級中大型品質插混轎車怎么選? 搶先試駕一汽奧迪Q6L e-tron,德國駕控聯袂華系智慧 天神之眼史上最大規模OTA+安全兜底!秦L更聰明更超值 比亞迪針對天神之眼大規模OTA 承諾為智能泊車安全兜底 10.38萬元起,吉利銀河A7開啟預售,綜合續航超2100km 吉利星越L燃油版賣得好,其實混動版開起來更舒適省油 北京 BJ40 燃油版車型到店!11 款配置,如何抉擇? 以萌新姿態入局 日產Micra EV新車圖解 2025款廣汽傳祺向往S7日常實用性測試報告 別克GL8陸尚以低姿態示好消費者 配置升級 2025款歐拉好貓將于6月27日上市 大眾集團CEO反思:在功勞簿上躺了太久 舒適豪門還是科技新貴?東風奕派eπ008和零跑C16誰能承包全家幸福 形勢逆轉!合資電車集體爆火:EZ-60盲訂訂單超3萬,馬自達也開竅了 明確真實用車場景,8萬塊的蔚來螢火蟲或許不一定是最值的! AEB成強制性國家標準,純視覺能通過考驗嗎? 新人新打法、王昊如何重振“越野世家”? 上汽乘用車高管聲譽:陳萃顯黑,錢漾真白? 這10年“憋”壞了吧!比亞迪新電池進度曝光,兆瓦閃充短板補齊了 比亞迪全新家用轎跑!海豹06EV北京區域上市,售價10.98萬元~12.98萬元 月銷5萬蔚來汽車能做到嗎? 采購需求下降8.5%,二手車商要唱“空城計”? iOS 26來了!蘋果迎迄今規模最大設計更新“液態玻璃”:全透明外觀、新版相機與相冊界面 iOS 26相機界面液態玻璃設計引革新,智能交互優化開啟影像新紀元 綠色的紅底鞋,5厘米的高度,繞踝的一字帶,一款連衣裙 捷斯納紅米K60鋼化膜8.33元超值促銷
主站蜘蛛池模板: 黄大仙区| 西乡县| 安徽省| 胶州市| 吉木乃县| 天台县| 简阳市| 普定县| 东至县| 大洼县| 平阳县| 界首市| 高要市| 平原县| 阳春市| 宜君县| 南溪县| 东平县| 双江| 杭锦后旗| 喀喇沁旗| 阿尔山市| 政和县| 曲阳县| 原阳县| 虞城县| 仁布县| 宁安市| 娱乐| 天长市| 西畴县| 乾安县| 上虞市| 格尔木市| 武宁县| 勃利县| 仪陇县| 张家口市| 清徐县| 泊头市| 宜兰市|