7月26日,北京人工智能大模型企業(yè)智譜AI發(fā)布AI視頻生成模型“清影”,輸入幾個字到幾百個字后,清影就能在30秒內(nèi)生成1440x960清晰度的高精度視頻。
“一艘巨大的古典帆船在巨浪的海面上行駛,灰蒙蒙的夜晚,月光照出藍色的光影,風(fēng)浪顯得氣氛很緊張。”輸入一段文字后(俗稱Prompt),用戶可以選擇自己想要生成的風(fēng)格,包括卡通3D、黑白、油畫、電影感等,配上清影自帶的音樂,就生成了充滿AI想象力的視頻片段。
據(jù)悉,清影底座的視頻生成模型是CogVideoX,采用新型DiT架構(gòu),可更高效壓縮視頻信息,以更好融合文本和視頻內(nèi)容,加強其復(fù)雜指令遵從能力、內(nèi)容連貫性、大幅的畫面調(diào)度等,相比前代(CogVideo)推理速度提升了6倍。除了文本生成視頻,清影也可以支持用圖片生成視頻,通過圖生視頻來實現(xiàn)劇情創(chuàng)作、短視頻創(chuàng)作等。同時,基于清影的“老照片動起來”小程序也同步上線,人們只需一步上傳老照片,AI就能讓凝練在舊時光中的照片動起來。
據(jù)了解,清影(Ying)的研發(fā)得到北京市的大力支持。其中,智譜清影的算力支持來自于北京亦莊人工智能公共算力平臺,該平臺5000P高性能智能算力已投入使用,通過高質(zhì)量數(shù)據(jù)、高性能算力、國產(chǎn)軟硬件適配、模型評測、行業(yè)應(yīng)用等一體化服務(wù)體系,助力人工智能技術(shù)迭代創(chuàng)新。
當(dāng)前,北京正在打造人工智能產(chǎn)業(yè)高地,為智譜AI開展大模型研發(fā)提供了產(chǎn)業(yè)投資、算力補貼、應(yīng)用場景示范、人才等全方位支持。“智譜清影在北京亦莊算力集群中誕生,未來也將應(yīng)用實踐于北京亦莊廣闊的高精尖產(chǎn)業(yè)集群,形成大模型賦能實體經(jīng)濟的新應(yīng)用、新業(yè)態(tài)、新模式。”智譜相關(guān)負責(zé)人說。