欧美在线观看天堂一区二区三区_99re66热这里只有精品4_国产午夜亚洲精品不卡_欧美国产视频在线观看

首頁 > 實用技巧 > 干貨教程 > Pika融資、快手上線可靈,蘋果的AI產品為何“燒冷灶”?

Pika融資、快手上線可靈,蘋果的AI產品為何“燒冷灶”?

發布時間:2024-06-12 16:36:40

蘋果公司(AAPL.US)WWDC開發者大會上推出了名為Apple Intelligence的AI產品,然而當日股價收盤跌1.91%。有趣的是,6月11日Wind數據中的Sora指數(8841756.WI)漲1.55%。

為什么會有這樣的區別?

蘋果選擇了避開當下正熱的視頻大模型,推出的AI相關更新更多側重文字領域,而國內概念股的漲幅與近期文生視頻大模型熱度又起緊密相關。國外如明星AI視頻生成公司Pika完成新一輪融資,總額8000萬美元的B輪融資后,公司估值將超過4.7億美元。國內如快手(1024.HK)“可靈”視頻生成大模型正式上線,采用了與Sora相似的技術路線。

在多位行業人士看來,蘋果聚焦AI文字而非視頻領域的整合,更多出于成本與實用性等方面的考量。

蘋果避開Sora“戰局”

蘋果推出的內置大語言模型可讓iPhone、iPad和Mac理解并生成語言和圖像。Siri通過接入ChatGPT,具有了語義檢索功能,可以智能搜索照片、日歷、文件和郵件等內容,還可以免注冊使用大部分ChatGPT的功能。

天風國際證券分析師郭明錤發布簡評稱,蘋果新發布的Apple Intelligence套件展現了生態整合與界面設計優勢,對使用者很實用,但對投資人只是錦上添花,后者期待看到原創且非用不可的功能。

面壁智能首席研究員韓旭對記者表示,從接入操作系統的角度來看,蘋果主要需要AI來理解人的意圖和調用系統層面的接口,這些需求和Sora的出發點不完全一致,但與多模態輸入文本輸出的大模型較為匹配。Sora這類生成圖片或視頻的模型,目前還是和軟件尤其是視覺處理軟件結合比較合適。

為什么蘋果沒有加入Sora的“戰局”?

一位AIGC視頻應用廠商人員對記者表示,從產品思維和經營角度來講,蘋果只會落地相對比較成熟,且投入產出比能見度更加可觀的領域。在手機硬件交互的層面,文字的使用場景更多,從研發投入到實際推理成本方面來講,該領域對蘋果目前的技術積累而言也相對更有性價比。

另一位行業技術人員表示,今天的LLM服務(大型語言模型服務)在文字領域基本實現保本,文生圖領域不一定,文生視頻領域一定會虧損。這也是這次蘋果WWDC大會暫時沒有整合視頻AIGC能力的重要原因。

相對于蘋果公司的動作,國內大模型賽道目前對視頻領域寄予厚望。今年4月,清華大學人工智能研究院副院長、生數科技聯合創始人兼首席科學家朱軍教授代表清華大學與生數科技,發布中國首個視頻大模型Vidu,不久前,快手上線的視頻大模型“可靈”也引發了一定程度的熱議。

記者將Sora代表視頻文案作為提示詞,輸入快手“可靈”,進行生成視頻對比,以“東京街頭女郎漫步”為例,當時Sora視頻存在女郎走路過程中存在腿部變形、腿部交叉換位時錯亂、右腿連續兩次在前方邁步等錯誤。快手“可靈”也存在類似問題。

天風證券認為,快手3D VAE+DiT架構對算力、模型和數據質量的提升已展現出能夠實現商用的結果,同時時長、比例的自定義使得生成素材的可用性大幅加強,盡管在一些復雜語義理解上遜色于Sora,但在稍簡單的場景下已差距不大。

多模態成中國大模型賽道機會

一個優秀的視頻生成模型需要考慮四大核心要素——模型設計、數據保障、計算效率,以及模型能力的擴展。

針對Sora存在的不成熟之處,OpenAI曾表示,Sora可能難以準確模擬復雜場景的物理原理,可能無法理解因果關系,可能混淆提示的空間細節,可能難以精確描述隨著時間推移發生的事件,如遵循特定的相機軌跡等。

但這更像是一個普遍存在的問題。愛詩科技創始人王長虎此前表示,目前的視頻大模型都是直接從視頻數據里學習物理知識,但真實視頻中往往包含很多信息,很難分別把每個物理規律精確地學習好。在給模型輸入視覺畫面的同時,單獨加入人手、動物尾巴等3D建模信息作為約束,可以輔助大模型學習,也能優化效果。

可靈大模型采用的是原生文生視頻技術路線,替代了圖像生成+時序模塊的組合。目前,在隱空間編/解碼上,主流的視頻生成模型通常采用Stable Diffusion的2D VAE進行空間壓縮,但這對于視頻而言存在明顯的信息冗余。因此,快手大模型團隊自研了3D VAE網絡,試圖尋找訓練性能和效果之間的平衡。另外在時序信息建模上,快手大模型團隊設計了一款全注意力機制(3D Attention)作為時空建模模塊。

生數科技CEO唐家渝提到,多模態大模型的研究仍處于起步階段,技術成熟度還不高。這一點不同于火熱的語言模型,國外已經領先了一個時代。因此,相比于在語言模型上“卷”,唐家渝認為多模態更是國內團隊搶占大模型賽道的一個重要機會。這一點與啟明創投合伙人周志峰有相同之處,他也認為如今的大模型已從原來的純語言模態逐步走向多模態的探索。

北京智源人工智能研究院副院長兼總工程師林詠華對第一財經記者表示,中國在多模態領域彎道超車是有一定可能性的,但多模態模型的成功要素依然是算力、算法和數據。目前算法層面,中美團隊之間差異沒有那么大,行業也仍有辦法去解決算力問題,但要獲取海量高質量數據,依然難度很大。

干貨教程更多>>

比亞迪率先實現媲美L4級智能泊車,天神之眼B和C即將OTA;華為乾崑ADS 4升級全新WEWA架構 小米汽車銷量暴跌46%!雷軍遭遇地獄級難題 差距太大了,一臺吉利星愿干掉所有A0級電車! 大眾汽車計劃今年年底關閉南京工廠?上汽大眾回應來了! 奇瑞風云A9L與吉利星耀8,15萬級中大型品質插混轎車怎么選? 搶先試駕一汽奧迪Q6L e-tron,德國駕控聯袂華系智慧 天神之眼史上最大規模OTA+安全兜底!秦L更聰明更超值 比亞迪針對天神之眼大規模OTA 承諾為智能泊車安全兜底 10.38萬元起,吉利銀河A7開啟預售,綜合續航超2100km 吉利星越L燃油版賣得好,其實混動版開起來更舒適省油 北京 BJ40 燃油版車型到店!11 款配置,如何抉擇? 以萌新姿態入局 日產Micra EV新車圖解 2025款廣汽傳祺向往S7日常實用性測試報告 別克GL8陸尚以低姿態示好消費者 配置升級 2025款歐拉好貓將于6月27日上市 大眾集團CEO反思:在功勞簿上躺了太久 舒適豪門還是科技新貴?東風奕派eπ008和零跑C16誰能承包全家幸福 形勢逆轉!合資電車集體爆火:EZ-60盲訂訂單超3萬,馬自達也開竅了 明確真實用車場景,8萬塊的蔚來螢火蟲或許不一定是最值的! AEB成強制性國家標準,純視覺能通過考驗嗎? 新人新打法、王昊如何重振“越野世家”? 上汽乘用車高管聲譽:陳萃顯黑,錢漾真白? 這10年“憋”壞了吧!比亞迪新電池進度曝光,兆瓦閃充短板補齊了 比亞迪全新家用轎跑!海豹06EV北京區域上市,售價10.98萬元~12.98萬元 月銷5萬蔚來汽車能做到嗎? 采購需求下降8.5%,二手車商要唱“空城計”? iOS 26來了!蘋果迎迄今規模最大設計更新“液態玻璃”:全透明外觀、新版相機與相冊界面 iOS 26相機界面液態玻璃設計引革新,智能交互優化開啟影像新紀元 綠色的紅底鞋,5厘米的高度,繞踝的一字帶,一款連衣裙 捷斯納紅米K60鋼化膜8.33元超值促銷
主站蜘蛛池模板: 贵州省| 扎鲁特旗| 桐梓县| 合山市| 定陶县| 金阳县| 仪陇县| 吴旗县| 阿巴嘎旗| 江源县| 明光市| 荆州市| 梁山县| 建阳市| 吉水县| 闽侯县| 丽水市| 博兴县| 澄江县| 双江| 绥芬河市| 温泉县| 五家渠市| 济宁市| 乌兰察布市| 吴桥县| 承德县| 永仁县| 招远市| 通榆县| 东乡族自治县| 碌曲县| 西峡县| 边坝县| 利津县| 阿图什市| 乌审旗| 平凉市| 周口市| 桑植县| 含山县|