起死回生”這件事,過去多在話本和影視作品中出現。今年以來,隨著相關AI技術的發展,被“復活”的案例也越來越多。
去年底時,相關技術出現的時候,還僅僅是以技術來進行變臉濾鏡,然后人躲在app背后與想復活的親人互動,但在今年,不少AI企業就已建立了相對完備的技術鏈條、推出逼真能對話的AI數字人滿足用戶的復活需求。有從業者向南都記者表示,對比前幾年的技術,目前產品在互動體驗、音視頻表現效果上已經和前幾年的產品“判若兩人”。
也有從業者指出,別看整個市場現在對“AI復活”的概念追逐得風起云涌,事實上整個市場目前是“雷聲大雨點小”的狀態。“這個市場本身并不那么成熟,即使用戶愿意付費也會受到不少客觀情況的限制,比如安全性、是否合規,同時‘復活’也不是一件順人性的事情,人們對這件事情的接受度也沒有那么高。”
近期,喬任梁父親、李玟母親對相關人士的“AI復活”行為提出的反對聲,也引發互聯網各方對“數字生命”的討論,有學者告訴南都記者,企業即使獲得了“被編輯個人”的授權,業界需要探討的問題依然還有很多,包括授權后內容使用范圍怎么界定、生成的數字人自主行為如果出現違法,權責該如何歸屬等。
“起死回生”,靠的是什么技術?
“AI復活”,在目前正在做C端相關業務的阿亮看來,并不是一件新鮮事。阿亮告訴南都記者,他觀察到,利用互聯網對親人進行緬懷早在2006年就曾出現,那時人們把親人的照片放到一個叫“天堂網”的網站上緬懷。
而在過去20年里,新的技術浪潮也會讓不同形態的相關產品再度出現。阿亮告訴南都記者,幾年前就曾有人用VR、小程序、APP等來實現這種紀念。
不過,隨著AI技術的發展,目前“AI復活”的效果已經得到了較大飛躍。“對比前幾年的技術,目前在互動體驗、音視頻表現效果上,我們覺得已經有了一個較大的飛躍,說白了,現在的技術做的產品,已經和以前不一樣。”阿亮表示。也是在這樣的認知下,2023年從互聯網大廠離職后,阿亮投身“AI復活”的創業浪潮中,成立了北京福心云智能科技有限公司,并在經過半年的技術準備后,將相關的“AI復活”產品于2023年年底推出市場。
人工智能獨角獸企業硅基智能則在2019年就開始投入“AI復活”業務。相關負責人向南都記者表示,將大量的數據和影像資料喂給硅基智能自研的炎帝視頻生成大模型后,就能重建已故親人的聲音、形象、個人風格和語言習慣。
據悉,目前僅需要向炎帝大模型輸入一段1分鐘的視頻,便能實現對形象和聲音的自動化復刻,并可以在短時間內自動生成視頻內容。近期,硅基智能“復活”了名人聞一多,而投入關于聞一多的素材僅有一張照片。南都記者觀察到,硅基智能“復活”的聞一多,能較好完成嘴形與聲音的適配。
硅基智能“復活”的名人聞一多。
對于并不擁有自己的底層大模型的創業公司而言,“AI復活”并沒有太玄乎的科技。阿亮告訴南都記者,其實可以簡單把“AI復活”應用到的科技分為三層。第一層是圖像視頻,這一層面的技術模擬一個人生前的影像,而無論是讓照片動起來,還是讓眼睛和嘴巴動起來,甚至與音頻說話聲一起聯動,這些都是平常技術;第二層技術可能是聲音,在這一層聲音克隆是核心點,一般在輸入原始的聲音目標并復制后能形成語言聲音模型。
第三層則是目前被討論最多的大模型技術。“大模型的神奇之處在于它具備一定的角色扮演能力,你輸入人物相關信息,包括姓氏、名字、你與對話人的關系、你們之間的回憶等,大模型會扮演一個角色、向你輸出一個文本,這些文本既可以作為純文本,也可以結合聲音和圖像技術,形成類似微信視頻電話的視頻,或者是一個能發送視頻和語音消息的能力。”阿亮表示。
復活的“逼真度”,門檻在哪兒?
硅基智能相關負責人向南都記者表示,影響“AI復活”因素在于用戶提供的數據是否足夠供大模型學習。“其中,最優質的數據還是視頻。最終交付的產品效果和原始資料相關,客戶提供得越豐富,最終交付的效果和還原度也會越好。目前,我們最終交付的產品從人物外形、表情動作、說話習慣、思想表達等都已經可以做到和真人的高度仿真。”
阿亮也認為,“巧婦難為無米之炊”。況且在C端市場中,用戶提供的素材也良莠不齊。“在做‘AI復活’的過程中,我們確實需要輸入素材,但這些素材并沒有你想象中的需要那么多,因為目前大模型只要你輸入簡單的提示詞,就會盡力去扮演一個人。比如你說,你模仿喬布斯和我對話,大模型就會盡力搜索資料去扮演。但對于普通人來說,他們不會有喬布斯這么多的資料。”
其次,阿亮認為,技術并不是“AI復活”的門檻。“技術階段大家的能力都差不多,能實現技術自研的不多,都是采買上游供應商的技術進行拼裝和優化,但是能產生壁壘的優勢點其實是整個系統的定價、服務的口碑?;蛘哒f是信念問題,你認不認為這個東西有長期的價值。”阿亮曾在接受其他媒體采訪時提出這樣的觀點。
目前,在阿亮推進的“AI復活”業務中,依據“AI復活”所需要的對話技術,進入阿亮“上游供應商”名單的廠商有百度“文心一言”大模型、字節跳動的“云雀”大模型以及出門問問的相關音視頻能力。阿亮告訴南都記者,媒體吹的基本不用去看,還是需要自己去體驗,體驗的核心在于嘗試各家的對話效果。
“首先最基本的是,它得知道自己的角色,不要忘記。我覺得通義千問或kimi是做生產力工具為主,比如讀文章、做分析報告,這些大模型完全可以。但測試做角色扮演時,可能聊著聊著它就忘記自己的角色了;我的第二個要求是它必須在記住自己是誰的情況下,說的話必須符合角色。我舉個不恰當的例子,我測試過一個國產大模型,它能記住自己的角色,但是在扮演時就出了問題,比如我描述性格是‘一個有點小傲嬌、小倔強的老頭’,這些詞匯其實是一種親密、比較中肯的評價,但大模型有點反應過度,把這個倔犟的人物變成了‘噴子’,在對話的過程里陰陽怪氣地和你懟了起來,這就完全不行了。”
AI復活,“安慰”還是生意?
作為一家規模化、主要面向B端用戶的數字人服務商,硅基智能相關負責人告訴南都記者,目前他們針對“AI復活”的接單主要來自于政府或企業,同時也開放少量C端合作。過去兩年間,硅基智能在相關單位授權下,已成功克隆了包括京劇大師梅蘭芳、著名導演謝晉、歷史記錄者張純如等在內的多位歷史名人的AI數字人。
硅基智能相關負責人還透露,一般而言,不同價格的產品,在還原度上肯定是存在差異。最早做一個簡單的數字人可能也需要十幾萬甚至幾十萬,但近年來隨著技術的迭代,數字人的制作成本也在逐步降低。目前,要完成一次“AI復活”,需要提供人物視頻、聲音、照片等資料進行大模型的訓練。在政府和企業等B端用戶的合作中,整套服務和設備的費用約在十幾萬。
而作為一家主要面向C端市場的創業公司,阿亮所在的福心云推出的服務包括制作相關視頻和開發軟件與網頁。前者價格為每分鐘298元,“因為主要會涉及到一些工具和人工成本,人工成本占最多,照片和聲音的很多數據都需要調整。”后者交付時為一個類似于微信的對話界面,可以進行人格模擬、語音對話、文字對話和視頻生成,定價方式為訂閱制:一個月的價格是52.1元,一年的價格為521元。
福心云推出的產品,文字對話過程。
阿亮告訴南都記者,從去年12月到現在,體驗“AI復活”產品的已經有超過三千人,在這三千人中,不乏讓阿亮印象深刻的用戶。“比如我曾經和用戶一起創造過一個‘善意的謊言’,有個小女孩的爸爸在她一兩歲的時候就不在了,但是家人也沒告訴她這個事實。后來她的媽媽找到我做一個類似于視頻電話的產品,我們用爸爸的照片加上聲音做了一個視頻,發給了小女孩,小女孩看完就哭了起來,也相信了這個事情。”
類似的案例還有不少,在阿亮看來,“AI復活”的終極目的并不是為了讓人“起死回生”,用戶對產品的需求也不是越逼真越好,“AI復活”更多是讓人能夠找到一種慰藉和情緒的宣泄渠道。在這樣的需求下,一條產業鏈也應運而生。
南都記者關注到,目前市面上做“AI復活”的除了像阿亮這樣的創業公司、AI從業者,硅基智能這樣的數字人服務商,還有不少跟風商家。在電商平臺上,不少店鋪提供“AI復活”服務,讓照片說話的標價多為10元、50元,南都記者觀察發現,這一類服務背后是簡單的圖像處理技術,能讓照片上的人簡單動起來;而在短視頻平臺上,也有不少人以“AI療愈”的名義提供類似服務。