近日,Open AI正式推出最新旗艦模型GPT-4o(o代表Omni,全能)。
GPT-4o作為最新旗艦模型,可以實時對音頻、視覺、文本進行推理,支持文本、音頻和圖像的任意組合輸入,并能生成文本、音頻和圖像的任意組合輸出。其在多語言、音頻和視覺能力方面相較前代也有所提升。
在發布會現場,GPT-4o講述了一個關于機器人與愛情的故事,在這個過程中,GPT-4o不斷挑戰用更加情緒化、戲劇化的方式進行朗讀,用戶可以明顯感受到其中情感與音色的變化。
Sam Altman在社交媒體上
留下一句“her”。
科幻電影《Her》似乎已走進現實。
站在“Her”來臨的當下,
AI底層技術有哪些趨勢或方向?
邱鋰力
微軟亞洲研究院副院長
微軟亞洲研究院(上海)負責人
最關鍵的不再是掌握復雜的技術細節,而是依賴于你的想象力和目標設定。大模型可以幫助我們處理許多具體的技術問題。
@上??萍?/p>
站在這個時間節點,您覺得AI底層技術有哪些趨勢或方向?
@邱鋰力
AI的應用已經涵蓋了生活的各個方面,我們特別關注以下三個方向:
一是效率。目前AI的訓練和使用成本仍然較高,我們正在不同層面上努力提升效率,包括從引擎到平臺,再到實際應用的各個環節。
二是多模態。AI技術已經能處理不同的數據模態,如文本、圖片、視頻和語音。然而,要支持醫療等特定應用,我們還需處理更多如生理信號、無線感知技術(包括WiFi、毫米波和激光雷達)等不同于傳統模態的數據。我們致力于更好地支持這些新模態,并探索如何將它們與傳統模態結合,這一領域有巨大的發展潛力。
三是應用。盡管大模型的能力非常強大,但要將它們應用到具體行業中,仍面臨許多新的問題和挑戰。在解決這些問題的同時,也帶來了很多機遇。
@上??萍?/p>
在未來的人才引進策略上,微軟亞洲研究院(上海)有哪些計劃?目前團隊的年齡結構是怎樣的?
@邱鋰力
我們的團隊非常年輕,我們在持續招聘全職研究員和實習生。上海是一個國際化的平臺,比較容易吸引來自全球各地的人才。最近,我們還吸引了兩位跨學科的人才。一位是醫學專業畢業的創業者,他曾開發過應用于醫療領域的AI技術,所以在我們討論醫療項目時貢獻了很多寶貴意見,碰撞出很多火花,我們在醫療方面也有很多新的研究方向正在推動中。另一位是神經科學家,他有理論物理的背景,對AI非常熟悉。我們認為,許多前沿技術的發展需要跨學科和跨領域的合作。