7月24日 字節跳動今日正式推出端到端同聲傳譯模型Seed LiveInterpret 2.0。該模型主打中英雙向互譯,其翻譯準確率與響應延遲均接近專業人類同傳譯員水平。
Seed LiveInterpret 2.0基于全雙工語音生成理解框架,能夠實時處理語音輸入并幾乎同步輸出目標語言翻譯。
官網展示Seed LiveInterpret 2.0使用過程
該模型實現了平均2-3秒的語音到語音延遲,具備實時模仿不同說話人音色以保留身份特征的能力,并支持對上下文、文化背景及包括繞口令、詩詞、美食文化在內的復雜表達的理解與互譯。
模型測評顯示,在語音到文本同傳任務中,其中英互譯質量評分為74.8(滿分100),領先第二名系統58個百分點。在更難的語音到語音任務中(業界僅3家支持),其綜合質量得分達66.3分,同樣遠超基準系統。同時,該模型在語音到文本和語音到語音場景下的首字/首音輸出延遲分別僅為2.21秒和2.53秒。