欧美在线观看天堂一区二区三区_99re66热这里只有精品4_国产午夜亚洲精品不卡_欧美国产视频在线观看

首頁 > 活動線報 > 每日福利 > 如何減少AI“一本正經地胡謅”?新方法出現了

如何減少AI“一本正經地胡謅”?新方法出現了

發布時間:2024-06-25 16:51:54

人工智能(AI)中廣泛使用的大語言模型不時出現的“一本正經地胡謅”是其難以克服的問題。近日,英國牛津大學研究團隊開發出一種名為“語義熵”的新方法,有望大幅提升AI回答的可靠性。

大語言模型的“胡謅”在業界被稱為“幻覺”,牛津大學計算機科學系的研究人員提出“語義熵”方法試圖解決這一問題。在熱力學中,熵描述的是系統的混亂或者說不穩定程度。這項研究中,熵衡量了大語言模型回答的不確定性,不確定性高意味著大語言模型的回答可能存在虛構。

該研究成果已發表在近期出版的英國《自然》雜志上。論文中說,如果AI對同一個問題,給出了許多語義相似的答案,那說明它對自己的回答比較有把握;反之,如果答案五花八門,那就意味著AI自己也“心里沒底”,很可能是在“胡謅”。

研究人員利用“語義熵”方法,讓大語言模型對同一問題生成多個答案,然后將語義相近的答案聚類,最后根據聚類結果計算熵值。熵值越高,表示大語言模型的回答越不確定。

值得注意的是,這一方法不僅考慮了大語言模型回答的字面差異,更關注語義層面的一致性。這使得“語義熵”能夠更準確地識別AI的“胡謅”,而不會被表達方式的多樣性所迷惑。

研究結果表明,“語義熵”方法在多個數據集和任務中都表現出色,能有效檢測大語言模型的錯誤回答,并通過拒絕回答不確定的問題來提高整體準確率。更重要的是,這一方法無需修改AI模型本身,可以直接應用于現有的大語言模型。

研究人員說,“語義熵”技術有望在問答系統、文本生成、機器翻譯等多個領域發揮重要作用,幫助AI生成更可靠、更有價值的內容。這不僅將提升AI在實際應用中的表現,也將增強用戶對AI系統的信任。

每日福利更多>>

梅賽德斯-AMG GT XX概念車首發 搭載F1驅動技術 法系純電新旗艦,首次體驗DS N°8,這設計你能接受嗎? 瑪莎拉蒂GranTurismo:收放自如的生活方式 本田日產又搞一塊兒了,這回是真的? AMG GT XX概念車炸場!1360馬力+5分鐘充400公里 10萬出頭個性SUV推薦,方程豹鈦3還是iCAR V23?你屬于哪類人? 科尼賽克發布全新Sadair\'s Spear,推重比超越One:1的賽道超跑 年輕人第一臺性能車新解:當法拉利 Roma Spider 遇上意式浪漫 10.98萬元起,最高續航545公里,比亞迪海豹06EV北京區域上市 鴻蒙智行周銷量5連破萬,穩坐新勢力榜首,問界扛大旗,享界起飛 實測夠好,經濟實用還能國補:這份手機電腦平板好物清單請收好! 索尼回應Switch 2競爭:PS5級性能是大屏幕優質體驗的必要條件 紅米首臺小平板來了!王騰:全面超越iPad mini 真我開始全力出擊,驍龍8至尊+6500mAh+120W,618期間跌至2464元 尹同躍、李書福視頻連線,金句頻出 細節調整 新款歐拉好貓GT官圖發布 為家庭幸福選擇!深藍S09和領克900,誰更值得? 深藍S09重慶車展交卷:訂單火爆背后的“家庭平權”革命 標致e-208GTi上市時間確定!定位兩廂電動小鋼炮 終結第三排“歧視”!深藍S09打響家人出行平權戰 寶馬和奔馳的電車跑得比EPA預估里程更遠 5月新能源車銷量TOP20:吉利14萬輛再創新高,特斯拉、埃安同比大降 四驅穿越版上市售30.98萬,福特探險者家族全系四驅,覆蓋5/6/7座 長安福特探險者四驅穿越版上市,車長5063mm,5座,搭載2.3T動力 吉利銀河A7 EM-i,饋電油耗2L級,續航2100km+ 一眼分辨雷達金剛EM-P與地平線EM-P,這些細節別錯過! 比亞迪海豹06EV于重慶車展上市!售價區間為10.98-12.98萬元 新一代大眾速騰實車曝光,全新設計風格,車身加長21mm,1.5T動力 大改款Q3將于夏季量產,匈牙利工廠完成第 100 萬輛生產 2025年5月新勢力銷量排名!
主站蜘蛛池模板: 呼和浩特市| 灯塔市| 虎林市| 辽宁省| 中卫市| 宜兴市| 遵化市| 元氏县| 德保县| 大竹县| 浙江省| 昌江| 崇仁县| 房产| 荣昌县| 云林县| 钦州市| 会宁县| 宁陵县| 永仁县| 紫云| 东乌珠穆沁旗| 忻城县| 兴仁县| 蓬溪县| 宁夏| 华亭县| 股票| 行唐县| 丹江口市| 喜德县| 新安县| 贵溪市| 白水县| 恩平市| 怀远县| 丹凤县| 西畴县| 福鼎市| 西和县| 巴林左旗|