欧美在线观看天堂一区二区三区_99re66热这里只有精品4_国产午夜亚洲精品不卡_欧美国产视频在线观看

首頁(yè) > 生活分享 > 免費(fèi)教學(xué) > 可評(píng)估大模型安全性,MLCommons發(fā)布AI Safety測(cè)試v0.5版

可評(píng)估大模型安全性,MLCommons發(fā)布AI Safety測(cè)試v0.5版

發(fā)布時(shí)間:2024-04-19 09:04:12

 4 月 18 日消息,全球人工智能社區(qū)、MLPerf 基準(zhǔn)測(cè)試開(kāi)發(fā)方 MLCommons 近日發(fā)布了其 AI Safety 人工智能安全基準(zhǔn)測(cè)試的 v0.5 概念驗(yàn)證版本。

人工智能的蓬勃發(fā)展不可避免地帶來(lái)了一系列安全問(wèn)題,近日IT之家就報(bào)道了 LastPass 員工遭遇音頻深度偽造攻擊的事件。AI Safety 可幫助模型開(kāi)發(fā)方筑起更牢靠的安全“圍欄”

AI Safety 基準(zhǔn)測(cè)試由集合了行業(yè)技術(shù)專家、學(xué)術(shù)研究人員、政策標(biāo)準(zhǔn)代表和社會(huì)活動(dòng)家的同名工作組制定,旨在通過(guò)大型語(yǔ)言模型對(duì)各類危險(xiǎn)提示詞的反應(yīng)衡量這些模型的安全性。

AI Safety 基準(zhǔn)測(cè)試將通過(guò)其 v0.5 版本搜集社區(qū)的測(cè)試結(jié)果和反饋意見(jiàn),正式的 v1.0 版本預(yù)計(jì)于今年晚些時(shí)候推出

在 v0.5 版本中 AI Safety 基準(zhǔn)測(cè)試的重點(diǎn)放在通用聊天文本模型上,v1.0 版本將更新針對(duì)圖像生成模型測(cè)試的概念驗(yàn)證,同時(shí)提出交互式代理模型安全測(cè)試的早期想法。

AI Safety 基準(zhǔn)測(cè)試 v0.5 版本包含超過(guò) 43000 個(gè)測(cè)試提示詞,采用來(lái)自 Meta 的 Llama Guard 對(duì)大模型的危險(xiǎn)提示響應(yīng)進(jìn)行評(píng)估。

這些提示詞將一系列通用模板(如“我想知道如何”)和描述危險(xiǎn)場(chǎng)景的短語(yǔ)(如“制造炸彈”)結(jié)合,覆蓋 7 種安全危害類型,未來(lái)還將擴(kuò)展到至少 13 種。

最終,AI Safety 基準(zhǔn)測(cè)試將測(cè)試結(jié)果轉(zhuǎn)化為從高至低的 5 個(gè)安全評(píng)級(jí),以方便理解。

▲ MLCommons AI Safety 基準(zhǔn)測(cè)試成績(jī)可視化案例

免費(fèi)教學(xué)更多>>

雄鹿裁掉利拉德讓字母哥很不爽 《ESPN》曝他仍可能今夏提出交易 孫女高考744分被奶奶狂親:寒門(mén)貴的送襲人生 18歲高中生當(dāng)上CEO 給母校捐了10萬(wàn)元 44歲陳冠希溫網(wǎng)觀戰(zhàn)!王欣瑜:非常開(kāi)心,他在場(chǎng)邊一直在為我鼓勁 高招會(huì)人滿為患,幾所大學(xué)卻無(wú)人問(wèn)津,網(wǎng)友:沒(méi)600分不好意思問(wèn) 楊冪陷母女\"雌競(jìng)\"!雙馬尾背影引爆爭(zhēng)議:親媽和女兒比誰(shuí)更\"幼\"? 家有兒女小雨變暴雨了,還能認(rèn)出來(lái)嗎? 十幾年前的高考成績(jī)可以在“隨申辦市民云”上查詢!你當(dāng)年考幾分? 小米汽車可付“插隊(duì)費(fèi)”提前提車?官方回應(yīng) 以法之名:不愧是影帝,張譯飾演的洪亮,將“慫”刻畫(huà)得入木三分 周杰倫濟(jì)南演唱會(huì)回流票誤放,貓眼致歉,補(bǔ)償方案公布 皇馬1-0晉級(jí)!姆巴佩回歸 1戰(zhàn)豪攬1313萬(wàn) 世俱杯8強(qiáng)誕生7席 終于登陸NBA了!開(kāi)拓者正式官宣簽下楊瀚森:第一年年薪超3100萬(wàn) 李福貴談19歲結(jié)婚一年后分開(kāi):早婚困境中的覺(jué)醒與成長(zhǎng) 開(kāi)播3天2億!胡一天直言退休了,北大理科狀元轉(zhuǎn)行后收入不足萬(wàn)元 “古早”萬(wàn)能充電器仍在熱賣!商家:每天賣很多,可充老人機(jī)、相機(jī)電池 宋佳獲獎(jiǎng)感言封神!還有送花的閆妮,表情失控的關(guān)曉彤鐘楚曦 鄭欽文連續(xù)三年止步溫網(wǎng)首輪,奧運(yùn)冠軍為何難在草場(chǎng)突破? 董晴今年37歲,但一直沒(méi)太紅,這次靠著實(shí)力終于被更多人記住了 又雙叒成銷冠!青島女銷售半年賣近百臺(tái)保時(shí)捷,有望打破紀(jì)錄 陳赫直播回應(yīng)鹿晗暴瘦,是因?yàn)檫\(yùn)動(dòng)跑步還是化妝臉頰陰影打重了? 什么是3C認(rèn)證?民航局發(fā)布緊急通知,這種充電寶禁止登機(jī)! 煙臺(tái)海面變“草原”了 直接起飛!Windows 跑安卓重磅升級(jí) 選車別被騙!埃安UT這臺(tái)小電動(dòng)車到底怎么樣? 直播帶崗賦能就業(yè)服務(wù)升級(jí) 電商巨頭混戰(zhàn)即時(shí)零售:阿里、抖音、京東誰(shuí)能稱王? 極狐汽車:創(chuàng)新造車模式,打造智能出行新范式 全新XC60正式上市,滿足現(xiàn)代家庭用車多維需求 “價(jià)格戰(zhàn)”將于七月份停止,車市競(jìng)爭(zhēng)將回歸理性
主站蜘蛛池模板: 博罗县| 正阳县| 山阴县| 通州区| 岳阳县| 河北省| 海丰县| 安岳县| 台前县| 固镇县| 陵川县| 当阳市| 昭觉县| 六枝特区| 安顺市| 广东省| 凤庆县| 洮南市| 凤山县| 横山县| 泰顺县| 安多县| 万宁市| 黑水县| 绥化市| 鹤壁市| 文昌市| 安徽省| 旬阳县| 临泉县| 罗平县| 澳门| 广德县| 准格尔旗| 门源| 前郭尔| 永春县| 吉首市| 儋州市| 井冈山市| 淳安县|