中國信通院啟動AI大模型幻覺評測,總體涉及五種測試維度

發(fā)布日期：2025-03-21

166 次

3 月 19 日消息，IT之家從中國信通院官方微信公眾號獲悉，為摸清大模型的幻覺現(xiàn)狀，推動大模型應(yīng)用走深走實(shí)，中國信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測評工作，發(fā)起大模型幻覺測試。

大模型幻覺（AI Hallucination）是指模型在生成內(nèi)容或回答問題時(shí)，產(chǎn)生了看似合理，實(shí)則與用戶輸入不一致（忠實(shí)性幻覺）或者不符合事實(shí)（事實(shí)性幻覺）的內(nèi)容。隨著大模型在醫(yī)療、金融等關(guān)鍵領(lǐng)域廣泛應(yīng)用，大模型幻覺帶來的潛在應(yīng)用風(fēng)險(xiǎn)日益加劇，正得到業(yè)界的廣泛關(guān)注。

本輪幻覺測試工作將以大語言模型為測試對象，涵蓋了事實(shí)性幻覺和忠實(shí)性幻覺兩種幻覺類型，具體測評體系如下：

測試數(shù)據(jù)包含 7000 余條中文測試樣本，測試形式包括對應(yīng)于忠實(shí)性幻覺檢測的信息抽取與知識推理兩類題型，以及對應(yīng)事實(shí)性幻覺檢測的事實(shí)判別題型?？傮w涉及人文科學(xué)、社會科學(xué)、自然科學(xué)、應(yīng)用科學(xué)和形式科學(xué)五種測試維度。

中國信通院邀請各相關(guān)企業(yè)參與模型測評，共同推動大模型安全應(yīng)用。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：020-2204 2442,郵箱：[email protected]。

上一篇: 我國科學(xué)家攻克超低溫量子接口技術(shù)
下一篇: 深度剖析柵極驅(qū)動器IC在半橋拓?fù)潆娫崔D(zhuǎn)換中的選型指南與隔離設(shè)計(jì)

為您精選

神經(jīng)解碼革命：腦機(jī)接口技術(shù)開啟人機(jī)共融新時(shí)代

2025年4月10日，全球電子元器件供應(yīng)鏈領(lǐng)軍者貿(mào)澤電子（Mouser Electronics）正式發(fā)布《創(chuàng)新同行》（Empowering Innovation T···

更新日期：2025-04-10 220 次
AI芯片獨(dú)木難支！DISCO季度出貨額近一年首降，股價(jià)單日重挫14%跌穿兩年防···

全球半導(dǎo)體設(shè)備市場迎來分化信號。4月8日，日本晶圓切割龍頭DISCO披露2024財(cái)年第四財(cái)季（2025年1-3月）關(guān)鍵數(shù)據(jù)：非合并出貨···

更新日期：2025-04-10 192 次
北電數(shù)智政務(wù)大模型助力打造更加安全高效政務(wù)服務(wù)體系

當(dāng)前，人工智能技術(shù)正以破竹之勢推動政務(wù)服務(wù)體系數(shù)智化升級。IDC數(shù)據(jù)顯示，中國人工智能在政府領(lǐng)域的應(yīng)用滲透度已達(dá)52%，位···

更新日期：2025-03-06 399 次
華為發(fā)布新一代全閃分布式存儲業(yè)界最高密、最低功耗

3月4日消息，在昨日的巴塞羅那MWC25上，華為發(fā)布AI-Ready的數(shù)據(jù)存儲，助力運(yùn)營商全面擁抱AI時(shí)代。據(jù)官方介紹，AI-Ready的數(shù)據(jù)···

更新日期：2025-03-04 314 次
Marvell宣布推出首款2nm芯片,基于臺積電N2，支持AI XPU、交換機(jī)開發(fā)

3 月 4 日消息，Marvell美滿電子當(dāng)?shù)貢r(shí)間昨日公布了其首款2nmIP 驗(yàn)證芯片。該芯片采用臺積電N2 制程，是 Mavell 基于該節(jié)點(diǎn)開···

更新日期：2025-03-04 291 次

最新文章

中國版ASML新凱來估值已達(dá)110億美元

發(fā)布日期: 2025-05-19
人形機(jī)器人數(shù)量最終或達(dá)到數(shù)百億,行業(yè)2025年進(jìn)入量產(chǎn)元年

發(fā)布日期: 2025-05-19
AI時(shí)代軟件工程崗位成微軟裁員風(fēng)暴重災(zāi)區(qū)

發(fā)布日期: 2025-05-19
5個(gè)必備的FPGA設(shè)計(jì)小貼士

發(fā)布日期: 2025-05-19
法國最新研究將固態(tài)電池技術(shù)集成到晶圓級的3D封裝中

發(fā)布日期: 2025-05-19

關(guān)于綠測

廣州綠測電子科技有限公司（簡稱：綠測科技）成立于2015年11月，是一家專注于耕耘測試與測量行業(yè)的技術(shù)開發(fā)公司。綠測科技以“工程師的測試管家”的理念向廣大客戶提供專業(yè)的管家服務(wù)。綠測科技的研發(fā)部及工廠設(shè)立于廣州番禺區(qū)，隨著公司業(yè)務(wù)的發(fā)展，先后在廣西南寧、深圳、廣州南沙、香港等地設(shè)立了機(jī)構(gòu)。綠測科技經(jīng)過深耕測試與測量領(lǐng)域多年，組建了一支經(jīng)驗(yàn)豐富的團(tuán)隊(duì)，可為廣大客戶提供品質(zhì)過硬的產(chǎn)品及測試技術(shù)服務(wù)等支持。

查看詳情

應(yīng)用解決方案

產(chǎn)品與服務(wù)

新聞資訊

綠測工場服務(wù)號

綠測科技訂閱號

020-2204 2442

亚洲性爱在线影院_国产又爽又色又刺激视频_欧美日韩一区日本道_一本大道香蕉视频在线观看_中文字幕无码人妻系列按摩_亚洲中文精品免费看_国产成人亚洲欧综合_伦理大片在线观看_91香蕉黄色视频_国产精品一区二区不卡中文

新聞資訊

行業(yè)資訊

中國信通院啟動AI大模型幻覺評測,總體涉及五種測試維度

為您精選

熱門文章

Thread 邊界路由器迎來重大改變，讓···

緊湊型電源模塊推動汽車電氣化

日媒稱佳能光刻機(jī)業(yè)務(wù)東山再起挑戰(zhàn)···

臺積電美國工廠突發(fā)爆炸

傳美國將批準(zhǔn)英偉達(dá)向沙特出口最先···

自動駕駛技術(shù)普及仍需要邁過成本這···

中國信通院啟動AIGC “個(gè)人信息和用···

把航空和IT技術(shù)引入汽車，風(fēng)河OS為···

最新文章

中國版ASML新凱來估值已達(dá)110億美元

人形機(jī)器人數(shù)量最終或達(dá)到數(shù)百億,行業(yè)2025年進(jìn)入量產(chǎn)元年

AI時(shí)代軟件工程崗位成微軟裁員風(fēng)暴重災(zāi)區(qū)

5個(gè)必備的FPGA設(shè)計(jì)小貼士

法國最新研究將固態(tài)電池技術(shù)集成到晶圓級的3D封裝中

熱門標(biāo)簽

在線客服

微信在線咨詢

聯(lián)系電話

咨詢熱線

公眾號

微信掃一掃

回到頂部