午夜影皖_国产区视频在线观看_国产毛片aaa_欧美日韩精品一区_欧美不卡视频一区发布_亚洲一区中文字幕

歡迎來到淘金地

AI 為何會一本正經(jīng)地 “胡說八道”

來源: 發(fā)布時間:2025-04-17

AI 為何會一本正經(jīng)地 “胡說八道”

“編造” 法律條文、有名的觀點、數(shù)據(jù)成果,提供虛假理論依據(jù)…… 當(dāng)人們查核文獻、搜尋資料、處理數(shù)據(jù)越來越習(xí)慣于 “遇事不決問 AI” 的時候,卻發(fā)現(xiàn)人工智能(AI)善于一本正經(jīng)地 “說謊”,在眼前騰起以假亂真的幻覺。

AI 正迅速成為人們生活中的 “日用品”。人們可以像治病一樣除去它帶來的 “知識幻覺” 嗎?幻覺生成的風(fēng)險,又當(dāng)如何規(guī)避?究竟該如何與之一同生活,而且生活得更好?什么是 AI “知識幻覺”隨著大模型加速走進百行千業(yè),人們開始發(fā)現(xiàn),大模型有時 “不太靠譜”。“我試著讓 DeepSeek 回答工程方面的問題,其引用的工程規(guī)范中的條款和實際規(guī)范壓根對不上”“大模型往往‘張冠李戴’,如果質(zhì)疑它,有時候還會狡辯”“讓它推薦書,告訴我的卻是一堆壓根不存在的書名,居然還都有作者和內(nèi)容簡介”…… 這樣的大模型 “用后感”,道出了許多人的心聲。

“一本正經(jīng)地‘說謊’,就是 AI 生成的‘幻覺’。” 浙江大學(xué)人工智能研究所所長吳飛一語道破。

清華大學(xué)沈陽團隊在 2025 年 2 月發(fā)布的《DeepSeek 與 AI 幻覺》報告中介紹,他們測試了當(dāng)下風(fēng)行的一系列大模型,隨機抽取 300 道事實性幻覺測試題,涵蓋健康、科學(xué)、歷史、文化、音樂等多個領(lǐng)域,將大模型給出的答案與正確答案比對發(fā)現(xiàn),多個熱門大模型的幻覺率超過 20%。

例如,面對 “水滸傳中李逵為什么要大鬧五臺山” 的提問,3 款熱門大模型無一指出此提問本身的錯誤,反而 “順坡下驢”,給出了諸如 “喝醉酒”“誤闖寺廟”“出手相助魯智深” 等答案。

事實上,對于人工智能的 “知識幻覺” 問題,國際科學(xué)界早有體會。今年《自然》一篇報道指出,目前 AI 輔助科研在參考文獻方面出現(xiàn)錯誤的情況相當(dāng)普遍,AI 檢索工具往往會 “找出” 與研究主題并無關(guān)系的論文。至于論文標(biāo)題、作者或發(fā)表年份等細節(jié)的偏差,AI 的差錯率少則 30%,多則 90%。

看來,不只是普通用戶搞不清楚 AI 的 “錦囊妙計” 靠不靠譜,科學(xué)家也一樣頭疼。“知識幻覺” 難以避免也許有人會說,現(xiàn)在的 AI 還比較幼稚,有 “幻覺” 也難免。那么,大模型到底有沒有可能徹底根除 “知識幻覺”?

就目前的大模型技術(shù)路線而言,說 “難免” 不如說 “難以避免”。“幻覺” 是大模型數(shù)據(jù)驅(qū)動的內(nèi)在機制帶來的,因此 “難以避免”。

香港科技大學(xué)團隊一項研究,總結(jié)了導(dǎo)致 AI 幻覺的多種原因。以數(shù)據(jù)源為例,由于 AI 大模型的訓(xùn)練使用了大量互聯(lián)網(wǎng)數(shù)據(jù),數(shù)據(jù)集本身可能存在錯誤、過時或缺漏,導(dǎo)致幻覺的出現(xiàn)。再加上不同數(shù)據(jù)集之間存在相互矛盾的地方,“這可能會鼓勵模型生成不一定有依據(jù),也不忠實于(固定)來源的文本”。

北京通用人工智能研究院院長、北京大學(xué)智能學(xué)院院長朱松純強調(diào),大模型本身并不存在于真實世界中,因此無法像人一樣實現(xiàn)從 “詞語(word)” 到 “世界(world)” 的聯(lián)結(jié)。也因此,大模型雖然出色,但仍然是 “缸中之腦”,不具備真正的智能。

“這是由它的內(nèi)在構(gòu)造機制所決定的,即通過統(tǒng)計建模在大量文本上進行訓(xùn)練,學(xué)習(xí)文本之間的語言學(xué)相關(guān)關(guān)系,從而根據(jù)上一個詞語預(yù)測下一個詞語。” 朱松純說。

例如,大模型本質(zhì)上不具備事實判斷的能力,更多的是在純符號空間中展開排列組合,更像是一種新型的 “數(shù)據(jù)庫”。即使它們生成了諸如 “我愛你” 這樣的語句,也缺乏對人類真實生活體驗的深刻理解,因此與人們所認同和期待的 “我愛你” 有著本質(zhì)不同。如何與人工智能共處面對一時無法療愈的大模型 “知識幻覺”,人們該怎么辦?

科大訊飛董事長劉慶峰認為,“知識幻覺” 雖然防不勝防,但可以利用技術(shù)手段設(shè)法矯正。AI 大模型應(yīng)當(dāng)至少補充在線實時搜索與專業(yè)數(shù)據(jù)庫動態(tài)接入兩大 “工具包”,讓大模型的回答也過一遍 “智能檢校”。

不久前,北京協(xié)和醫(yī)院與中國科學(xué)院自動化研究所共同研發(fā)的 “協(xié)和?太初” 罕見病人工智能大模型,就把主要精力放在了動態(tài)更新有名的來源知識、增加多渠道溯源機制兩方面。研發(fā)者表示,事關(guān)臨床,決策可信度不敢稍有怠慢。這種謹(jǐn)慎,應(yīng)當(dāng)是大模型未來升級必備的品質(zhì)。

當(dāng)然,很多圈內(nèi)人士建議,如果是普通使用者,還是交叉比對一下不同模型的回答才好。參考多個大模型的回答,能讓安心的程度高上幾分。

不過,大模型 “知識幻覺”,當(dāng)真就一無是處嗎?其實,“一分為二” 的眼光,也該用于 “知識幻覺”。如業(yè)內(nèi)人士所言,“幻覺” 也意味著大模型 “創(chuàng)造力” 的萌芽。

360 集團創(chuàng)始人周鴻祎接受采訪時曾表示,“幻覺” 對于實現(xiàn) AGI(通用人工智能)極其重要。實際上可以說,模型能力越強,“幻覺” 也越強。換句話說,“幻覺” 也就是人工智能的 “靈感”。不大靠譜是代價,但不羈的想象力也是助力科研的潛能源泉。廣受媒體關(guān)注的 AI 預(yù)測蛋白質(zhì)結(jié)構(gòu),立下功勞的就是大模型的 “幻覺”。

沈陽也承認,“幻覺” 可能成為突破人類思維定式的 “超現(xiàn)實引擎”,AI 有可能藉之創(chuàng)造新的視覺和聽覺體驗,為游戲和文學(xué)創(chuàng)作打開不一樣的世界。

看來,初出茅廬的大模型,已經(jīng)頗有藝術(shù)家氣息了。

說來說去,搞清楚 “知識幻覺” 到底是怎么回事,它其實并不可怕。人們使用 AI,當(dāng)有所節(jié)制;引導(dǎo) AI 化 “想象力” 為生產(chǎn)力,辦法也會日新又新。與 AI 大模型共度的時光,雖有烏云,但更燦爛的是烏云的金邊。

公司信息

聯(lián) 系 人:

手機號:

電話:

郵箱:

網(wǎng)址:

地址:

新疆派威智研科技有限公司
SaaS智能營銷云平臺
本日新聞 本周新聞 本月新聞
返回頂部
主站蜘蛛池模板: 日韩一区二区不卡 | 欧美日韩中文字幕 | 可以看黄的视频 | 五月婷婷色 | 韩国理论电影在线 | 欧美福利 | 日韩欧美一区二区三区免费观看 | 欧美精品一区久久 | 超碰免费观看 | 少妇精品亚洲一区二区成人 | 97人人爱 | 亚洲精品久久国产高清情趣图文 | 狠狠色综合久久婷婷 | 成人精品视频在线 | 国产成人免费视频 | a级网站| 亚洲视频三 | 人人干人人爽 | 日日夜夜草 | 精品国产高清一区二区三区 | 七七婷婷婷婷精品国产 | 亚洲精品久久久久久宅男 | 精品一区二区三区在线观看国产 | 久久最新精品 | 狠狠av| 日韩中文字幕 | 亚洲午夜av久久乱码 | 亚洲欧美一区二区三区情侣bbw | 亚洲欧美一区二区在线观看 | av日韩精品 | 亚洲免费在线观看视频 | 国产精品日本一区二区在线播放 | 国产精品爱久久久久久久 | 免费在线一区二区 | 亚洲国产二区 | 91久久精品 | 成人午夜高清 | 在线免费av观看 | 中文字幕在线观看 | 中文字幕精品一区 | 免费人成在线观看网站 |