【財(cái)新網(wǎng)】隨著人工智能技術(shù)的發(fā)展,AI幻覺(jué)問(wèn)題也日益受到關(guān)注。2025年兩會(huì)期間,全國(guó)人大代表、國(guó)內(nèi)人工智能企業(yè)科大訊飛的董事長(zhǎng)劉慶峰建議,應(yīng)預(yù)防大模型生成“幻覺(jué)數(shù)據(jù)”充斥互聯(lián)網(wǎng)帶來(lái)的危害,從技術(shù)研發(fā)和管理機(jī)制上構(gòu)建可信的信息環(huán)境。
AI幻覺(jué)(AI Hallucinations)指的是大模型時(shí)常胡編亂造,而且有時(shí)候編得足以以假亂真,或者出現(xiàn)“AI 運(yùn)算偏差”,產(chǎn)生與真實(shí)世界不一致的內(nèi)容。
一項(xiàng)最近更新于2月11日的測(cè)評(píng)顯示,DeepSeek R1的幻覺(jué)率為14.3%(平均總結(jié)長(zhǎng)度77.1個(gè)詞),相對(duì)較高,DeepSeek -V3的幻覺(jué)率則為3.9%(平均總結(jié)長(zhǎng)度88.2個(gè)詞)。測(cè)評(píng)的所有模型中,表現(xiàn)最佳的是Google Gemini -2.0- Flash -001,幻覺(jué)率只有0.7%(平均總結(jié)長(zhǎng)度65.2個(gè)詞)。同樣是國(guó)產(chǎn)模型的智譜Zhipu AI GLM -4-9B- Chat 幻覺(jué)率為1.3%(平均總結(jié)長(zhǎng)度58.1個(gè)詞),GPT -4o的幻覺(jué)率則為1.5%(平均總結(jié)長(zhǎng)度77.8個(gè)詞)。