AI 新聞錯誤率近 5 成:Gemini 錯最多,ChatGPT 誤報教宗仍在世

歐洲廣播聯盟 (EBU) 與英國 BBC 聯合發布最新國際研究指出,目前主流 AI 助理在回應新聞相關問題時,有近半數 (45%) 內容出現重大錯誤,且高達 81% 的回答存在不同程度的問題。
主流模型成研究對象,並從三大面向著手
這項研究涵蓋 14 種語言、3,000 筆 AI 助手對新聞問題的回覆。受測對象包括多款主流 AI 助手,像 ChatGPT、Copilot、Gemini 與 Perplexity。研究團隊檢視每項回覆的三大面向:
-
內容準確度。
-
資料來源標註是否正確。
-
能否區分「事實」與「意見」。
近半數 AI 回答出錯,Gemini 錯誤率第一
結果顯示,AI 助手在回答新聞問題時,有 45% 的回覆出現明顯錯誤,像是提供誤導資訊、引用錯誤內容,或使用過時資料。整體來看,有高達 81% 的回答多少都有問題,只是嚴重程度不同。
其中,約三成的回覆在「來源標註」上出錯,可能是沒標明出處、引用了不準確的資料,或標記錯誤來源。
在所有受測 AI 助手中,Google 的 Gemini 表現最差,有 72% 的回答出現重大來源問題,遠高於其他助手 (大多在 25% 以下)。
另外,約 20% 的回覆在「內容正確性」上出錯,常見問題是回答用了過期或不正確的資訊。
Gemini 誤報法規,ChatGPT 誤稱教宗仍在世
研究舉出數個具體例子:
-
Gemini 曾誤報「一次性電子菸法規」的修法內容。
-
ChatGPT 在受測時仍回答「教宗方濟各在世」,儘管他已於數月前過世。
很明顯,AI 模型在處理時事新聞時,仍存在延遲與資料來源不足的問題。
對此,Google 已在官網上表示歡迎用戶提供回饋,持續改善平台品質。OpenAI 與 Microsoft 先前皆坦言有「AI 幻覺」問題仍待解決,原因包括資料不足與模型判斷錯誤。Perplexity 宣稱自家「深度搜尋模式」在事實正確率方面可達 93.9%。
EBU 警告:信任危機恐影響民主參與
EBU 表示,隨著 AI 助理逐漸取代搜尋引擎成為新聞來源,民眾如果無法辨別真假資訊,最終可能選擇「不再相信任何東西,進而削弱民主參與。
EBU 也呼籲 AI 業者應被納入「新聞責任體系」,確保在處理新聞相關問題時能提供可驗證的來源、準確事實、清楚區分評論與事實的能力。
這篇文章 AI 新聞錯誤率近 5 成:Gemini 錯最多,ChatGPT 誤報教宗仍在世 最早出現於 鏈新聞 ABMedia。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
Web3 遇見電信:Degenphone 如何將手機號碼轉化為用戶擁有的數位資產
簡單來說 探索 Degenphone:一個將真實手機號碼轉換為可交易號碼的平台 NFT 資產,實現用戶擁有的、以隱私為中心的電信服務。

Bitget 錢包整合 Plasma 跨鏈橋,擴展低成本穩定幣轉帳的管道
簡單來說 Bitget Wallet 擴展了其 Plasma 主網整合和跨鏈功能,使用戶能夠在多個區塊鏈上安全地交易和存取以穩定幣為中心的 DApp,同時簡化交易費用。

渣打銀行分析師:比特幣跌破 10 萬鎂難避免,把握最後抄底良機
特斯拉第三季比特幣持倉未變動,帳面獲利 8000 萬美元
加密貨幣價格
更多








