AI 新聞錯誤率近 5 成：Gemini 錯最多，ChatGPT 誤報教宗仍在世

Abmedia2025/10/22 01:46

作者:Louis Lin

歐洲廣播聯盟 (EBU) 與英國 BBC 聯合發布最新國際研究指出，目前主流 AI 助理在回應新聞相關問題時，有近半數 (45%) 內容出現重大錯誤，且高達 81% 的回答存在不同程度的問題。

主流模型成研究對象，並從三大面向著手

這項研究涵蓋 14 種語言、3,000 筆 AI 助手對新聞問題的回覆。受測對象包括多款主流 AI 助手，像 ChatGPT、Copilot、Gemini 與 Perplexity。研究團隊檢視每項回覆的三大面向：

結果顯示，AI 助手在回答新聞問題時，有 45% 的回覆出現明顯錯誤，像是提供誤導資訊、引用錯誤內容，或使用過時資料。整體來看，有高達 81% 的回答多少都有問題，只是嚴重程度不同。

其中，約三成的回覆在「來源標註」上出錯，可能是沒標明出處、引用了不準確的資料，或標記錯誤來源。

在所有受測 AI 助手中，Google 的 Gemini 表現最差，有 72% 的回答出現重大來源問題，遠高於其他助手 (大多在 25% 以下)。

另外，約 20% 的回覆在「內容正確性」上出錯，常見問題是回答用了過期或不正確的資訊。

研究舉出數個具體例子：

很明顯，AI 模型在處理時事新聞時，仍存在延遲與資料來源不足的問題。

對此，Google 已在官網上表示歡迎用戶提供回饋，持續改善平台品質。OpenAI 與 Microsoft 先前皆坦言有「AI 幻覺」問題仍待解決，原因包括資料不足與模型判斷錯誤。Perplexity 宣稱自家「深度搜尋模式」在事實正確率方面可達 93.9%。

EBU 表示，隨著 AI 助理逐漸取代搜尋引擎成為新聞來源，民眾如果無法辨別真假資訊，最終可能選擇「不再相信任何東西，進而削弱民主參與。

EBU 也呼籲 AI 業者應被納入「新聞責任體系」，確保在處理新聞相關問題時能提供可驗證的來源、準確事實、清楚區分評論與事實的能力。

免責聲明：文章中的所有內容僅代表作者的觀點，與本平台無關。用戶不應以本文作為投資決策的參考。

Glassnode：比特幣弱勢震盪，大波動將至？

如果賣家枯竭跡象開始顯現，短期內向9.5 萬美元至短期持有者成本基礎推進仍是可能的。

BlockBeats•2025/12/12 09:20

十年拉鋸終落幕：「加密貨幣市場結構法案」衝刺參議院

這項法案用分類監管終結「證券還是商品」的爭議，重塑SEC 與CFTC 的分工，加速美國加密監管走向制度化。

BlockBeats•2025/12/12 08:30

他們提前知道了TGA年度最佳遊戲，賺了上萬美金

違反歷史也猛幹

BlockBeats•2025/12/12 07:33

公鏈護城河僅3分？ Alliance DAO創辦人言論引爆加密圈論戰

圍繞著「公鏈護城河只有3/10 嗎？」的爭論揭開了加密產業的底層矛盾：理想與現實、流動性與信任、商業模式與生態基礎之間的系統性拉扯。

BlockBeats•2025/12/12 07:33