2025年3月12日 - 信報
美國哥倫比亞大學旗下「托姆數碼新聞中心」,測試了8種工具即時搜尋功能的生成式人工智能(GenAI)工具,分別是ChatGPT Search、Perplexity、Perplexity Pro、DeepSeek Search、Copilot、Grok 2 Search、Grok 3 Search及Gemini,以驗證其準確檢索及引用新聞的能力。
8種工具 逾六成錯引文章
為評估聊天機械人是否準確,研究人員採取一項控制實驗,首先從20個出版商隨機抽出10篇新聞。下一步,人手從每篇文章中,提取特定段落用作查詢。每個AI的任務是識別文章的標題、原始發布者、出版日期及網址。測試後發現,六成以上查詢結果,引用了錯誤的文章;Perplexity有37%查詢答錯,Grok 3錯誤率高達94%。
此外,多個聊天機械人在測試時,似乎繞過「機械人排除協議」,令出版商對內容失去決定權,例如是否被納入搜尋,或用作AI模型的訓練資料。以《今日美國報》(USA Today)為例,該報社封鎖了ChatGPT爬蟲機械人,但機械人仍引用雅虎重新發布的文章。
來源:

沒有留言:
發佈留言