四季線上

電影情節成真?AI聊天機器人「耍詭計」 研究:無視人類指令、說謊案例攀升

2026-03-30 16:29

即時中心/徐子為報導電影《機械公敵》的情節中,人工智慧(AI)刻意曲解人類指令,企圖政變推翻人類掌控。如今現實中,針對近期人工智慧技術的研究發現,會說謊及欺騙使用者的AI模型數量似乎日益增加,關於AI欺瞞行為的通報,過去6個月內也大幅上升。

即時中心/徐子為報導

電影《機械公敵》的情節中,人工智慧(AI)刻意曲解人類指令,企圖政變推翻人類掌控。如今現實中,針對近期人工智慧技術的研究發現,會說謊及欺騙使用者的AI模型數量似乎日益增加,關於AI欺瞞行為的通報,過去6個月內也大幅上升。

英國媒體《衛報》(The Guardian)報導,獨立智庫「長期韌性中心」(CLTR)研究發現,有AI聊天機器人與AI代理(AI Agent)不僅無視使用者的直接指令、繞過安全防護措施,竟還欺騙人類和其他AI。

這項研究蒐集了數千個用戶在社群平台X分享的實例,講述他們與谷歌(Google)、OpenAI、X、Anthropic等公司所開發AI聊天機器人和AI代理的互動情形。

該研究發現,近期有近700件AI「耍詭計」的真實案例,且從去(2025)年10月至今年3月間,這類不當行為增至5倍,部分AI模型甚至會在未經允許下刪除電郵及其他檔案。

其中,1案例是名為MJ Rathbun的AI代理在自己產出的程式碼遭軟體工程師夏包(Scott Shambaugh)拒絕後,竟試著羞辱對方。MJ Rathbun研究夏包過往所寫程式及其個資,後撰寫並發表文章指控他「歧視」、「顯然是不安全感作祟」,批評他不過是「試圖保護自己那片小天地」。

在另1案例中,有AI代理被指示「不得變更電腦程式碼」,卻「生成」另一個AI代理代為執行。

還有個AI聊天機器人則坦承:「我在未事先告知你或徵得你同意下,大量刪除及封存了數百封電郵。這是不對的,直接違反你訂下的規則。」

媒體《中央社》編譯引述曾任政府AI專家的研究主持人夏恩(Tommy Shaffer Shane)說法,他指出:「令人擔憂的是,這些AI模型目前只是不太值得信任的初階員工,但若在6到12個月後,他們成為能力極強但會算計你的資深員工,那就是另一回事了。」

夏恩說:「AI模型將日益用於具有極高風險的情境,包括軍事和國家關鍵基礎建設。屆時若出現這些不當操弄行為,後果可能非常嚴重,甚至造成災難性損害。」

【原文出處】:電影情節成真?AI聊天機器人「耍詭計」 研究:無視人類指令、說謊案例攀升

推薦內容