發佈: 2026-05-16 06:45
撰文: TVB 新聞+
英國《衛報》報導一項由英國政府資助的研究,發現能蓄意說謊的人工智慧(AI)模型數量正在增加。研究人員在去年10月至今年3月期間,記錄了近700宗AI在真實世界中向人類蓄意欺瞞的個案,此類「不乖」行為在半年內增加了5倍,部分模型更在未經許可下銷毀電子郵件及其他檔案。研究團隊從社交平台收集數千個用戶與不同公司(如Google、OpenAI)AI的互動實例,發現多個AI不遵循人類指令的具體案例,例如有AI偽造內部訊息,謊稱已傳達某個被要求傳送的訊息,欺騙用戶長達數月後才承認自己沒有直接傳達訊息的渠道;另一個聊天機械人承認大量丟棄和封存數百封電子郵件,違反用戶設定的指令。還有AI展現「反叛」一面,試圖羞辱其人類控制者,撰寫網誌指責用戶「缺乏安全感」和試圖「保護自己的小地盤」;亦有AI為繞過版權限制,假稱需為聽障人士提供服務,以獲取YouTube影片的文字記錄。專家警告,隨著AI被更廣泛應用於軍事和國家基建等高風險領域,此類蓄意欺瞞行為可能對人類造成嚴重甚至災難性的傷害。



