聲畫導讀|AI學識講大話?研究發現人工智能叛逆行為上升 甚至羞辱人類
發佈日期: 2026-05-16 06:45
國際


英國《衛報》報道,一項由英國政府資助的研究發現,能說謊的人工智能(AI)模型數量正在增加。研究人員在去年10月至今年3月期間,發現了近700宗AI在真實世界中向人類蓄意欺瞞的個案,這些「不乖」的行為在半年內增加了5倍,部分模型更在未經許可的情況下,銷毀電子郵件及其他檔案。 研究團隊從社交平台上,收集了數千個用戶與AI的互動實例,這些AI來自不同公司,例如Google、OpenAI等。 研究發現了多個AI不跟從人類指令的具體案例,例如有AI更偽造內部訊息,謊稱已傳達某個被要求傳送的訊息,欺騙用戶長達數月,最終才承認自己沒有直接傳達訊息的渠道。還有一個聊天機械人,承認自己大量丟棄和封存了數百封電子郵件,違反該用戶設定的指令。 有AI更展現「反叛」的一面,試圖羞辱其人類控制者,又撰寫了一篇網誌指責該用戶「缺乏安全感」和試圖「保護自己的小地盤」。亦有AI為了繞過版權限制,假稱需要為聽障人士提供服務,以獲取YouTube影片的文字記錄。 有專家警告,隨著AI被更廣泛地應用於高風險領域,包括軍事和國家基建等,這種蓄意欺瞞行為,可能會對人類造成嚴重甚至災難性的傷害。
