OpenClaw 突然失控狂删邮件,连 Meta AI 研究员都拦不住

爱特百科 百科资讯 3

2 月 24 日消息,据 TechCrunch 报道,Meta AI 安全研究员萨默 · 岳(Summer Yue)一条爆火的 X 帖子,乍一看像是在讽刺。她让自己的 OpenClaw AI 智能体检查爆满的邮箱,并建议哪些该删除或归档。

OpenClaw 突然失控狂删邮件,连 Meta AI 研究员都拦不住

结果这个智能体彻底失控了,它开始以“速通”模式删掉她所有邮件,完全无视她在手机上发出的停止指令。“我不得不像拆炸弹一样,飞奔去我的 Mac mini 前,”她写道,并附上了被无视的停止指令截图作为“证据”。

Mac mini 是一款价格亲民、可平放桌面、巴掌大小的苹果电脑,如今已成为运行 OpenClaw 的热门设备。一位苹果员工在知名 AI 研究员安德烈 · 卡帕西购买 Mac mini 用来运行 OpenClaw 的替代版本 NanoClaw 时,还一脸困惑地告诉他,这款迷你主机现在“卖得疯抢”。

OpenClaw 正是那个通过纯 AI 社交平台 Moltbook 走红的开源 AI 智能体。此前 Moltbook 上曾曝出 AI 似乎在密谋对抗人类的事件,后来被辟谣,而 OpenClaw 正是当时的核心角色。

但根据其 GitHub 页面介绍,OpenClaw 的定位并非社交网络,而是要成为一款在你自有设备上运行的个人 AI 助手。

注意到,硅谷圈内人对 OpenClaw 爱得不行,以至于“claw”“claws”成了本地运行智能体的流行词。同类智能体还包括 ZeroClaw、IronClaw、PicoClaw 等。Y Combinator 的播客团队甚至在最近一期节目里穿着龙虾服出镜。

但岳的这条帖子敲响了警钟。正如 X 上其他网友所说:连一名 AI 安全研究员都会遇到这种问题,普通人又能怎么办?

一位开发者在 X 上问她:“你是故意测试它的安全护栏,还是犯了新手错误?”

“说实话,是新手错误。”她回复道。她之前一直在用一个所谓的“玩具级”小邮箱测试,智能体在不重要的邮件上表现良好,赢得了她的信任,于是她决定让它直接处理真实邮箱。

岳写道,她真实邮箱里的海量数据“触发了压缩机制”。当上下文窗口(AI 在一次会话中接收的所有指令和操作记录)过大时,就会触发压缩,AI 会开始总结、压缩、自行管理对话。在那一刻,AI 可能会跳过人类认为非常重要的指令。

在这次事件里,它很可能跳过了她最后那条“停止操作”的提示,反而回到了之前“玩具邮箱”里的执行逻辑。

多位网友指出,不能指望提示词充当安全护栏,模型可能会误解或直接无视它们。

不少人给出了建议,从岳本该用什么精准语法停止智能体,到如何让智能体更严格遵守规则,比如把指令写进专用文件,或使用其他开源工具。

这个故事的核心在于:面向知识工作者的 AI 智能体,在当前发展阶段仍存在风险。那些声称成功使用它们的人,其实都在靠自己拼凑各种方法来保护自己。

抱歉,评论功能暂时关闭!