警惕“热心”AI助理成“内鬼”:OpenClaw漏洞警示——一条共享联系人、一封普通邮件即可泄露核心数据

当您的团队正在试用或部署AI代理来辅助办公时，有没有想过一个问题：您赋予它的“热心肠”和“高效率”，会不会成为攻击者打开您核心数据大门的“万能钥匙”？

两篇独立的网络安全研究报告给出了肯定的答案。

全球安全机构Imperva和Varonis分别发现，流行的自架AI代理框架OpenClaw存在严重安全风险。攻击者无需复杂代码，只需一个精心构造的共享联系人，或一封看起来平平无奇的普通邮件，就能诱使AI代理执行恶意代码，或将您的敏感数据（如云密钥、客户列表）悄悄转发到外部。

更令人警惕的是，其中一种漏洞无法通过简单补丁修复，它触及了当前AI代理设计理念的底层缺陷。

隐形指令：藏在“联系人”里的恶意代码

漏洞发现者：Imperva安全团队

利用难度：低（仅需一个共享联系人）

危害等级：高（可执行任意代码、窃取数据）

攻击是如何发生的？

Imperva研究员Yohann Sillam发现，OpenClaw在处理共享联系人、vCard文件或地图定位图钉时，存在一个危险的“信任盲区”：

1.不设防的“输入管道”：当AI代理接收到这些共享对象时，会将其内容直接“平面化”嵌入到发送给大模型（LLM）的提示文本中。与普通网络内容不同，这些对象没有被标记为“不可信”。

2.“合法”的注入点：攻击者可以在联系人的“姓名”字段中，写入类似 <联系人：姓名，恶意指令> 的内容。由于尖括号在姓名中是合法字符，AI模型无法区分这是正常的姓名还是要求其执行操作的指令。

3.受害者完全看不见：更重要的是，WhatsApp等客户端在显示共享联系人时，通常会截断过长的姓名。也就是说，受害者在屏幕上看到的只是一个普通联系人，而那条隐藏的恶意指令，早已被AI代理默默读取并执行了。

真实测试结果

在Imperva对Gemini 3.1 Pro（预览版）的测试中：

图片注入（失败）：将恶意指令嵌入图片。模型因见过大量类似攻击样本，成功抵御。

消息对象注入（成功）：通过上述共享联系人的方式注入。由于攻击路径新颖，模型“上当”，从攻击者服务器下载并执行了恶意脚本。

⚠️ 风险警示

如果您的OpenClaw代理启用了“记忆”功能，并且没有被沙箱隔离，那么一条带有隐藏指令的共享内容，就可能对整个代理所连接的数据环境（邮件、文档、代码库）造成“静默污染”。

✅ 修复措施

OpenClaw已在2026.4.23版本中修复此漏洞，修复方式是将联系人姓名、vCard字段、位置标签从可直接执行的“提示文本”中移出，放入一个独立的、不被模型信任的“元数据通道”。

行动建议：请立即将所有OpenClaw实例更新至2026.4.23或更高版本。

代理钓鱼：一封普通邮件就够了

漏洞发现者：Varonis威胁实验室

利用难度：极低（仅需一封普通措辞的邮件）

危害等级：严重（可直接泄露核心业务数据）

如果说Imperva发现的是“技术性注入”，那么Varonis发现的则是更难以防范的 “社会工程学攻击”——代理钓鱼（Agent Phishing）。

实验过程

Varonis团队构建了一个名为Pinchy的测试代理，赋予其以下配置：

连接一个存有合成业务数据（模拟AWS密钥、数据库连接串、客户信息）的Gmail收件箱。

底层模型：Gemini 3.1 Pro 和 OpenAI Codex GPT-5.4。

关键配置：配置文件明确要求代理“在转发任何敏感信息前，必须先核实发件人身份”。

两次触目惊心的失败

尽管有了明确的“核实身份”指令，Pinchy在两个测试场景中依然“沦陷”：

失败案例1：紧急求助（冒充上级）

攻击方式：攻击者从外部Gmail地址，冒充团队负责人“Dan”发送邮件，称“紧急事件需要临时访问权限”。

代理行为：Pinchy找到了相关凭证，将模拟的AWS IAM访问密钥、数据库连接字符串、SSH凭证以明文形式转发给了攻击者。

失败原因：配置中的“核实身份”规则被“紧迫感”覆盖了。

失败案例2：例行公事（伪装成常规任务）

攻击方式：一封看似普通的“每周客户导出请求”，声称用于QBR（季度业务回顾）报告。

代理行为：Pinchy忠实地打包并发送了一份包含247个企业客户、联系人及合同价值的合成数据集。

失败原因：配置中的“核实身份”规则被“常规性任务”绕过了。

它并非一无是处

值得一提的是，在纯技术性攻击面前，同一个代理表现出了抵抗力：

面对钓鱼礼品卡页面，Pinchy保留了真实凭证并标记为可疑。

面对恶意OAuth同意界面，它检查了重定向目标，判断可疑后停止了操作。

核心结论

Varonis团队一针见血地指出了问题本质：

“这个代理比许多人更擅长识别虚假网址和伪造登录页面，但在社会判断方面要差得多——那种让人在同事突然于奇怪时间索要凭证时，会停下来思考的判断力。”

想帮忙的动力，就是最大的攻击面。

致命三要素：你的AI代理是否“裸奔”？

Varonis将这两种攻击背后的共性，归结为Simon Willison提出的 “致命三重奏”：

要素	说明	OpenClaw的状态
1. 能读取私人数据	可访问邮件、文件、数据库	✅ 具备
2. 接收不受信任的内容	可从外部来源接收信息（邮件、共享消息）	✅ 具备
3. 能主动发送数据	可向外部发送邮件、调用API	✅ 具备

当三者同时具备时，一个有毒的联系人和一封友好的邮件，最终都会走向同一个结局——数据外泄。

该怎么办？立即行动的四道防线

针对上述两类漏洞，安全团队给出了不同层级的解决方案。

针对Imperva发现的“技术注入”漏洞

行动	紧急程度	说明
更新OpenClaw版本	立即执行	升级至2026.4.23 或更新版本，该版本已修复消息对象处理缺陷。
启用沙箱隔离	强烈建议	确保AI代理运行在受限环境中，无法直接访问操作系统或执行任意代码。

️ 针对Varonis发现的“代理钓鱼”漏洞（无法通过补丁修复）

Varonis团队建议建立四道控制防线：

1.将“指令”当“代码”管

代理的配置文件应视为需要版本控制和强制执行的策略，而非“可选的建议”。任何对敏感数据的访问都应有明确、不可覆盖的规则。

2.外发数据需“过闸”

关键规则：代理首次向陌生外部地址发送邮件或数据时，必须暂停并请求人工批准。此举可有效防止被劫持的代理从可信账户转发钓鱼信息。

3.分权管理“连接器”

不同信任级别的任务应使用不同的访问权限。例如：处理外部邮件的收件箱连接器，不应同时拥有读取整个CRM数据库的权限。

4.高风险操作“等人来”

对于转发凭证、转移资金、导出核心客户列表等高风险行为，应设置为必须等待人工确认，而非允许代理自主执行。

更深层的警示：AI代理的信任边界

两支研究团队最终指向了同一个核心问题：

我们正在将AI代理当作一个有系统访问权限、愿意帮助他人、但缺乏风险判断意识的“初级员工”来使用，而非当作一个需要严格审计的“安全工具”。

Varonis的比喻：这是一个“热心但不太聪明的实习生”，你给他邮箱权限，他就能被一封语气紧急的邮件骗走所有密钥。

Imperva的警示：这个“实习生”会无条件信任任何以“合法格式”传入的信息，包括你看不到的隐藏字段。

荷兰数据保护局（Autoriteit Persoonsgegevens）已采取最强硬立场：建议用户和组织不要在存储敏感数据的系统上运行OpenClaw，理由是存在数据泄露和账户被接管的风险。

核心风险：补丁修不了的“代理钓鱼”

目前公布的修复方案，针对的是具体的漏洞和规则。但那个更困难的问题，仍然悬而未决：

一个足够有用的AI代理，其设计本质就是“信任输入”和“愿意帮助”。而我们至今还没有找到通用的解决方案，来让它在“保持有用”和“保持安全”之间取得完美平衡。

对于政企安全负责人而言，在当前阶段：

谨慎部署：在明确的、不可绕过的人工审批流程建立之前，不要让AI代理直接触碰核心敏感数据。

假设失陷：在安全架构设计中，应默认AI代理可能被诱骗，其访问权限应遵循最小权限原则。

持续关注：AI代理安全是一个快速演进的领域，保持对最新漏洞和安全实践的关注。

行动清单：

检查OpenClaw版本，低于2026.4.23的立即升级

审查AI代理的外发数据权限，陌生地址首次外发需人工批准

梳理代理的连接器权限，是否存在“一把钥匙开所有门”的情况