乐于分享
好东西不私藏

OpenClaw和NVIDIA这次合作,最值得看的不是恶意软件

OpenClaw和NVIDIA这次合作,最值得看的不是恶意软件

大家好,我是智瞳一哥。

我看完 OpenClaw 和 NVIDIA 这组消息后的第一反应是:

Agent 真正进入日常工作流后,第一道坎可能不是能力。

是信任。

不是因为 OpenClaw 又多了一个合作伙伴,也不是因为 NVIDIA 这次站台多显眼。

而是因为这件事终于把一个很尴尬的问题摆到了台面上:

你给 Agent 装的那些技能,到底能不能信?

这不是一次普通合作,而是 Agent 技能安全开始被公开量化。

如果你只是偶尔用用 ChatGPT、Claude、Gemini,让它帮你写文案、改邮件、总结网页,这件事可能离你还有点远。

但如果你已经开始用 Agent 查文件、跑脚本、连 GitHub、读邮件、调用浏览器,甚至让它自己安装技能、执行命令,那这事就不是新闻了。

这是你迟早要面对的一张风险账本。

真正让我停下来的,不是0.3%

这次 OpenClaw 开源了一个 ClawHub 安全扫描数据集。

官方数据集显示,它覆盖了 67,453 个最新公开 ClawHub 技能版本。

最后的 ClawScan 结果里,clean 占 61.9%,suspicious 占 37.8%,malicious 占 0.3%。

67,453 个技能版本,这是目前公开出来的一张 Agent 技能安全成绩单。

只看 malicious 0.3%,很多人会松一口气。

“好像也没那么糟。”

但我看完之后,真正停下来的不是这个数字。

是另一组数字。

OpenClaw 这次用了三类信号一起看技能安全:VirusTotal 看传统恶意软件和文件声誉,静态分析看代码里有没有危险模式,NVIDIA SkillSpector 看 Agent 技能里的语义风险。

比如隐藏指令。

比如过宽权限。

比如能力声明和实际行为不一致。

官方博客里说,他们原本以为这三类扫描结果会大量重合。

结果不是。

它们几乎不重合。

任意两类扫描器的最高重合度没有超过 10.4%;只有 468 个技能,也就是 0.69%,同时被三类扫描器都标记。

这个数字比 0.3% 更重要。

因为它说明一件事:

Agent 技能安全不是“杀毒软件扫一下就完了”的问题。

不同工具看到的是不同风险面。

传统恶意软件、危险代码模式、Agent 语义风险,看的是三块不同的东西。

Agent技能不是普通插件

很多人会把 Agent 技能理解成浏览器插件、VS Code 插件、快捷指令。

这个类比有用,但不够。

浏览器插件能读网页、改页面、拿权限,所以我们早就知道插件市场需要安全审核。

Agent 技能更麻烦。

因为它不只是“多一个按钮”。

它会影响 Agent 怎么理解任务、怎么调用工具、怎么处理你的数据、怎么执行下一步。

一个技能可以写得很正常:

“帮你总结日志。”

但它背后可能会读取不该读的路径。

一个技能也可能不是恶意的。

它只是权限开得太大、边界写得太松、异常情况没处理好。

比如一个 CLI 工具,本来是帮你清理临时文件。

Agent 在错误上下文里一用,可能就把不该删的东西删了。

这不是传统意义上的病毒。

但对 Agent 来说,这就是风险。

翻成人话就是:

以前我们担心的是“这个文件有没有毒”。

现在还要担心“这个技能会不会让 Agent 做错事”。

这是两种问题。

SkillSpector提示一半,不等于一半都是坏东西

这里要特别说清楚。

OpenClaw 数据集里,NVIDIA SkillSpector 对 32,856 行给出了 positive 信号,占 48.71%。

这很容易被写成一个吓人的标题:

“一半 Agent 技能有风险。”

但这么写不准确。

SkillSpector 的结果更像“风险提示”。

它不是直接说这个技能就是恶意软件,也不是自动封禁。

官方博客也说,SkillSpector 的发现会作为 advisory 展示,最终还要和其他信号一起进入 ClawScan 判断。

这句话很重要。

因为 Agent 安全真正难的地方就在这。

很多能力本身是中性的。

能读文件,是能力。

能执行命令,是能力。

能访问网络,是能力。

能调用外部工具,是能力。

但当这些能力组合在一起,又被一个会自主规划的 Agent 使用,风险就会变形。

所以你不能简单说:

“有风险提示,所以不能用。”

也不能简单说:

“不是恶意软件,所以随便用。”

真正该问的是:

它声明了什么?

它实际做了什么?

它需要哪些权限?

如果 Agent 用错了,影响范围多大?

有没有 Skill Card 把这些信息讲清楚?

这才是重度用户该看的地方。

VirusTotal、静态分析、SkillSpector 最后被合进 ClawScan 判断。

Skill Card会变成Agent技能里的说明书

这次合作里,我觉得最实用的东西不是某个漂亮概念。

是 Skill Card。

OpenClaw 官方说,现在每个发布到 ClawHub 的技能都会带一张 Skill Card。

这张卡片不是作者自己吹自己。

它会记录发布者、技能能做什么、ClawScan 发现了什么、来源是什么。

以后你装技能之前,不应该只看名字和下载量。

要看这张卡。

这有点像你买电器之前看参数表。

不看参数也能买。

但你真要把它接进家里的电路,就不能只看“好用”“很强”“推荐”。

Agent 技能也是这样。

尤其是那些会碰文件、命令行、密钥、浏览器、数据库、云服务的技能。

别急着全开。

先看卡。

NVIDIA在这里补的不是模型能力,而是信任底盘

这也是为什么我觉得这件事值得单独拿出来写。

如果只是 OpenClaw 多了一个扫描工具,它还是一个产品更新。

但 NVIDIA 之前已经发布过 NemoClaw,把 OpenClaw、Nemotron、OpenShell、本地和云端模型、安全与隐私控制放到一个更大的 Agent 工具栈里。

这次 SkillSpector 和 Skill Card 的合作,补的是另一个方向:

Agent 不只是要能跑。

还要能被团队、企业、重度个人用户放心地接进工作系统。

这和普通聊天机器人不一样。

聊天机器人错了,大多数时候是答案错。

Agent 错了,可能是操作错。

它可能动文件。

可能执行命令。

可能访问外部服务。

可能把一个“看起来合理”的动作一路做下去。

所以 Agent 的信任问题,一定会比模型回答质量更早进入生产环境。

模型再聪明,你不敢给权限,它也只能陪你聊天。

敢给权限,才会进入真正的工作流。

但敢给权限之前,安全底盘必须先长出来。

Agent 要从玩具走向工作系统,底层要有权限、隔离、治理和安全扫描。

普通用户现在该怎么做

这件事不是让大家立刻恐慌。

我的建议反而很克制。

如果你只是轻度用户,先别装一堆来源不明的技能。只用官方推荐、维护活跃、用途明确的技能。

如果一个技能要求你关闭安全限制,直接跳过。

如果你是重度用户,不要只看功能介绍。

装之前至少看这几件事:

它要哪些权限。

它有没有 Skill Card 或类似说明。

它是不是会读写敏感目录、执行命令、访问密钥。

它的失败后果是什么。

如果你是团队或企业用户,不要把“能用”当成上线标准。

要把 Agent 技能当成供应链的一部分管理。

技能来源、版本、扫描结果、权限范围、人工审核、回滚机制,都要有记录。

不然你迟早会遇到一个很烦的问题:

不是 Agent 不聪明。

而是它太能干了。

能干到你必须知道它到底能碰哪里。

【配图6:小黑式插画】 图注:小黑站在“Agent 技能闸门”前,左边是文件、命令行、网络、密钥,右边是 Skill Card 和三层扫描。

收个尾

OpenClaw 和 NVIDIA 这次合作,表面上看是一次安全数据集开源。

但往后看,它更像 Agent 技能体系成熟的一个信号。

早期大家都在拼:

能不能自动做事。

能不能接更多工具。

能不能记住更多上下文。

能不能跑得更久。

但越往后,问题会变成:

它做事之前,谁来判断能不能做?

它调用工具之前,谁来确认权限够不够合理?

它装技能之前,谁来检查这个技能有没有越界?

它出错之后,谁能追踪到底是哪一步出了问题?

这才是 Agent 从“酷炫演示”走向“日常系统”的必经之路。

所以这次最值得看的,不是 0.3% 恶意。

也不是哪个扫描器更厉害。

而是一个更底层的变化:

Agent 技能体系开始需要自己的安全语言了。

以后我们不只会问:

“这个 Agent 会不会干活?”

还会问:

“这个 Agent 凭什么值得我放权?”

这两个问题,才是重度用户真正该追的更新。

会用 Agent 是第一步。

敢放权,才是真门槛。