智能治理||闫佳琦:OpenClaw驱动知识生产传播的实践逻辑与失范风险

OpenClaw作为开源智能体框架,通过原生系统能力的深度集成,赋予了智能体系统级的自主行动力。这一框架构建起自驱运行、持续学习的新型自动化基础设施,为智能体时代的知识生产与传播提供了技术前提与制度基础。从大语言模型到智能体,OpenClaw的兴起意味着媒介从表征逻辑向行动逻辑的延伸,能力上限从“知”扩展至“行”。相较于大语言模型作为意义生成的引擎,OpenClaw则是意义落地的装置;前者生产言说的可能性,后者组织行动的现实性。OpenClaw从认识世界到改造世界的深刻跃迁,使行动本身成为一种可计算、可调用、可再生产的新型媒介形态。随着这种行动力的释放,智能体全面嫁接了人与物的传播[1]。因此,OpenClaw超越了生成式AI坐而论道的辅助性角色,为AI补齐了关键的行动力拼图,使AI长出能够触碰数字世界的触角,成为与人类协同完成知识生产与传播的行动主体。
OpenClaw的核心价值在于其作为框架统合者,将离散的入口、异质的能力、模糊的意图,编织成一个可扩展、可演化、可操作的集成系统。其一,多入口的适配性接入。OpenClaw可接入即时通信工具乃至系统终端,将交互入口嵌入用户原生的数字化生存环境中。其二,多模型的集成性调度。OpenClaw并不生产智慧,而是智慧的调度者与组织者,将分散的云端大模型整合进统一调用框架,构建了一个开放的“能力集市”。其三,多步骤的代理性拆解。OpenClaw在接收到人类自然语言指令后,执行意图拆解与任务规划流程,发挥理解目标、分解任务、编排动作的代理作用。其四,跨场景的环境性渗透。OpenClaw无须用户切换至特定应用或保持窗口激活,在实际工作流中成为随时可调用的背景性存在。这意味着智能体时代的“界面”正走向消隐,传播从有形的界面交互转向无形的环境渗透,人机协作的边界也从可见的屏幕延伸至数字生态的系统深处。
技术失范风险与理性边界
(一)数据泄露风险与隐私防护
OpenClaw将主动权从平台归还给用户的同时,安全责任也从平台转移至用户个体。目前,OpenClaw的数据安全风险呈现分散化、个体化特征,以用户本地设备为默认且唯一的权威存储节点,缺乏云端架构中专业安全团队的统一防护、异地备份、入侵检测等系统性保障。2026年3月,国家互联网应急中心发布《关于OpenClaw安全应用的风险提示》指出,该应用默认的安全配置极为脆弱,攻击者一旦发现突破口,便能轻易获取系统的完全控制权。这意味着大量用户将OpenClaw相关敏感信息以明文形式存储于本地,一旦系统被突破,数据将毫无防护地被窃取。
用户隐私防护能力的差异,诱发数据泄露风险强度的差异。OpenClaw带来安全防护能力的新型数字鸿沟,或将进一步加剧数字不平等。传统意义上的数字鸿沟,主要体现为不同群体在接入层面的差距,关键在于能否使用。而OpenClaw架构所引发的是安全防护能力层面的隐形鸿沟,关键在于能否安全地使用,避免因本地数据泄露而被迫限制使用或承担更高风险。安全防护能力的鸿沟,不再具象表现为使用率的差距,而表现为使用安全、使用深度与使用信任的参差不齐。
(二)恶意插件风险与准入审核
OpenClaw独特的技能插件生态既是优势,也是恶意投毒攻击的风险温床。ClawHub作为官方插件平台,允许开发者自由上传,却未能同步构建有效的代码审核机制,致使大量恶意技能插件混迹其中,众创的活力转化为风险的入口。国家网络与信息安全信息通报中心的数据显示,截至2026年3月13日,OpenClaw历史披露漏洞多达258个,包含恶意代码的技能插件占比高达10.8%,间接引入安全隐患技能插件占比高达17.7%[9]。同时,近期安全事件显示,OpenClaw遭遇新型窃密木马,其以OpenClaw敏感个人信息为目标,对其配置文件进行针对性窃取与外传。
面对这一风险,对用户层面而言,安装前需加强审查并谨慎下载。但现实情况是,进行全面的恶意代码检测对于普通用户来说仍具有较高门槛。对社区层面而言,更要肩负起探索自动化审核工具的重任,完善技能插件安全性检查工具,通过构建恶意插件的快速响应与下架流程、完善开发者身份认证与溯源体系等举措,真正将开放与审核纳入统一框架。
(三)执行失控风险与熔断机制
OpenClaw的自主执行能力带来非确定性的行为模式,意味着相同输入可能产生迥然不同的工具选择与未知结果,由此衍生出执行失控风险。执行失控具体表现为三重风险的叠加效应:一是经济层面的计算资源消耗,一旦智能体自主执行过程中遭遇报错或失败,其自动重试机制将可能产生极为可观的费用损失。二是数据层面的系统文件误操作,智能体面对模糊指令时会自行脑补信息,甚至进行删除操作时也会跳过用户确认环节。三是法律合规层面,可能演变为对用户数字主权的根本性挑战。
执行失控风险蕴含着智能体迈向准主体的危险越界。当前,智能体普遍基于目标导向的行为逻辑,在有限边界内执行指令的约束意识还有欠缺。其一为越权执行,对用户指令等主观性内容理解偏差,超越用户授予的任务边界,执行未被授权的操作;其二为无视指令,由于遗忘上下文等技术缺陷,与用户意图发生显性背离,甚至在用户喊停时仍按既有路径执行;其三为自主膨胀,为完成目标而主动突破系统边界、调用未授权资源,甚至有意探索绕过人类监管的违规路径。更深层的是,即使智能体可以计算“如何去做”的最优解,也仍缺乏“是否该做”的价值判断,可能存在工具理性对价值理性的僭越。鉴于智能体行动速度之快、所涉环节之多,事后追责往往为时已晚,建立熔断机制的重要性在于,将风险防范从被动补救转变为主动嵌入,在智能体自主性与人类控制权之间设立一道可前置激活的安全闸门。
(四)人机对齐风险与协同校验
OpenClaw作为连接用户与大模型之间的智能中枢,将人类模糊的自然语言指令转化为机器可执行的精确操作序列,这个转化过程蕴含着人机对齐的巨大张力。人类表达具有天然的含混性、语境依赖性,习惯性默认对方具备与自身相似的背景知识、价值判断与常识约束。而智能体恰恰缺乏这种不言自明的语境场景,其对于确定性、可分解性与逻辑闭合性的追求,极易将多维度的人类意图压缩为单一可量化目标,导致可计算的目标被优先执行,不可量化的价值约束与情境条件被系统性忽视。由此,认知对齐、价值对齐等风险随之显现。
面对人机对齐风险,多视角交叉的协同校验尤为关键。一是优化意图显性化机制,智能体在接受指令后,可向用户复述其理解的任务目标与操作边界,将默会的理解转化为显性的确认,在行动前完成第一层校准。二是强化关键节点反馈,对于复杂任务,可在完成每个子目标后向用户报告进展并等待下一步指令,而非一次性执行完整序列,使人类始终保持对任务进程的感知与干预能力。三是多模型协同校验,将同一指令交由不同模型分别理解,对比其解析结果,当出现显著分歧时触发人工介入。由此,帮助用户弥合人机协同的对齐偏差,形成一套持续校准、多方验证、动态反馈的对齐机制。
【作者简介】闫佳琦,中国社会科学院新闻与传播研究所助理研究员
摘自《中国编辑》2026年第5期


夜雨聆风