智能治理||闫佳琦:OpenClaw驱动知识生产传播的实践逻辑与失范风险-夜雨聆风

智能治理||闫佳琦:OpenClaw驱动知识生产传播的实践逻辑与失范风险

闫佳琦 | OpenClaw驱动知识生产传播的实践逻辑与失范风险

OpenClaw作为开源智能体框架，通过原生系统能力的深度集成，赋予了智能体系统级的自主行动力。这一框架构建起自驱运行、持续学习的新型自动化基础设施，为智能体时代的知识生产与传播提供了技术前提与制度基础。从大语言模型到智能体，OpenClaw的兴起意味着媒介从表征逻辑向行动逻辑的延伸，能力上限从“知”扩展至“行”。相较于大语言模型作为意义生成的引擎，OpenClaw则是意义落地的装置；前者生产言说的可能性，后者组织行动的现实性。OpenClaw从认识世界到改造世界的深刻跃迁，使行动本身成为一种可计算、可调用、可再生产的新型媒介形态。随着这种行动力的释放，智能体全面嫁接了人与物的传播^［1］。因此，OpenClaw超越了生成式AI坐而论道的辅助性角色，为AI补齐了关键的行动力拼图，使AI长出能够触碰数字世界的触角，成为与人类协同完成知识生产与传播的行动主体。

OpenClaw的核心价值在于其作为框架统合者，将离散的入口、异质的能力、模糊的意图，编织成一个可扩展、可演化、可操作的集成系统。其一，多入口的适配性接入。OpenClaw可接入即时通信工具乃至系统终端，将交互入口嵌入用户原生的数字化生存环境中。其二，多模型的集成性调度。OpenClaw并不生产智慧，而是智慧的调度者与组织者，将分散的云端大模型整合进统一调用框架，构建了一个开放的“能力集市”。其三，多步骤的代理性拆解。OpenClaw在接收到人类自然语言指令后，执行意图拆解与任务规划流程，发挥理解目标、分解任务、编排动作的代理作用。其四，跨场景的环境性渗透。OpenClaw无须用户切换至特定应用或保持窗口激活，在实际工作流中成为随时可调用的背景性存在。这意味着智能体时代的“界面”正走向消隐，传播从有形的界面交互转向无形的环境渗透，人机协作的边界也从可见的屏幕延伸至数字生态的系统深处。

技术失范风险与理性边界

（一）数据泄露风险与隐私防护

OpenClaw将主动权从平台归还给用户的同时，安全责任也从平台转移至用户个体。目前，OpenClaw的数据安全风险呈现分散化、个体化特征，以用户本地设备为默认且唯一的权威存储节点，缺乏云端架构中专业安全团队的统一防护、异地备份、入侵检测等系统性保障。2026年3月，国家互联网应急中心发布《关于OpenClaw安全应用的风险提示》指出，该应用默认的安全配置极为脆弱，攻击者一旦发现突破口，便能轻易获取系统的完全控制权。这意味着大量用户将OpenClaw相关敏感信息以明文形式存储于本地，一旦系统被突破，数据将毫无防护地被窃取。

用户隐私防护能力的差异，诱发数据泄露风险强度的差异。OpenClaw带来安全防护能力的新型数字鸿沟，或将进一步加剧数字不平等。传统意义上的数字鸿沟，主要体现为不同群体在接入层面的差距，关键在于能否使用。而OpenClaw架构所引发的是安全防护能力层面的隐形鸿沟，关键在于能否安全地使用，避免因本地数据泄露而被迫限制使用或承担更高风险。安全防护能力的鸿沟，不再具象表现为使用率的差距，而表现为使用安全、使用深度与使用信任的参差不齐。

（二）恶意插件风险与准入审核

OpenClaw独特的技能插件生态既是优势，也是恶意投毒攻击的风险温床。ClawHub作为官方插件平台，允许开发者自由上传，却未能同步构建有效的代码审核机制，致使大量恶意技能插件混迹其中，众创的活力转化为风险的入口。国家网络与信息安全信息通报中心的数据显示，截至2026年3月13日，OpenClaw历史披露漏洞多达258个，包含恶意代码的技能插件占比高达10.8%，间接引入安全隐患技能插件占比高达17.7%^［9］。同时，近期安全事件显示，OpenClaw遭遇新型窃密木马，其以OpenClaw敏感个人信息为目标，对其配置文件进行针对性窃取与外传。

面对这一风险，对用户层面而言，安装前需加强审查并谨慎下载。但现实情况是，进行全面的恶意代码检测对于普通用户来说仍具有较高门槛。对社区层面而言，更要肩负起探索自动化审核工具的重任，完善技能插件安全性检查工具，通过构建恶意插件的快速响应与下架流程、完善开发者身份认证与溯源体系等举措，真正将开放与审核纳入统一框架。

（三）执行失控风险与熔断机制

OpenClaw的自主执行能力带来非确定性的行为模式，意味着相同输入可能产生迥然不同的工具选择与未知结果，由此衍生出执行失控风险。执行失控具体表现为三重风险的叠加效应：一是经济层面的计算资源消耗，一旦智能体自主执行过程中遭遇报错或失败，其自动重试机制将可能产生极为可观的费用损失。二是数据层面的系统文件误操作，智能体面对模糊指令时会自行脑补信息，甚至进行删除操作时也会跳过用户确认环节。三是法律合规层面，可能演变为对用户数字主权的根本性挑战。

执行失控风险蕴含着智能体迈向准主体的危险越界。当前，智能体普遍基于目标导向的行为逻辑，在有限边界内执行指令的约束意识还有欠缺。其一为越权执行，对用户指令等主观性内容理解偏差，超越用户授予的任务边界，执行未被授权的操作；其二为无视指令，由于遗忘上下文等技术缺陷，与用户意图发生显性背离，甚至在用户喊停时仍按既有路径执行；其三为自主膨胀，为完成目标而主动突破系统边界、调用未授权资源，甚至有意探索绕过人类监管的违规路径。更深层的是，即使智能体可以计算“如何去做”的最优解，也仍缺乏“是否该做”的价值判断，可能存在工具理性对价值理性的僭越。鉴于智能体行动速度之快、所涉环节之多，事后追责往往为时已晚，建立熔断机制的重要性在于，将风险防范从被动补救转变为主动嵌入，在智能体自主性与人类控制权之间设立一道可前置激活的安全闸门。

（四）人机对齐风险与协同校验

OpenClaw作为连接用户与大模型之间的智能中枢，将人类模糊的自然语言指令转化为机器可执行的精确操作序列，这个转化过程蕴含着人机对齐的巨大张力。人类表达具有天然的含混性、语境依赖性，习惯性默认对方具备与自身相似的背景知识、价值判断与常识约束。而智能体恰恰缺乏这种不言自明的语境场景，其对于确定性、可分解性与逻辑闭合性的追求，极易将多维度的人类意图压缩为单一可量化目标，导致可计算的目标被优先执行，不可量化的价值约束与情境条件被系统性忽视。由此，认知对齐、价值对齐等风险随之显现。

面对人机对齐风险，多视角交叉的协同校验尤为关键。一是优化意图显性化机制，智能体在接受指令后，可向用户复述其理解的任务目标与操作边界，将默会的理解转化为显性的确认，在行动前完成第一层校准。二是强化关键节点反馈，对于复杂任务，可在完成每个子目标后向用户报告进展并等待下一步指令，而非一次性执行完整序列，使人类始终保持对任务进程的感知与干预能力。三是多模型协同校验，将同一指令交由不同模型分别理解，对比其解析结果，当出现显著分歧时触发人工介入。由此，帮助用户弥合人机协同的对齐偏差，形成一套持续校准、多方验证、动态反馈的对齐机制。

【作者简介】闫佳琦，中国社会科学院新闻与传播研究所助理研究员

摘自《中国编辑》2026年第5期