OpenClaw实现Windows原生接入,新增技能工坊
OpenClaw v2026.6.1 深度拆解:那只”龙虾”终于爬上了Windows桌面
咱再科普一下
🦞 先定位:OpenClaw到底是什么?
OpenClaw 是一个本地优先运行的开源个人AI Agent框架——你可以把它理解成”能动手的ChatGPT,住在你自己的机器上,通过Gateway把WhatsApp/TG/Discord/飞书等消息渠道收束成一个执行面”。核心架构是三层解耦:Gateway网关(调度塔)→ Agent运行时(思考-执行-观察循环)→ Nodes节点(分布式手脚)+ Skills技能系统(模块化工具箱)。
它不是大厂产品,是Peter Steinberger发起的独立开源项目,但体量已做到GitHub顶流级别的热度。
一、Windows原生节点接入:从”穿企鹅装”到一等公民
痛点是什么?
此前Windows跑OpenClaw只能走两条路:
Docker Desktop → 又重又吃内存,文件系统挂载慢
WSL2子系统 → 跨VFS边界的I/O惩罚,文件读取慢10倍,路径/权限/插件安装各种玄学报错
本质矛盾:全球16亿台Windows PC是最大装机底座,但OpenClaw的生态主力在macOS/Linux极客圈,Windows用户一直是二等公民。
解法:MXC(Microsoft Execution Containers)
这次的核心不是简单的”编译一份Windows二进制”,而是微软在Build 2026上与OpenClaw深度协作,引入了内置于Windows内核侧的策略驱动型安全执行层MXC:
MXC决定Agent能碰哪些文件、能跑哪些命令,沙箱级别的控制
现场演示经典场景:让OpenClaw删桌面文件 → MXC沙箱死死摁住,94张图纹丝不动
配套的”龙虾伴侣”(openclaw-windows-node):
“.NET 10 + C# 14″,WinUI 3系统托盘守护进程 + WebSocket网关客户端 + PowerToys命令面板集成(
“Win+Alt+Space”直接调度AI),甚至支持Canvas画布——Agent能把交互式图表通过WebView2直接推送到你桌面,而不是发个链接让你自己点
事大了?
之前Agent叙事被困在”你要有台Mac mini或Linux服务器”,现在它 knock on 企业办公楼的Windows主机群——ERP、财务软件、OA审批流全在Windows上跑,Agent要渗透真实工作流就得在这层接地气。
同时也别过度浪漫化:”16亿台PC可用”≠”16亿台PC有用”。大部分机器的主人不会开着个未知开源Agent拿PowerShell权限满世界跑,真正的规模化取决于信任模型和安全故事的说服力。MXC沙箱+本地exec-policy.json的双重否决权设计(云端网关被攻破也不代表本地沦陷)是这个版本最关键的信任基建。
二、Skill Workshop:AI自己”长”技能的钥匙
这是三个更新里概念上最激进的一个。
旧范式
Skills = 人来写 → AI来用 → 等下一个版本更新
ClawHub社区已有1.3万+技能模块,但迭代节奏始终绑在人类程序员的发版周期上。
新范式(Skill Workshop)
Agent干活时发现”我没这个能力” → 调
“skill_workshop” 工具 → 生成一份
“proposal.md”(技能描述 + 触发条件 + 执行逻辑 + 依赖清单)→ 放进人类审批队列 → 你批准/驳回/就地修订 → 带版本号 + 哈希校验 + 一键回滚上线
翻译成人话:
| 环节 | 控制权在谁手里 |
|---|---|
| 提议 | Agent自主判断缺口,起草方案 |
| 审查 | 人类看proposal.md,改代码、加限制、问一句”你确定?” |
| 执行 | 批准后才写入Skills目录,带哈希防篡改 |
| 兜底 | 跑崩了→一键回滚到上一版 |
这就是所谓的 HITL(Human-in-the-Loop)自进化:AI可以7×24补短板,但每一步有迹可循、有路可退,不是”AI偷偷给自己加权限”的恐怖片剧本。
但该冷静的地方
“Agent生成新技能”本质是LLM写脚本/配置文件,质量天花板取决于底层模型的代码能力和Agent的上下文感知——它大概率能写对80%的简单自动化,但遇到复杂依赖/边界条件时,生成物可能是表面上能跑、暗处埋坑
哈希校验保的是完整性(没被第三方篡改),不保的是正确性(生成的脚本本身是不是蠢/危险)——最终还是靠人类review的质量
所以这个功能的真正价值不在”全自动”,而在把写技能的成本从”从头手写”降到”审查+微调”,是生产力杠杆,不是魔法
三、Workboard多智能体编排:Agent终于有”项目看板”了
之前多Agent协同的痛点:谁干啥靠喊,进度靠猜,重复劳动,信息割裂。
Workboard的本质是引入了:
主Agent做任务拆解 → 分发给子Agent
可视化面板跟踪每个节点的完成状态
Codemode命名空间 + 精细化工具分发 → 子Agent只拿到它该拿的权限,不碰不该碰的东西
这其实是对经典主从编排模式(Orchestrator-Worker)做了个带UI和权限隔离的产品化封装。在开源Agent框架里,这块确实稀缺——大多数框架要么单Agent猛堆工具,要么多Agent但调度粗糙。
四、底层那些不性感但很重要的东西
| 变化 | 意味着什么 |
|---|---|
| SQLite替代文件扫描 | 消息队列、插件日志、运行状态从散落文件夹→结构化DB,重启恢复快、不丢状态、少”幽灵文件”残留 |
| MiniMax M3官方接入 | 国产多模态长文本模型进生态,中文场景Agent体验明显加分——这是OpenClaw生态里国产顶级模型首次官方身份接入 |
| GitHub Copilot / Claude 1M上下文打通 | 大代码库场景的上下文感知增强 |
| 178次commit合入主线 | 这次不是改个about页面,是动骨架的版本 |
总体判断
| 维度 | 评价 |
|---|---|
| 技术含金量 | Windows原生+MXC安全层是实打实的工程难点,不是营销包装 |
| 产品想象力 | Skill Workshop if done right = 智能体从”静态工具箱”→”可积累经验的系统”,概念级别跃迁 |
| 风险点 | 生成技能的正确性保证、大规模部署时的信任/攻击面、开源项目的可持续治理 |
| 定位 | 它不是”通用AGI”,它是把Agent从demo-tier拽进桌面操作系统基础设施的那类项目——野心在”AI的cron + 消息总线 + 分布式手脚”,不在”更大的model” |
一句话:v2026.6.1最值得盯的不是”16亿PC”这种数字修辞,而是MXC安全执行层 × Skill Workshop审批链 × Workboard权限隔离这三样合在一起,第一次让”给Agent开系统级权限”从一个疯狂想法变成一个有刹车、有审计、可回滚的可操作方案。 这才是它能不能走出极客圈的分水岭。
夜雨聆风