医疗大模型从小事做起(八):OpenClaw的“能”与“不能”

OpenClaw是什么？

OpenClaw是由奥地利工程师彼得・施泰因贝格尔（Peter Steinberger）创建的开源AI智能体（AI Agent）执行框架，于2026年1月正式对外开源，被业界称为“真正能干活的AI”。它不只是对话交互，核心能力是替用户自主完成真实任务，包括收发邮件、管理日程、预订机票、运营社媒、文件处理、浏览器自动化等，可直接在本地设备部署并执行操作，实现从“给出建议”到“落地完成”的全流程自动化。有兴趣的可以看腾讯技术工程这篇科普文章：OpenClaw，你需要了解的：核心架构、运作原理、Agent部署步骤。

部署测试和思考

OpenClaw引发关注后，国内厂商也快速跟进，推出了多款类似产品。2月底的某一天，我选择了两款国产Claw产品，在一台闲置的电脑上完成部署测试，主要有两个目的：一是跑通流程，熟悉技术原理；二是摸清它的真实能力边界。

这两款分别是网易推出的有道Claw，以及MiniMax推出的MaxClaw。两者部署方式略有差异：有道Claw采用本地安装部署+用户自行配置第三方大模型API；MaxClaw则是云端部署+自家MiniMax M2.5模型，后端均对接了飞书。

整体安装门槛不高，对照技术文档，不到一小时就把两个Claw全部跑通，飞书里也多出了两个机器人。按产品文案的描述，我已经可以开始 “训练它们干活” 了。但在实际测试一段时间后，我还是选择了暂停使用，核心原因来自三个“不可控”：

首先是成本不可控。迁移成本、时间成本和Token成本都是我必须考虑的现实因素。在Claw出现之前，我对手头的事务性工作已经形成一套成熟稳定的处理模式，哪些亲力亲为、哪些交给自动化工作流，都有清晰经验，且运行顺畅。是否有必要把这套成熟体系迁移到一个全新工具上，本身就值得商榷。我也不可能为了用Claw而去刻意创造需求。

让我意外的是，它的Token消耗远超预期，甚至高出数倍。原因很简单：我与Claw的对话只占很小一部分，大量Token都消耗在它执行任务、反复推理、自主决策的隐形过程中。一上午测试下来，有道Claw搭配的某大模型赠送额度就已耗尽；而原本可免费部署的MaxClaw，也在我测试不久后，因用户大量涌入而导致宕机，随即提高部署门槛，改为付费订阅。

其次是安全不可控。Claw的工作模式让我陷入明显矛盾：作为能直接替用户执行真实操作的AI工具，它的能力高度依赖系统权限与操作权限。权限给少了，收发邮件、管理日程、调用接口、操作应用等核心功能都无法实现，基本等于没用；可权限给足、让它真正“能干活”，又会带来失控风险，比如误删修改重要文件、越权访问敏感数据、执行不符合预期的指令，甚至在无人监督下做出影响系统和信息安全的行为。这种“不给权限没用、给多权限不安全”的两难，让我很难放心将其投入日常使用。

近期，有关部门也接连对Claw类产品发布安全警示，明确指出这类具备自主执行能力的AI工具在权限管控、数据安全、行为可追溯性等方面存在显著风险，要求相关企业强化安全评估与合规管理，同时提醒用户谨慎部署、严格限制权限范围，避免因AI自主操作引发信息泄露、系统破坏等安全事件。

最后是质量不可控。Claw虽然能自动完成任务，但交付的结果我必须逐一审验核对。可它推理速度快、过程复杂、输出内容又多，我根本来不及逐一复盘和倒查它的决策逻辑。一旦出现错误，很难快速定位原因，最终还是要我自己兜底负责，实际使用起来并不省心。

当然，本次测试存在不少局限性，更多是基于我当前主线任务、工作节奏与时间分配的个人体验，我测试的目的也仅仅是为了跑通流程，理解技术原理和能力边界，并不具备广泛代表性，也欢迎大家在评论中分享自己的经验。

Claw作为一种全新的、能真正执行任务的AI工作模式，本身具有很强的创新性和探索价值，只是目前仍处在发展初期，功能和体验还在快速迭代。我前面提到的成本、安全、质量等问题，相信随着项目成熟和技术优化，都会逐步得到改进与完善。

回到医疗信息化这个具体场景，我认为Claw现阶段最有价值、最值得关注的，并不是它整体的Agent能力，而是它提出的Skill机制。

简单来说，Skill就是一个个轻量化、可复用的任务执行单元，可以理解为给AI配备的“专用工具包”。每个Skill都是一个独立的小型软件包，内部包含一份清晰的说明文档（SKILL.md）和对应的可执行脚本，用来明确告诉AI代理：面对某一类特定任务时，应该遵循什么步骤、调用哪些接口、遵守哪些规则、输出什么结果。

这套Skill的设计思路，让我立刻联想到医院里的实际工作场景：它很像医院行政科室里的规章制度、办事流程与SOP（标准作业程序）。比如医保报销流程、设备报修流程、公文流转流程、数据上报流程、医嘱核对流程等，都是把复杂工作拆成固定、可复用、可追溯的步骤。Skill做的也是类似的事情——把医疗场景中繁琐、重复、规范性强的工作，转化为AI能够理解、能够稳定执行的 “标准化技能”，从而减少人工在理解、执行、记录环节中可能出现的误差与波动，提升流程一致性与可靠性。个人认为，这也是目前它在医疗信息化领域最具落地潜力的核心优势。

收尾

Claw让我看到了AI从“聊天”走向“干活”的巨大潜力，也代表了下一代生产力工具的发展方向。但现阶段它仍处于“能用但不够好用、能跑但不够放心”的早期阶段。对我而言，它并非能立刻替代现有工作流的神器，更像是一个值得长期跟踪与观察的技术方向。好用的生产力工具，从来不是能力越强越好，而是足够可控、可靠、可负担。它目前面临的问题，也都是早期产品迭代的必经之路。

未来，随着成本逐步下降、权限管控更加精细、执行结果更可追溯、可审计，Claw这类AI Agent工具才真正具备大规模普及的基础。而在医疗信息化领域，只要把Skill这种标准化、可复用、强合规的思路做深做透，就很有可能在行政流程、数据处理、医嘱辅助等高频场景中，走出一条真正稳定、可靠、可落地的AI赋能之路。

本文提及的相关产品品牌、文献资料、应用案例等，仅用于技术分析与观点佐证，不构成任何商业推荐、投资建议或品牌背书，亦无任何利益相关。

作者简介

李楠，CHIMA委员，医院信息化工作者，医学统计学博士在读。作者观点仅代表个人，纯属技术交流，与供职单位无关。

CHIMA 2026相关链接