OpenClaw是由奥地利工程师彼得・施泰因贝格尔(Peter Steinberger)创建的开源AI智能体(AI Agent)执行框架,于2026年1月正式对外开源,被业界称为“真正能干活的AI”。它不只是对话交互,核心能力是替用户自主完成真实任务,包括收发邮件、管理日程、预订机票、运营社媒、文件处理、浏览器自动化等,可直接在本地设备部署并执行操作,实现从“给出建议”到“落地完成”的全流程自动化。有兴趣的可以看腾讯技术工程这篇科普文章:OpenClaw,你需要了解的:核心架构、运作原理、Agent部署步骤。
OpenClaw引发关注后,国内厂商也快速跟进,推出了多款类似产品。2月底的某一天,我选择了两款国产Claw产品,在一台闲置的电脑上完成部署测试,主要有两个目的:一是跑通流程,熟悉技术原理;二是摸清它的真实能力边界。
这两款分别是网易推出的有道Claw,以及MiniMax推出的MaxClaw。两者部署方式略有差异:有道Claw采用本地安装部署+用户自行配置第三方大模型API;MaxClaw则是云端部署+自家MiniMax M2.5模型,后端均对接了飞书。
整体安装门槛不高,对照技术文档,不到一小时就把两个Claw全部跑通,飞书里也多出了两个机器人。按产品文案的描述,我已经可以开始 “训练它们干活” 了。但在实际测试一段时间后,我还是选择了暂停使用,核心原因来自三个“不可控”:
首先是成本不可控。迁移成本、时间成本和Token成本都是我必须考虑的现实因素。在Claw出现之前,我对手头的事务性工作已经形成一套成熟稳定的处理模式,哪些亲力亲为、哪些交给自动化工作流,都有清晰经验,且运行顺畅。是否有必要把这套成熟体系迁移到一个全新工具上,本身就值得商榷。我也不可能为了用Claw而去刻意创造需求。
让我意外的是,它的Token消耗远超预期,甚至高出数倍。原因很简单:我与Claw的对话只占很小一部分,大量Token都消耗在它执行任务、反复推理、自主决策的隐形过程中。一上午测试下来,有道Claw搭配的某大模型赠送额度就已耗尽;而原本可免费部署的MaxClaw,也在我测试不久后,因用户大量涌入而导致宕机,随即提高部署门槛,改为付费订阅。
其次是安全不可控。Claw的工作模式让我陷入明显矛盾:作为能直接替用户执行真实操作的AI工具,它的能力高度依赖系统权限与操作权限。权限给少了,收发邮件、管理日程、调用接口、操作应用等核心功能都无法实现,基本等于没用;可权限给足、让它真正“能干活”,又会带来失控风险,比如误删修改重要文件、越权访问敏感数据、执行不符合预期的指令,甚至在无人监督下做出影响系统和信息安全的行为。这种“不给权限没用、给多权限不安全”的两难,让我很难放心将其投入日常使用。
近期,有关部门也接连对Claw类产品发布安全警示,明确指出这类具备自主执行能力的AI工具在权限管控、数据安全、行为可追溯性等方面存在显著风险,要求相关企业强化安全评估与合规管理,同时提醒用户谨慎部署、严格限制权限范围,避免因AI自主操作引发信息泄露、系统破坏等安全事件。
最后是质量不可控。Claw虽然能自动完成任务,但交付的结果我必须逐一审验核对。可它推理速度快、过程复杂、输出内容又多,我根本来不及逐一复盘和倒查它的决策逻辑。一旦出现错误,很难快速定位原因,最终还是要我自己兜底负责,实际使用起来并不省心。
当然,本次测试存在不少局限性,更多是基于我当前主线任务、工作节奏与时间分配的个人体验,我测试的目的也仅仅是为了跑通流程,理解技术原理和能力边界,并不具备广泛代表性,也欢迎大家在评论中分享自己的经验。
Claw作为一种全新的、能真正执行任务的AI工作模式,本身具有很强的创新性和探索价值,只是目前仍处在发展初期,功能和体验还在快速迭代。我前面提到的成本、安全、质量等问题,相信随着项目成熟和技术优化,都会逐步得到改进与完善。
回到医疗信息化这个具体场景,我认为Claw现阶段最有价值、最值得关注的,并不是它整体的Agent能力,而是它提出的Skill机制。
简单来说,Skill就是一个个轻量化、可复用的任务执行单元,可以理解为给AI配备的“专用工具包”。每个Skill都是一个独立的小型软件包,内部包含一份清晰的说明文档(SKILL.md)和对应的可执行脚本,用来明确告诉AI代理:面对某一类特定任务时,应该遵循什么步骤、调用哪些接口、遵守哪些规则、输出什么结果。
这套Skill的设计思路,让我立刻联想到医院里的实际工作场景:它很像医院行政科室里的规章制度、办事流程与SOP(标准作业程序)。比如医保报销流程、设备报修流程、公文流转流程、数据上报流程、医嘱核对流程等,都是把复杂工作拆成固定、可复用、可追溯的步骤。Skill做的也是类似的事情——把医疗场景中繁琐、重复、规范性强的工作,转化为AI能够理解、能够稳定执行的 “标准化技能”,从而减少人工在理解、执行、记录环节中可能出现的误差与波动,提升流程一致性与可靠性。个人认为,这也是目前它在医疗信息化领域最具落地潜力的核心优势。
Claw让我看到了AI从“聊天”走向“干活”的巨大潜力,也代表了下一代生产力工具的发展方向。但现阶段它仍处于“能用但不够好用、能跑但不够放心”的早期阶段。对我而言,它并非能立刻替代现有工作流的神器,更像是一个值得长期跟踪与观察的技术方向。好用的生产力工具,从来不是能力越强越好,而是足够可控、可靠、可负担。它目前面临的问题,也都是早期产品迭代的必经之路。
未来,随着成本逐步下降、权限管控更加精细、执行结果更可追溯、可审计,Claw这类AI Agent工具才真正具备大规模普及的基础。而在医疗信息化领域,只要把Skill这种标准化、可复用、强合规的思路做深做透,就很有可能在行政流程、数据处理、医嘱辅助等高频场景中,走出一条真正稳定、可靠、可落地的AI赋能之路。
本文提及的相关产品品牌、文献资料、应用案例等,仅用于技术分析与观点佐证,不构成任何商业推荐、投资建议或品牌背书,亦无任何利益相关。
李楠,CHIMA委员,医院信息化工作者,医学统计学博士在读。作者观点仅代表个人,纯属技术交流,与供职单位无关。


夜雨聆风