大家好,我是秦明,OpenClaw,业内戏称龙虾,是当下AI圈最火的话题了。3月27日,我和新老朋友在北京广联达1期做了场直播,客串了下主持人,主题是:造价人养虾大会。本文是与两位AI博主朋友的观点蒸馏,一位是「AI赛博土木」的Bruce、另一位是「鹏哥撩工程」的鹏哥,供大家参考。
文中观点代表讨论参与者在特定时点的个人判断,不代表任何机构或平台的官方立场。技术细节和成本数字为讨论时的近似估算,仅供量级参考,请以实际使用情况为准。



OpenClaw,另一种软件形态
1. OpenClaw与豆包/kimi的本质差异不在于模型质量,而在于执行架构。传统对话模型是「一问一答、用完即走」,每次交互独立、无状态。OpenClaw是有自主规划能力的Agent:给它一个文件,它会自己判断该调用OCR技能、PDF解析还是知识库检索,无需用户预先指定工具链。
2. 用户不再需要写提示词这件事,比想象中影响更大。以前使用豆包解决问题,需要先明确需求、构建高质量提示词、再发送。OpenClaw的落地场景是:把合同PDF扔进去,它自动识别这是施工总承包合同,自动触发合同风控技能,自动按高/中/低风险分级输出结构化清单。整个过程用户输入为零。
3.OpenClaw更接近「有工具箱的工人」而非「能对话的搜索引擎」。以前的智能体是一锤一钉,一个工具只解决一个问题。OpenClaw内置任务规划层,会自动从工具箱里选择合适的工具组合,执行多步任务。这一点是当前AI Agent形态与历代智能体最根本的代差。
4. Skill(技能文件)是OpenClaw的核心资产单元,不是功能,是封装好的工作流。一个Skill本质是一个Markdown文件,描述触发场景、执行步骤、调用工具和输出格式。Skill可以包含Python脚本,意味着对于结构化任务(如清单审核),最终执行的是代码而非大模型生成,结果精确且可控。
5. 代码执行 vs 大模型生成,在工程场景下有明确分工原则:数据提取、数量核对、格式校验等结构化任务,由脚本执行,结果可信;风险识别、合规判断、建议生成等非结构化任务,由大模型处理。OpenClaw的价值在于把两者串联起来,而不是用大模型替代代码。
装龙虾这件事,门槛被严重高估也被严重低估
6. 安装OpenClaw的真实门槛不在于理解概念,在于两个基础依赖:Git和Node.js(版本≥22)。大多数非IT背景用户卡在这里。解决方案是:不要用命令行方式安装,直接去官网下载安装程序双击运行,这和安装普通软件无异。这一步通了,后续流程基本顺畅。
7. API Key的选择比模型选择更重要。早期版本OpenClaw对国内模型支持有限,现版本已支持国内主流模型。建议先去kimi或DeepSeek申请API Key备好,安装过程中会有粘贴入口,这一步提前准备可以节省大量时间。
8. 云端部署是一个被低估的替代路径。国内主要大厂现在基本都提供OpenClaw的云端一键部署,快则1分钟,慢则3分钟。成本结构是:云服务器租赁费 + API调用费。但门槛趋近于零,适合不愿折腾本地环境的用户先跑通再说。
9. 本地部署 vs 云端部署的选择逻辑:如果你的使用场景涉及公司内部文件、敏感合同,本地部署的数据安全性更高;如果你只是个人探索,云端更快。两者不是非此即彼,可以先云端验证价值,再本地部署跑正式业务。
工程造价的哪些场景,真的值得用龙虾
10. 判断是否值得用OpenClaw的核心标准:这个任务有没有成型的、可重复的工作流?如果一项任务每次都要经历「提取信息→分类→识别风险→给建议」这样的固定步骤,就应该封装成Skill,而不是每次手动提示。临时性、单次查询的任务,用豆包即可。
11. 招标文件审阅是当前验证ROI最清晰的场景。一份标准招标文件,人工完整阅读约30分钟;OpenClaw处理后,用户只需2分钟做结果审查,AI工作时间约3分钟。这不是辅助,是流程重构。更重要的是,它识别的是投标须知前附表、评分标准、专用条款等结构化节点,不是泛读。
12. 签证图片识别是一个反直觉的高价值场景。手机随手拍的签证图片,含打印体、手写体、盖章,OCR技能可以做到95%以上的信息完整提取,包括签字意见(手写)、时效信息、合规风险标注。这个能力放在三年前,需要专门的OCR产品加上人工校对。
13. 合同风控分析里,「立场切换」功能解决了一个长期存在的痛点。同一份合同,甲方视角、总包视角、咨询公司视角的风险关注点完全不同。OpenClaw可以在分析前询问立场,然后基于该立场对高/中/低风险条款分级输出。这个逻辑需要人工设计,但执行是自动化的。
14. 结算争议处理是目前最有深度的应用场景之一。结合知识库(相关法律法规、司法解释、指导案例、公报案例),OpenClaw可以在分钟级内匹配出支持己方立场的法律依据和典型判例。这件事此前需要律师或资深商务人员完成,且耗时不稳定。
15. 投标文件编写(标书)的场景验证了「递进式交互」的价值。OpenClaw不是一次性交付一份完整标书,而是:提取评分标准→生成大纲→征询确认→逐章编写→再次征询。这个交互逻辑解决了传统AI写标书「你接受就接受,不接受也没办法」的核心问题,用户在每个关键节点保留控制权。
16. 龙虾会偷懒是一个需要正视的系统特性,不是bug。在演示中出现了AI声称没有收到评分标准(实际已上传)的情况。处理策略:明确告知已提供,重新下达指令,通常第二次会执行。这种现象在复杂任务中会反复出现,用户需要接受「需要适度PUA」是当前Agent使用的正常状态。
Skill是新型资产,不是工具,是经验的容器
17. 一个高质量的工程Skill,本质上是把一位资深工程师的工作流标准化后存入文件。它包含:触发场景定义、执行步骤、调用工具列表、输出格式规范、以及行业特定的判断规则,比如「材料包干不调整条款」属于高风险。这个文件一旦写好,任何人调用都能复现该工程师的工作质量。
18. 新人调用老法师的Skill,效果比跟着老法师学三个月更快。这不是夸张,而是有边界的判断:技术性经验(如何审合同、如何看清单)可以封装;非技术性经验(如何与甲方谈判、如何管项目关系)封装效果有限,仍需实践积累。两类经验需要分开对待。
19.「事例法」是萃取隐性经验的有效路径。对于那些专家「只可意会不可言传」的判断,可以把他做出来的结果(不是过程)直接扔给AI,让AI逆向推导要产生这个结果,应该经历哪些步骤。这个逆向工程的逻辑,比让专家直接描述自己的工作流,往往更能触及真实的判断结构。
20.OpenClaw的Skill Creator(创建技能的技能)是一个元能力。用户不需要懂Markdown,也不需要懂Python,只需要描述「我要解决什么问题、希望经过哪些步骤」,Skill Creator会自动生成对应的Skill文件,包含必要的脚本逻辑。这降低了Skill生产的门槛,但不等于降低了Skill设计的门槛——想清楚「要解决什么问题」仍然是人的工作。
21. 企业级的Skill库,是未来工程咨询公司最重要的护城河之一。当一家公司把过去10年所有项目的审计逻辑、合同谈判策略、结算争议处理路径都封装成Skill,这个Skill库的价值不亚于传统意义上的专家团队。区别在于:专家会离职,Skill不会。
成本是当前最大的实际障碍,但不是长期壁垒
22.OpenClaw的token消耗远高于普通对话模型,原因有结构性解释。每次任务执行,需要读取:Memory文件(记忆库)、agent.md(工作规则)、soul文件(人格定义)、user文件、以及调用的Skill文件。所有这些都计入context消耗。一个写得复杂的Skill文件本身可能就有数千token,每次调用都要加载。
23. 演示场景的量级参考:一次清单审核任务(900条清单,运行约4分钟),token消耗约对应10-15元人民币。这个成本结构放在「替代0.5小时人工」的场景下可接受,放在试玩场景下就是纯消耗。
24. 成本控制有三个操作层面的策略:一是任务完成后开新对话窗口,切断历史上下文;二是使用compact命令压缩上下文;三是通过QMDE等本地向量检索方法,减少每次加载的内容量。三者可以叠加,但都是治标,根本解决需要等算力成本下降和模型效率提升。
25. 对公司部署,用低成本模型是有实际依据的建议,不只是省钱。高成本模型部署给全团队后,员工会用它处理私人事务(周末去哪玩、周边有什么好吃的),造成无效消耗。
26. 类比苹果4的定价逻辑:当前OpenClaw的token成本类似于iPhone 4刚上市时的手机使用费,用得起但用得心疼。历史规律是:1-2年内算力成本下降,模型效率提升,token价格通缩。当前的正确策略是建立工作流、打磨Skill,等成本下来后直接享受规模效益,而不是因为贵就不用。
AI重塑工程人的价值模型,分层效应已经出现
27. 不同工龄的工程人与AI的关系,应该分层看,不应该用同一个框架套。刚毕业的新人,可以直接调用资深工程师的Skill,技术性能力的起点被大幅拉高;工作3-5年的工程人,已有足够行业sense来判断AI输出的质量,是当前最能发挥AI杠杆的群体;20年以上的专家,核心价值越来越在于判断而非执行,需要主动把自己的工作流封装成Skill,否则价值输出效率会被更年轻的人反超。
28.一个人+AI=高效团队,的说法,需要加一个限定词:仅对执行层有效。AI目前可以替代执行层的大量重复工作,但对于需要跨部门协调、关系管理、利益博弈的任务,AI的贡献仍然是辅助性的。
29. 经验沉淀是OpenClaw与对话模型最被低估的差异点。以前每个项目做完,工程人的判断和教训大多停留在脑子里,无法积累成可调用的资产。OpenClaw可以通过语音/文字输入,把碎片化的经验(包括与甲方沟通的话术、对量时遇到的陷阱)整理进知识库,形成可调用的个人/团队资产。用得越久,系统越聪明。
30. 数字分身的逻辑是可行的,但需要长期投入。如果一个工程人坚持把每个项目的决策过程、沟通记录、判断依据录入OpenClaw,2-3年后这个系统会形成对该用户工作模式的深度建模。届时它处理的不只是文件,而是按这个人的思维方式处理文件。这是一个值得现在就开始做的长期投资。
31. 甲方画像功能是一个意想不到的高价值应用。把所有与特定甲方的沟通记录录入OpenClaw,让它持续分析这个甲方的决策风格、偏好的汇报格式、风险敏感点,在下次沟通前生成针对性的策略建议。这件事人可以做,但坚持不了;AI可以坚持,但需要人喂数据。
32. 安全边界的设定需要在架构层解决,不能只靠使用习惯。公司团队共用一个OpenClaw实例时,已出现记忆混淆的真实案例(AI把A的身份记成了B)。更严重的潜在风险:来源不明的Skill文件可能植入恶意代码,在用户不知情的情况下读取本地敏感文件。当前的最佳实践是:个人实例与公司实例物理隔离,API账户余额保持低位(30-50元),不存储密码类敏感信息。
欢迎文末扫码加入AI4E社群,与大家交流工程AI的更多细节信息。以上,如果觉得不错,随手点个赞、在看、转发三连吧,也欢迎给AI4ELAB个星标⭐,以便您第一时间收到推送~谢谢阅读,下篇内容再见。


夜雨聆风