造价人养虾大会:关于OpenClaw,行业老手说了32句真心话

大家好，我是秦明，OpenClaw，业内戏称龙虾，是当下AI圈最火的话题了。3月27日，我和新老朋友在北京广联达1期做了场直播，客串了下主持人，主题是：造价人养虾大会。本文是与两位AI博主朋友的观点蒸馏，一位是「AI赛博土木」的Bruce、另一位是「鹏哥撩工程」的鹏哥，供大家参考。

文中观点代表讨论参与者在特定时点的个人判断，不代表任何机构或平台的官方立场。技术细节和成本数字为讨论时的近似估算，仅供量级参考，请以实际使用情况为准。

OpenClaw，另一种软件形态

1. OpenClaw与豆包/kimi的本质差异不在于模型质量，而在于执行架构。传统对话模型是「一问一答、用完即走」，每次交互独立、无状态。OpenClaw是有自主规划能力的Agent：给它一个文件，它会自己判断该调用OCR技能、PDF解析还是知识库检索，无需用户预先指定工具链。

2. 用户不再需要写提示词这件事，比想象中影响更大。以前使用豆包解决问题，需要先明确需求、构建高质量提示词、再发送。OpenClaw的落地场景是：把合同PDF扔进去，它自动识别这是施工总承包合同，自动触发合同风控技能，自动按高/中/低风险分级输出结构化清单。整个过程用户输入为零。

3.OpenClaw更接近「有工具箱的工人」而非「能对话的搜索引擎」。以前的智能体是一锤一钉，一个工具只解决一个问题。OpenClaw内置任务规划层，会自动从工具箱里选择合适的工具组合，执行多步任务。这一点是当前AI Agent形态与历代智能体最根本的代差。

4. Skill（技能文件）是OpenClaw的核心资产单元，不是功能，是封装好的工作流。一个Skill本质是一个Markdown文件，描述触发场景、执行步骤、调用工具和输出格式。Skill可以包含Python脚本，意味着对于结构化任务（如清单审核），最终执行的是代码而非大模型生成，结果精确且可控。

5. 代码执行 vs 大模型生成，在工程场景下有明确分工原则：数据提取、数量核对、格式校验等结构化任务，由脚本执行，结果可信；风险识别、合规判断、建议生成等非结构化任务，由大模型处理。OpenClaw的价值在于把两者串联起来，而不是用大模型替代代码。

装龙虾这件事，门槛被严重高估也被严重低估

6. 安装OpenClaw的真实门槛不在于理解概念，在于两个基础依赖：Git和Node.js（版本≥22）。大多数非IT背景用户卡在这里。解决方案是：不要用命令行方式安装，直接去官网下载安装程序双击运行，这和安装普通软件无异。这一步通了，后续流程基本顺畅。

7. API Key的选择比模型选择更重要。早期版本OpenClaw对国内模型支持有限，现版本已支持国内主流模型。建议先去kimi或DeepSeek申请API Key备好，安装过程中会有粘贴入口，这一步提前准备可以节省大量时间。

8. 云端部署是一个被低估的替代路径。国内主要大厂现在基本都提供OpenClaw的云端一键部署，快则1分钟，慢则3分钟。成本结构是：云服务器租赁费 + API调用费。但门槛趋近于零，适合不愿折腾本地环境的用户先跑通再说。

9. 本地部署 vs 云端部署的选择逻辑：如果你的使用场景涉及公司内部文件、敏感合同，本地部署的数据安全性更高；如果你只是个人探索，云端更快。两者不是非此即彼，可以先云端验证价值，再本地部署跑正式业务。

工程造价的哪些场景，真的值得用龙虾

10. 判断是否值得用OpenClaw的核心标准：这个任务有没有成型的、可重复的工作流？如果一项任务每次都要经历「提取信息→分类→识别风险→给建议」这样的固定步骤，就应该封装成Skill，而不是每次手动提示。临时性、单次查询的任务，用豆包即可。

11. 招标文件审阅是当前验证ROI最清晰的场景。一份标准招标文件，人工完整阅读约30分钟；OpenClaw处理后，用户只需2分钟做结果审查，AI工作时间约3分钟。这不是辅助，是流程重构。更重要的是，它识别的是投标须知前附表、评分标准、专用条款等结构化节点，不是泛读。

12. 签证图片识别是一个反直觉的高价值场景。手机随手拍的签证图片，含打印体、手写体、盖章，OCR技能可以做到95%以上的信息完整提取，包括签字意见（手写）、时效信息、合规风险标注。这个能力放在三年前，需要专门的OCR产品加上人工校对。

13. 合同风控分析里，「立场切换」功能解决了一个长期存在的痛点。同一份合同，甲方视角、总包视角、咨询公司视角的风险关注点完全不同。OpenClaw可以在分析前询问立场，然后基于该立场对高/中/低风险条款分级输出。这个逻辑需要人工设计，但执行是自动化的。

14. 结算争议处理是目前最有深度的应用场景之一。结合知识库（相关法律法规、司法解释、指导案例、公报案例），OpenClaw可以在分钟级内匹配出支持己方立场的法律依据和典型判例。这件事此前需要律师或资深商务人员完成，且耗时不稳定。

15. 投标文件编写（标书）的场景验证了「递进式交互」的价值。OpenClaw不是一次性交付一份完整标书，而是：提取评分标准→生成大纲→征询确认→逐章编写→再次征询。这个交互逻辑解决了传统AI写标书「你接受就接受，不接受也没办法」的核心问题，用户在每个关键节点保留控制权。

16. 龙虾会偷懒是一个需要正视的系统特性，不是bug。在演示中出现了AI声称没有收到评分标准（实际已上传）的情况。处理策略：明确告知已提供，重新下达指令，通常第二次会执行。这种现象在复杂任务中会反复出现，用户需要接受「需要适度PUA」是当前Agent使用的正常状态。

Skill是新型资产，不是工具，是经验的容器

17. 一个高质量的工程Skill，本质上是把一位资深工程师的工作流标准化后存入文件。它包含：触发场景定义、执行步骤、调用工具列表、输出格式规范、以及行业特定的判断规则，比如「材料包干不调整条款」属于高风险。这个文件一旦写好，任何人调用都能复现该工程师的工作质量。

18. 新人调用老法师的Skill，效果比跟着老法师学三个月更快。这不是夸张，而是有边界的判断：技术性经验（如何审合同、如何看清单）可以封装；非技术性经验（如何与甲方谈判、如何管项目关系）封装效果有限，仍需实践积累。两类经验需要分开对待。

19.「事例法」是萃取隐性经验的有效路径。对于那些专家「只可意会不可言传」的判断，可以把他做出来的结果（不是过程）直接扔给AI，让AI逆向推导要产生这个结果，应该经历哪些步骤。这个逆向工程的逻辑，比让专家直接描述自己的工作流，往往更能触及真实的判断结构。

20.OpenClaw的Skill Creator（创建技能的技能）是一个元能力。用户不需要懂Markdown，也不需要懂Python，只需要描述「我要解决什么问题、希望经过哪些步骤」，Skill Creator会自动生成对应的Skill文件，包含必要的脚本逻辑。这降低了Skill生产的门槛，但不等于降低了Skill设计的门槛——想清楚「要解决什么问题」仍然是人的工作。

21. 企业级的Skill库，是未来工程咨询公司最重要的护城河之一。当一家公司把过去10年所有项目的审计逻辑、合同谈判策略、结算争议处理路径都封装成Skill，这个Skill库的价值不亚于传统意义上的专家团队。区别在于：专家会离职，Skill不会。

成本是当前最大的实际障碍，但不是长期壁垒

22.OpenClaw的token消耗远高于普通对话模型，原因有结构性解释。每次任务执行，需要读取：Memory文件（记忆库）、agent.md（工作规则）、soul文件（人格定义）、user文件、以及调用的Skill文件。所有这些都计入context消耗。一个写得复杂的Skill文件本身可能就有数千token，每次调用都要加载。

23. 演示场景的量级参考：一次清单审核任务（900条清单，运行约4分钟），token消耗约对应10-15元人民币。这个成本结构放在「替代0.5小时人工」的场景下可接受，放在试玩场景下就是纯消耗。

24. 成本控制有三个操作层面的策略：一是任务完成后开新对话窗口，切断历史上下文；二是使用compact命令压缩上下文；三是通过QMDE等本地向量检索方法，减少每次加载的内容量。三者可以叠加，但都是治标，根本解决需要等算力成本下降和模型效率提升。

25. 对公司部署，用低成本模型是有实际依据的建议，不只是省钱。高成本模型部署给全团队后，员工会用它处理私人事务（周末去哪玩、周边有什么好吃的），造成无效消耗。

26. 类比苹果4的定价逻辑：当前OpenClaw的token成本类似于iPhone 4刚上市时的手机使用费，用得起但用得心疼。历史规律是：1-2年内算力成本下降，模型效率提升，token价格通缩。当前的正确策略是建立工作流、打磨Skill，等成本下来后直接享受规模效益，而不是因为贵就不用。

AI重塑工程人的价值模型，分层效应已经出现

27. 不同工龄的工程人与AI的关系，应该分层看，不应该用同一个框架套。刚毕业的新人，可以直接调用资深工程师的Skill，技术性能力的起点被大幅拉高；工作3-5年的工程人，已有足够行业sense来判断AI输出的质量，是当前最能发挥AI杠杆的群体；20年以上的专家，核心价值越来越在于判断而非执行，需要主动把自己的工作流封装成Skill，否则价值输出效率会被更年轻的人反超。

28.一个人+AI=高效团队，的说法，需要加一个限定词：仅对执行层有效。AI目前可以替代执行层的大量重复工作，但对于需要跨部门协调、关系管理、利益博弈的任务，AI的贡献仍然是辅助性的。

29. 经验沉淀是OpenClaw与对话模型最被低估的差异点。以前每个项目做完，工程人的判断和教训大多停留在脑子里，无法积累成可调用的资产。OpenClaw可以通过语音/文字输入，把碎片化的经验（包括与甲方沟通的话术、对量时遇到的陷阱）整理进知识库，形成可调用的个人/团队资产。用得越久，系统越聪明。

30. 数字分身的逻辑是可行的，但需要长期投入。如果一个工程人坚持把每个项目的决策过程、沟通记录、判断依据录入OpenClaw，2-3年后这个系统会形成对该用户工作模式的深度建模。届时它处理的不只是文件，而是按这个人的思维方式处理文件。这是一个值得现在就开始做的长期投资。

31. 甲方画像功能是一个意想不到的高价值应用。把所有与特定甲方的沟通记录录入OpenClaw，让它持续分析这个甲方的决策风格、偏好的汇报格式、风险敏感点，在下次沟通前生成针对性的策略建议。这件事人可以做，但坚持不了；AI可以坚持，但需要人喂数据。

32. 安全边界的设定需要在架构层解决，不能只靠使用习惯。公司团队共用一个OpenClaw实例时，已出现记忆混淆的真实案例（AI把A的身份记成了B）。更严重的潜在风险：来源不明的Skill文件可能植入恶意代码，在用户不知情的情况下读取本地敏感文件。当前的最佳实践是：个人实例与公司实例物理隔离，API账户余额保持低位（30-50元），不存储密码类敏感信息。

欢迎文末扫码加入AI4E社群，与大家交流工程AI的更多细节信息。以上，如果觉得不错，随手点个赞、在看、转发三连吧，也欢迎给AI4ELAB个星标⭐，以便您第一时间收到推送～谢谢阅读，下篇内容再见。