OpenClaw、Harness之后,企业怎么用好Agent|爱分析访谈
OpenClaw和Harness正在冲击企业刚成型的Agent落地方法论。企业如何将充满不确定性的Claw融入追求确定性的业务流程?Harness如何与既有的提示词工程、上下文工程体系融合?
在此背景下,我们选择与未来式智能创始人杨劲松进行深度对话。杨劲松曾为电网、石化等大型央企提供战略规划与落地服务,现在创立的未来式智能也在央国企拥有大量Agent落地实践。
本次访谈重点讨论几个核心问题,OpenClaw适用场景、记忆系统设计以及数字劳动力新商业模式思考。
一是有明确规则,二是模型具备相关知识,三是工具边界清晰。典型如编程、内容创作以及财务等岗位的数字员工。
-
企业构建记忆体系,分为任务记忆、角色记忆、组织记忆三层。
任务记忆、角色记忆,周期性地向组织层同步,形成一个不断进化的体系。
专家将其能力数字化,在平台上让更多用户使用其专业能力,并按照结果产生的价值进行分成。
01
爱分析:如何看待OpenClaw对于企业智能体的影响?
杨劲松:其实从 2023 年Agent概念兴起之后,行业里一直有两条路线:一类是Workflow,另一类是更偏自主规划的Agent。后者就是以OpenClaw为代表。我的理解是,这两者并不是互斥关系,而是对应不同的业务场景。
在企业内部,大量流程其实是要求结果高度确定的,这类场景用Workflow其实已经可以很好解决。比如定期生成制式报告、合规类流程,这些明显更适合Workflow,而且会长期存在。
而OpenClaw这种形态,本质上是一个Agentic loop,在不断循环判断任务是否完成,但企业很多流程其实路径是明确的,不需要每次重新规划,这种额外的planning开销,从效率和成本上看并不划算。
OpenClaw最大优势在于开放性,可以做探索。这其实可以和Workflow形成互补。我们更倡导的是一种组合模式:整体流程还是基于企业既有的管理流程来执行,但在一些需要决策、分析或者开放探索的节点,引入OpenClaw探索的节点,把两者的优势结合起来。
比如某个岗位有100个任务,大概80%是确定流程的,这部分我们直接用Workflow。剩下20%是更灵活的,需要对已有能力做组合,这一部分就用OpenClaw的方式,让它自主去探索完成。所以整体其实是一个混合模式。
从长期来看,我们自己的产品形态也会往这个方向演进:既有企业统一下发的主流程,也允许员工在此基础上叠加个性化能力,形成一个“云+端”的工作模式。
未来更像是企业内部会有一个统一的智能体平台,沉淀通用能力,形成组织的知识资产,而员工在此之上形成自己的工作台,满足个性工作习惯,这样整体效率会更高。
杨劲松:OpenClaw这种形态,其实有一个很重要的价值,就是可以作为入口。过去的Agent往往是一个个单点能力,用户要完成某个任务,需要自己去找到对应的Agent。但OpenClaw更像一个统一入口或者调度平台。用户只需要提出问题,它可以去判断意图,然后调用合适的Agent或工具去完成任务。
目前来看,行业里探索出来的,有几类相对比较清晰的方向。
第一类是编程开发相关的场景,比如DevOps、代码库运维等。这类场景效果相对比较好,一方面是模型本身代码能力强,另一方面OpenClaw作为入口,可以把不同工具和环境统一调度,比如定时任务、脚本自动化等,这些已经有不错的实践。
第二类是偏创作类场景,比如自媒体内容生产。这类场景对严谨性要求没那么高,更强调发散性和创造力,所以Agent的优势能发挥出来。
第三类我觉得是比较有潜力的,是一些工作内容零散但规则明确的岗位,比如财务。财务人员日常工作其实很碎,比如处理发票、银行交易、出报表、做分析等等,但规则是明确的,模型也具备相关知识,工具也比较固定。
如果稍微抽象一下,这类适合的场景有几个特点:一是有明确规则,二是模型具备相关知识,三是工具边界清晰。这种情况下,Claw形态是可以跑通并且具备规模化潜力的。
爱分析:OpenClaw是带记忆、偏个性化的,企业侧应该怎么落地记忆模块?
杨劲松:从我们的实践来看,记忆可以分成几个层级。最底层是任务记忆,也就是Agent在执行具体任务过程中积累的经验;再往上是角色记忆,比如你在企业里是做财务、做运营,不同岗位会有不同的工作习惯和处理方式;再往上是组织记忆,也就是这家公司本身的知识资产,包括业务模式、数据、规则等等。
所以我们会看到一个趋势:未来企业内部会有一个统一平台,去沉淀组织级的知识资产,比如数据、Agent、Skill等;而个体员工,则是在自己的角色和任务过程中不断沉淀个人角色记忆。然后这些任务记忆、角色记忆,会周期性地向组织层同步,形成一个不断进化的体系。
爱分析:企业采购Agent平台时,对于记忆模块应该怎么选型?
杨劲松:之前大家其实在记忆这块做得都比较重,比如搞向量数据库、标签体系,设计得很复杂,但用起来不一定好用。OpenClaw给行业一个启发:很多时候不需要那么复杂,用Markdown或文本的方式,做分层摘要,反而简单有效。
但是具体技术方案还是需要根据场景来考量,记忆的设计往往与场景有比较强的耦合,之前大家期待的即插即拔的记忆不一定能够奏效,业内已经开始把记忆做到Harness Engineering(驾驭工程)这一层。
从最终用户真实需求来看,他们最关注的是角色记忆。也就是Agent能不能记住人,也就是用户的偏好、历史行为。这一层,如果能做好,已经能覆盖大部分个性化需求。在我们产品里,也是用类似的方式,通过文本和摘要分层来不断更新记忆,基本可以满足理解用户的需求。
再往上一层,是组织记忆。目前比较有效的实践,是把Agent在执行过程中的结果沉淀下来,比如落到知识库或者数据库中,供下一次使用,从而持续优化效果。
举个例子,我们有一个处理进出口单据的场景。这个任务本身逻辑比较复杂,但如果系统能参考之前处理过的类似案例,那下一次判断的准确率就会明显提升。所以我们会把这些结果沉淀下来,形成可复用的经验,这其实就是组织记忆。
从评估角度来看,也很简单——看效果。比如经过多少轮任务迭代之后,任务完成率、准确率能提升到什么水平,这就是最核心的指标。
02
爱分析:OpenClaw会不会导致企业既有的Agent平台重构?
杨劲松:我觉得关键还是看平台架构。如果是一些云厂商,它的Agent平台是建立在原有云体系之上的,很多模块是耦合在一起的,这种情况下升级会比较困难,很难做到单点能力的快速替换。
但如果是AI Native的架构,从一开始就是模块化、组件化设计的,比如规划、执行、记忆这些模块都是相对独立的,那就可以做到热插拔的升级。
我们判断,Agent技术还在快速演进,每个模块都在变化,所以这种原子化、松耦合的设计会更有优势。
爱分析:除了工作流、记忆,还有哪些Agent能力在企业侧很重要?
杨劲松:Agent多了之后,协作与调度会变得非常重要。比如一个任务从A部门流转到B部门,中间可能就是Agent在传递和处理。在这个过程中,一个核心问题是:什么节点需要人介入?什么节点可以完全自动化?这需要精细设计。
杨劲松:我们之前服务过一家做工程审计的上市公司。他们不是用一个单点的Agent,而是基于大模型和智能体,重构了一整套工作流水线。
工程审计过去的模式是派十几个人到现场,去翻阅大量投标、设计文件,逐条核查关键指标,比如结构强度是否符合设计要求,最后再出报告。整个过程基本是纯人工。
现在他们的做法是,把整个流程拆成一条“人+Agent”的协作流水线。第一步,由一个Agent去处理现场收集到的所有文件,从中抽取出待审计的关键字段信息;第二步,进入一个审计问题库,这个库是专家经验沉淀下来的检查点集合。接着另一个Agent调用造价工具、计算工具,对这些检查点逐一验证。
在这个过程中,人会在关键节点介入。比如第一步抽取的信息,需要人工快速校验;第二步Agent找出的审计问题,也需要人来确认,并拿着这些问题去和被审计单位沟通;沟通结果回来之后,又由新的Agent对这些内容进行整理和润色,最终生成可以直接进入审计报告的文本;整个流程跑完,一份完整的审计报告就自动生成了。
爱分析:听起来不是简单AI替换人工,而是整个作业方式都变了?
杨劲松:对,本质上已经不是原来的SOP 了,而是按照人机协作的逻辑重新设计了一套流程。以前是6个人做一个月的项目,现在是2个人一周就能完成。
所以我觉得,未来企业要真正发挥大模型和智能体的价值,不是单点能力,而是这种组织级的人机协作体系,我们管它叫做知识工作的流水线。
爱分析:除了OpenClaw,Harness最近热度也很高。如何理解Harness的价值?
杨劲松:我们更倾向于把Harness理解为一种工程方法论。
大模型本身要在企业里可用,需要补很多东西——上下文、工具、规范、知识积累等等。Harness要解决的,就是如何把一个原始智能,变成一个可在企业中可靠运行的系统。
其实在这个概念出现之前,Agent厂商一直在做的事情就是这些:搭脚手架、接知识库、配工具,最终目标就是让结果达到可用标准。只是现在,这一整套方法被统一命名了。
它有点像以前的软件工程规范,不是一项技术,而是一整套逐渐形成的共识和工程实践。
爱分析:AI Coding与Agent平台之间是什么关系?
杨劲松:我们现在的实践是,把coding能力嵌入到平台里,但分工是比较清晰的。前端交互层,比如界面、表单、文件上传等,更适合用coding来快速生成;而后端的业务逻辑,则由Agent、Workflow来驱动。
对于大型企业来说,它们已经有大量既有系统,比如ERP等核心系统,短期不可能推倒重来。所以Agent一定是要和这些系统打通、共存。你可以在上层用AI快速生成应用,但最终数据还是要落回原有系统。
这也是为什么像SAP和Palantir的合作会受到关注——本质上就是在既有系统之上做抽象,让AI能够更容易构建新应用,同时不破坏底层体系。
对于初创公司或者新组织来说,情况就不一样了。它们可以直接用低代码甚至Agent的方式,基于像飞书、Notion这样的工具,快速搭建CRM或财务系统,甚至可能不需要传统软件。
还有一类是用完即走的场景,比如一次性的分析任务、小需求处理,这些未来很可能由业务人员直接用 AI完成,不再需要完整的开发流程。
03
爱分析:未来式智能从一开始就选择了ToB市场,当时如何做的决策?
杨劲松:从长期来看,我们其实不把自己简单定义为ToB或ToC公司,而是希望做成一个数字劳动力供给平台。
简单说,就是把Agent当成数字员工,直接提供给企业去使用,甚至是雇佣,最终按照结果付费。这个事情底层逻辑就是,在不远的未来,算力就约等于劳动力,模型公司提供的是无差别的tokens,而我们提供的是业务tokens,兑付的各个岗位任务对应劳动力的价值,这是一个万亿规模的市场。
但这个目标在2023年刚创业的时候,其实是做不到的。当时Agent能力还很弱,只能解决单点任务。真正的转折是在2024、2025年,大企业开始希望有一个企业级平台,把专家能力数字化。这时候ToB市场是最现实、也是最大的切入点。所以我们先服务大企业,因为在那个时间点做这个事情成本还是非常高的。
这一阶段本质上是在做两件事:一是商业化,二是积累能力。随着模型能力提升、成本下降,Agent 开始具备标准化的可能,可以逐步变成一种可复用的数字员工。这时候,我们就把能力迁移到公有云上,按结果付费,服务更多中小客户。
所以整体路径是先 ToB 积累能力,再平台化输出,最终走向数字劳动力市场。
杨劲松:我们一直在做一件事:把专家能力数字化的门槛降到最低。最早是低代码、拖拽式Workflow,需要Agent工程师和客户一起梳理流程;后来进化到用户可以讲一讲,甚至把流程图给我们,我们就能生成Agent;再往前走,我们现在做的是,用户只需要演示一遍,边操作边讲解,这个过程就可以被转化成一个Agent,后续可以反复复用。
你会发现,这是一个不断降低表达成本的过程:从要会设计流程,到能讲清楚,再到只需要演示。我们最终希望的是,让每一个专家都可以把自己的能力数字化,而且是低成本、可规模化的。
爱分析:但现实中,很多专家并不愿意把自己的能力开放出来,这一点怎么解决?
杨劲松:这是一个很关键的问题。如果只是让专家把Skill上传、免费下载,这件事其实很难成立。因为专家的能力,是十几年甚至二十年积累的,不会轻易开放。
所以我们的设计是:专家和平台合作,把能力数字化,但知识产权仍然归专家。然后通过平台,让更多用户使用这些能力,并按照结果产生价值,再进行分成。本质上,我们不是在做工具分发,而是在做能力交易。
爱分析:Agent平台的工具能力并不是核心竞争点?
杨劲松:我们不认为工具能力是长期壁垒。真正的核心在于两个方面:一是场景积累,二是任务效果。
我们在做的是,把不同岗位、不同任务中,人类专家到底在做什么,抽象出来,并不断数字化。比如处理复杂文档、操作软件、做分析判断,这些都是可以跨行业复用的能力。相比传统厂商强调的行业know-how,我们更偏向于往下一层抽象,沉淀通用的知识工作能力。
第一阶段,是以国央企为代表的大客户,作为早期付费主体。这一阶段更多是平台化交付,企业长期业务构建在我们的平台之上。
第二阶段,是能力标准化之后,面向更广大的企业提供数字专家服务,逐步走向按结果付费。
第三阶段,是更长期的形态,Agent 不只是软件,还可能嵌入到硬件中,成为完成特定任务的带有具身的专家。
最终的核心逻辑始终不变:用智能体完成原本由人完成的任务,并按照对应的人力价值来定价。
杨劲松:过去ToB项目成本高,主要是因为需要大量定制开发,比如写代码、对接接口、做前端。
业务逻辑可以通过自然语言生成Workflow;前端界面可以用AI coding自动生成;没有 API 的系统,可以通过GUIAgent去连接。
这些原本最耗时的环节,现在基本都被自动化了。所以我们的整体毛利已经可以做到80%左右。
杨劲松:我们去年大概是4倍增长,今年目标是3倍左右,接近一个阶段性的小目标。
一方面,是因为Agent市场需求确实在快速增长;另一方面,我们也看到一个明显的市场错配:大厂提供的是工具,但客户真正想要的是效果。
而我们这两年一直在做的,是沉淀可以直接交付结果的场景,并把这些场景卖给客户,而不是卖工具。