AI智能体从聊天到干活:OpenClaw引爆三部门发文

AI应用 · 5月29日

AI智能体从聊天到干活：OpenClaw引爆三部门发文

一个奥地利工程师的周末项目，如何推动中国三部门联合发文？2026年，AI的时代主题从大模型变成了智能体。

喜欢的朋友，点赞、推荐、关注，然后慢慢看

2025年11月的一个周末，奥地利维也纳。Peter Steinberger坐在电脑前，花了48小时写完了一个开源项目的初始版本。他没有想到，六个月后，这个"周末项目"会成为全球AI行业最热门的话题之一，直接推动中国国家互联网信息办公室、国家发展改革委、工业和信息化部三部委在2026年5月联合发布《智能体规范应用与创新发展实施意见》。

这个项目叫OpenClaw。它的意义远远超出了一个开源框架的范畴。它像一个催化剂，把AI行业酝酿已久的焦虑和期待同时点燃——人们不再满足于跟AI聊天，而是开始追问一个更实际的问题：AI什么时候能真正帮我干活？

一个周末项目的蝴蝶效应

Peter Steinberger这个名字你可能没听过，但如果你用过iOS上的PDF阅读器PSPDFKit，你已经在用他的产品。他是奥地利一位资深iOS开发者，也是开源社区的活跃贡献者。2025年11月，他在GitHub上提交了OpenClaw的第一行代码，描述只有一句话："An open framework for building AI agents that actually do things."——一个用于构建"真正能办事"的AI智能体的开源框架。

OpenClaw的设计哲学非常简洁：它不在模型层做创新，而是在"行动层"做突破。传统的大语言模型是"你说一句，它回一句"，中间缺乏执行能力。OpenClaw的做法是在模型和外部世界之间建立一套标准化的行动接口，让AI可以像人一样操作电脑——打开浏览器、填写表单、发送邮件、调用API、读写文件。本质上，它是把"聊天AI"变成了"干活的AI"。

这个理念并不新。2023年就有AutoGPT、BabyAGI等早期尝试，但它们大多停留在实验阶段，像一个会自己找事做的机器人，但十次有八次把事情做错。OpenClaw的不同之处在于，它把"可靠性"放在了第一位。Steinberger在设计时就说："一个智能体不需要什么都会，它需要把会做的事情做对。"这种务实的态度，恰好击中了行业的痛点。

到2026年4月，OpenClaw在GitHub上获得了超过4.2万颗星，被Figma、Notion、Stripe等公司的工程团队纳入内部工具链。更关键的是，它催生了一个全新的生态——围绕OpenClaw出现了超过300个第三方插件，覆盖从日程管理到数据分析的各类场景。开发者社区的热情证明了一件事：大家已经准备好迎接一个AI不仅能"说"还能"做"的时代。

OpenClaw到底是个什么东西

如果你不是开发者，可能会觉得"开源框架"这个词很抽象。我用一个比喻来解释。假设大语言模型是一台发动机，有巨大的动力但缺少传动系统和方向盘——它能转，但没法让车跑起来。OpenClaw相当于给这台发动机装上了变速箱、传动轴和方向盘，让它变成一辆可以实际驾驶的车。

具体来说，OpenClaw做了三件事。第一，它定义了一套标准化的"工具调用"协议，让AI可以像人类使用软件一样操作各种工具——从搜索引擎到代码编辑器，从邮件客户端到电商后台。第二，它引入了一个"任务规划器"，能把复杂任务拆解成可执行的步骤序列，并在每一步完成后检查结果。第三，也是最重要的，它设计了一个"安全沙箱"机制，确保AI在执行操作时不会越界——比如不会在未经确认的情况下删除文件或发起支付。

这三层设计解决了智能体领域长期存在的两个核心矛盾：能力与可靠性的矛盾，以及自主性与安全性的矛盾。过去人们总觉得，AI要足够聪明才能独立做事。但OpenClaw证明了一个相反的逻辑：如果你给AI一套足够好的"行动基础设施"，即使模型本身没有突破，它也能做出令人惊讶的实际成果。

这种思路有点像iPhone的革命。iPhone不是第一个智能手机，但它第一个把触屏、应用商店和移动操作系统整合成一个流畅的整体体验。OpenClaw在AI智能体领域扮演的角色类似——它不发明新的模型，但它让现有模型的能力得以在现实世界中落地。

Peter Steinberger：一个工程师的"玩心"

了解Steinberger的人都知道，他是一个典型的"工程师中的工程师"。他在一次播客采访中说了一段让我印象深刻的话："我写OpenClaw的初衷很简单——我厌烦了每次让AI帮我做一件事，都要手动复制粘贴来回复制粘贴去。我想让AI直接操作我的电脑，就像我雇了一个实习生。"

这段话点出了一个被很多人忽视的事实：2023到2025年的大模型热潮中，我们花了太多精力让AI变得更"聪明"，但很少有人认真思考怎么让AI变得更"有用"。"聪明"和"有用"之间的差距，就是OpenClaw试图解决的问题。

Steinberger本人对项目的商业化非常克制。OpenClaw至今保持完全开源（Apache 2.0协议），他也没有成立公司，而是继续经营着他的PSPDFKit。在接受TechCrunch采访时，他说："我只是觉得这个东西应该存在。如果它能帮到别人，目的就达到了。"这种"做了再说"的工程师精神，在今天的AI创业环境中显得格外珍贵。当一个领域被万亿市值的巨头们主导时，一个独立开发者用周末时间做出来的东西反而改变了游戏规则，这本身就充满了启示意义。

三部门联合发文——为什么国家要管一个技术框架

2026年5月，中国国家互联网信息办公室、国家发展改革委、工业和信息化部三部委联合发布《智能体规范应用与创新发展实施意见》。这份文件的出台时间点——距离OpenClaw引爆全球讨论不到一个月——引发了许多人的联想。

文件的核心理念可以概括为八个字："鼓励创新，守住底线"。前半句体现在多个方面：明确支持AI智能体在制造业、金融、医疗、教育、政务服务等领域的试点应用，要求各行业主管部门在2026年底前制定本行业的智能体应用指南，鼓励地方政府建立智能体应用示范区。后半句则体现在安全底线的设定：要求智能体系统必须具备可追溯的决策链路，涉及重大决策场景必须保留人工确认环节，禁止智能体以自然人身份进行商业签约或法律行为。

这份文件标志着中国在全球范围内率先对AI智能体进行系统性规制引导。相比于欧盟的AI法案侧重风险分级，中国的做法更强调"发展导向"——不是先设限再发展，而是在发展中立规矩。从文件的字里行间可以读出一种紧迫感：政策制定者已经意识到，AI智能体不是遥远的未来，而是正在发生的现实，与其等它来临时手忙脚乱，不如提前划好跑道。

大厂已全面入局：一场没有退路的竞赛

政策信号明确之后，中国科技巨头的动作比外界想象的更快。百度的文心智能体平台在2026年第一季度新增了超过50万个智能体实例，覆盖客服、营销、数据分析等场景。阿里云在2026年4月的云栖大会上，重点展示的不是新模型，而是基于通义千问的"百炼智能体平台"，号称支持"零代码构建企业级AI Agent"。

腾讯的路径更侧重C端场景。微信小程序生态中已经出现了超过2000款AI智能体应用，从旅行规划到保险比价，从简历优化到法律咨询。字节跳动则把豆包大模型和飞书深度绑定，推出的"飞书智能伙伴"可以自动生成绩效报告、整理会议纪要、追踪项目进度。

创业公司层面，智谱AI在2026年5月推出了AutoGLM，一个对标OpenClaw的开源智能体框架，上线两周GitHub星数突破1.5万。月之暗面（Moonshot AI）的Kimi也在向智能体方向演进，最新版本支持多步骤信息检索和报告自动生成。这些动作的密集程度，在5月达到了一个高峰——几乎每周都有新的智能体产品或更新发布。

大厂全面入局的背后有一个简单而残酷的逻辑：如果你不做智能体，你的模型就只是"会说话的词典"，而竞争对手的模型已经变成了"能办事的员工"。在模型能力逐渐趋同的背景下，智能体能力正在成为新的差异化战场。用一位投资人的话说："2025年大家比的是模型参数，2026年大家比的是'模型+行动层'的组合。"

新华网的深度解读：不止聊天，真能干活

5月26日，新华网发表了一篇题为《AI智能体：不止聊天，真能干活》的深度分析文章。作为国家级媒体，新华网选择在这个时间点发声，本身就是一个强烈的信号。文章的核心观点有两条：第一，AI智能体正在从"辅助工具"升级为"执行主体"，这是人工智能发展史上的一个重要拐点；第二，中国在AI智能体应用层面具备独特的先发优势，因为中国拥有全球最丰富的数字化场景和海量数据。

新华网文章举了几个具体案例。浙江一家服装外贸公司，用AI智能体自动处理跨境订单——从接收英文询价邮件、查询库存、计算运费到生成报价单，过去需要三个人花半天的工作，现在一个智能体15分钟完成。深圳一家医院引入智能体系统后，门诊病历的录入时间从平均8分钟降到了1.5分钟，医生可以把更多精力放在真正的诊疗上。这些案例不是科幻，不是概念验证，是正在发生的现实。

"不止聊天，真能干活"这句话之所以打动人心，是因为它精准概括了过去两年AI发展的尴尬——大模型能写诗、能写代码、能过律师资格考试，但在日常工作中，它仍然是一个需要人来操作的"工具"，而不是一个能独立完成任务的"助手"。智能体的价值就在于，它把AI从"工具"升级成了"助手"，甚至在某些场景下升级成了"代理"。

一个普通人一天中的AI智能体

让我们来想象一个场景——不是五年后的科幻场景，而是2026年下半年一个普通人可能经历的一天。

早上7:30，闹钟响起的同时，你的AI健康智能体已经根据你的睡眠数据、昨天的运动量和今天的日程安排，生成了四个方案供你选择：方案A建议直接洗漱出门多睡15分钟，方案B提议快速跳绳10分钟，方案C推荐一份低升糖的早餐搭配。你半梦半醒间选了一个，智能体已经开始同步执行——它把咖啡机预热，在手机上推送今天的第一个提醒。

上午9:00，你坐在办公室。邮件箱里躺着27封未读邮件。你的AI工作智能体已经对这27封邮件做了预处理：9封垃圾邮件直接归档，6封需要简单回复的已经起草了回复草稿等你确认，8封需要转给同事的已经自动转发并附上了简要说明，剩下4封真正需要你亲自处理的被高亮标记，每封后面附上了相关的背景资料和往期邮件对话摘要。你花15分钟处理完了过去需要一个半小时的工作。

下午2:00，项目周会。AI智能体全程参与，实时生成会议纪要，自动提取待办事项并分配给对应负责人，甚至在你说"下周三之前把方案改好"时，它已经在你的日历上预留了三个工作时段。会议结束，所有人手机上已经收到了一份结构清晰的纪要，不差分毫。

这就是智能体的真正价值——它不是替代你思考，而是把你从碎片化的执行工作中解放出来，让你把精力集中在真正需要创造力和判断力的事情上。这正是一个35到55岁职场人最需要的东西：时间。

智能体能做什么，不能做什么

在看到智能体的巨大潜力时，我们也需要保持清醒。当前阶段的AI智能体有其明确的边界。它能做的是：信息检索与汇总、多步骤流程自动化、基于规则的决策支持、格式化的内容生成。它做不好的是：需要长期规划和战略远见的决策、涉及复杂人际沟通的场景、需要创造性突破的工作、以及任何需要"直觉"和"经验判断"的领域。

一个形象的类比：当前的AI智能体像一个非常聪明但完全没有经验的实习生。你交给它一个明确的任务，它会完成得很漂亮。但如果任务边界模糊、需要大量判断和沟通，它就会陷入困境。理解这个边界，才能更好地利用它。最聪明的做法不是等智能体完美之后再用，而是现在就开始用它做它擅长的事，同时亲自处理那些它做不好的事。这需要判断力——而判断力恰好是目前AI最缺乏的东西。

值得注意的是，智能体的能力边界正在以月为单位向外扩展。2025年初的智能体连一个简单的"订机票"任务都很难独立完成——因为涉及登录、比价、支付等多个环节，任何一个环节出错就全盘崩溃。到了2025年底，随着模型能力提升和工具链成熟，一些特定场景下的成功率已经超过90%。OpenClaw的贡献在于，它把这个从90%到99%的"最后一段路"变成了一个可以工程化解决的问题，而不是只能靠模型随机性碰运气。

我的判断：智能体不是风口，是基础设施

让我说一段掏心窝子的话。看了过去两年AI行业的起起落落，我有一个越来越清晰的判断：AI智能体不是一个新的风口，而是一种正在形成的基础设施。风口的意思是来一阵风，猪都能飞，然后风停了，一地鸡毛。基础设施的意思是，它会像电、互联网、移动支付一样，渗透到每一个行业、每一个岗位、每一个人的日常中，慢慢地、不可逆地改变我们做事的方式。2026年的智能体热潮和2023年的大模型热潮有一个本质区别：大模型是"能力展示"，智能体是"能力落地"。展示期会出现大量泡沫，一个能做100分的demo被包装成能做1000分的产品。但落地期的逻辑完全不同——大家不再关心你的智能体会说多漂亮的话，只关心它能不能把一桩具体的活干好。这种从"看热闹"到"看疗效"的转变，对整个行业来说是好事。泡沫会破裂，但真正有价值的东西会留下来，成为未来十年数字世界的底层架构。

我特别想强调一个观点：智能体对普通职场人的意义，远比它对开发者的意义更大。开发者关心的是框架、协议、API，而一个在银行做风控的经理、一个在广告公司做创意的文案、一个在工厂做质量管理的主管，他们不需要懂这些技术细节。他们需要的只是：有一个东西，能把我每天重复做的那些碎片化的、机械性的工作接过去。当这种需求被满足的时候，释放出来的生产力是惊人的。历史已经反复证明这一点——每一次"自动化"的真实价值，都不是在取代人，而是在让人从重复劳动中解脱出来，去做更有创造性的事情。印刷术没有消灭作家，它让作家不用再手抄书稿；Excel没有消灭会计，它让会计不用再手算表格；AI智能体也不会消灭职场人，它会让职场人第一次有机会把精力全部聚焦在"只有人才能做"的事情上——判断、创造、连接、共情。

站在2026年5月这个时间点上，我看到的不是一个"风口来了要不要上车"的问题，而是一个"基础设施正在建成，你准备好了没有"的问题。准备好了的人，会把智能体当成自己的数字同事，让它处理80%的执行工作，自己专注20%的决策和创造。没准备好的人，可能会在几年后发现自己还在手工处理那些同事已经用AI自动完成的工作——而这之间的差距，不是技术差距，是认知差距。

中国的独特优势：场景丰富度

讨论AI智能体，不能不说中国市场的独特优势。中国不是AI基础研究最强的国家，但在AI应用层面，中国的场景丰富度是全球独一无二的。从微信生态到电商平台，从政务服务到制造业，从物流配送到移动支付，中国拥有全球最密集的数字化应用场景。每一个场景都是一个AI智能体的潜在落地点。

以政务服务为例。中国许多城市的政务服务平台已经积累了海量的办事流程数据——从营业执照办理到社保查询，从公积金提取到出入境预约。这些标准化、流程化的场景，恰好是AI智能体最擅长的领域。一些地方的试点已经显示，引入智能体后，在线办事的平均处理时间缩短了60%以上，群众满意度显著提升。

再看制造业。中国拥有全球最大的制造业体量，工厂里的排产、质检、物料管理、设备维护环节，每一个都是AI智能体的潜在应用场景。过去工厂的信息化改造需要巨额投入和很长的实施周期，但AI智能体提供了一条"轻量化"的路径——不需要整个工厂从头到尾改造IT系统，只需要在一个环节部署智能体，就能产生可见的效率提升。

场景丰富带来的另一个好处是数据飞轮效应。智能体用得越多，产生的高质量数据越多，模型能力越强，智能体的表现越好——这是一个正向循环。这意味着，谁先大规模部署智能体，谁就能建立起数据护城河。从目前来看，中国凭借场景优势，在这个正向循环的启动阶段跑在了前面。

2026下半年：智能体将走向何方

站在5月的尾巴上展望下半年，AI智能体领域有几个值得关注的趋势。第一是行业垂直化。通用智能体框架之后，会出现大量针对特定行业深度优化的智能体产品，比如专门服务律所的"法律智能体"、服务医院的"诊疗助手"、服务工厂的"产线管家"。这种垂直化是智能体从"能用"走向"好用"的必经之路。

第二是协作化。单个智能体能做的事情终究有限，真正的生产力跃迁发生在多个智能体协同工作的场景中。想象一个装修项目：一个智能体负责预算和采购，一个智能体负责施工进度，一个智能体负责与业主沟通——它们之间共享一套任务状态和信息流，形成一个虚拟的"项目团队"。这种多智能体协作的架构，目前还在早期探索阶段，但2026年下半年很可能出现标杆案例。

第三是监管框架的完善。三部门发文是第一步，后续会有一系列配套细则出台，涉及数据安全、责任认定、行业准入等具体问题。对于企业和开发者来说，关注监管动态不是在"自找麻烦"，而是在"提前看清跑道"。在一个规则明确的场地上跑，比在一片模糊地带中冒进要稳妥得多。

最后，也是我认为最重要的趋势：智能体将从"开发者工具"演变为"普通人工具"。2026年上半年，大多数智能体产品的用户画像还是技术背景的人，但下半年开始，面向非技术用户的智能体产品会成批出现。这些产品的关键特征就是"不用写一行代码"——通过自然语言描述需求，智能体自动完成任务。当这一步实现的时候，AI智能体才真正走进了大多数人的生活。

给普通职场人的三个建议

说完了趋势和判断，我想对正在看这篇文章的你说几句实在话。如果你是一个35到55岁的职场人，面对AI智能体的崛起，你的焦虑和不安全感是完全可以理解的。但焦虑之后，行动才是最重要的。我给你三个建议。

第一，从现在开始，把你日常工作拆成两类：一类是需要你亲自做决策的，一类是执行性质的。然后观察，执行性质的工作中有多少可以被AI替代。不是"未来可能被替代"，而是"现在有没有工具可以做"。你会发现，今天已经有很多事情可以通过AI大幅提效，只是我们习惯了手动的舒适区。

第二，学会"指挥"AI。指挥不是敲代码，是描述需求。你需要培养一种能力：把模糊的想法变成清晰的指令。这个能力在智能体时代会比任何具体技能都重要。那些善于向AI清晰表达需求的人，会发现自己的生产力是同事的五倍甚至十倍。

第三，拥抱"人机协作"而不是恐惧"人机替代"。如果你看过一级方程式赛车，你就知道车手和工程师团队是配合关系，不是替代关系。AI智能体就是你的工程师团队——它不会抢走你的方向盘，但它会让你跑得更快、更稳、更安全。未来的核心竞争力，不是你比AI强大，而是你比其他人更会用好AI。

时代不会等你准备好。AI智能体的浪潮已经拍到了脚下，你可以选择站在潮头，也可以选择被潮水打湿。但至少，看完这篇文章，你知道了潮水的方向。剩下的，就是你自己的选择了。

如果觉得有收获，请点赞、转发、关注

问大家一个问题：你工作中最想让AI智能体帮你干的一件事是什么？

（A/处理邮件和日程 B/写报告做总结 C/整理数据做分析 D/替你跟客户聊天）

还想看什么内容？留言告诉我