AI应用 · 5月29日
AI智能体从聊天到干活:OpenClaw引爆三部门发文
一个奥地利工程师的周末项目,如何推动中国三部门联合发文?2026年,AI的时代主题从大模型变成了智能体。
喜欢的朋友,点赞、推荐、关注,然后慢慢看
2025年11月的一个周末,奥地利维也纳。Peter Steinberger坐在电脑前,花了48小时写完了一个开源项目的初始版本。他没有想到,六个月后,这个"周末项目"会成为全球AI行业最热门的话题之一,直接推动中国国家互联网信息办公室、国家发展改革委、工业和信息化部三部委在2026年5月联合发布《智能体规范应用与创新发展实施意见》。
这个项目叫OpenClaw。它的意义远远超出了一个开源框架的范畴。它像一个催化剂,把AI行业酝酿已久的焦虑和期待同时点燃——人们不再满足于跟AI聊天,而是开始追问一个更实际的问题:AI什么时候能真正帮我干活?
一个周末项目的蝴蝶效应
Peter Steinberger这个名字你可能没听过,但如果你用过iOS上的PDF阅读器PSPDFKit,你已经在用他的产品。他是奥地利一位资深iOS开发者,也是开源社区的活跃贡献者。2025年11月,他在GitHub上提交了OpenClaw的第一行代码,描述只有一句话:"An open framework for building AI agents that actually do things."——一个用于构建"真正能办事"的AI智能体的开源框架。
OpenClaw的设计哲学非常简洁:它不在模型层做创新,而是在"行动层"做突破。传统的大语言模型是"你说一句,它回一句",中间缺乏执行能力。OpenClaw的做法是在模型和外部世界之间建立一套标准化的行动接口,让AI可以像人一样操作电脑——打开浏览器、填写表单、发送邮件、调用API、读写文件。本质上,它是把"聊天AI"变成了"干活的AI"。
这个理念并不新。2023年就有AutoGPT、BabyAGI等早期尝试,但它们大多停留在实验阶段,像一个会自己找事做的机器人,但十次有八次把事情做错。OpenClaw的不同之处在于,它把"可靠性"放在了第一位。Steinberger在设计时就说:"一个智能体不需要什么都会,它需要把会做的事情做对。"这种务实的态度,恰好击中了行业的痛点。
到2026年4月,OpenClaw在GitHub上获得了超过4.2万颗星,被Figma、Notion、Stripe等公司的工程团队纳入内部工具链。更关键的是,它催生了一个全新的生态——围绕OpenClaw出现了超过300个第三方插件,覆盖从日程管理到数据分析的各类场景。开发者社区的热情证明了一件事:大家已经准备好迎接一个AI不仅能"说"还能"做"的时代。
OpenClaw到底是个什么东西
如果你不是开发者,可能会觉得"开源框架"这个词很抽象。我用一个比喻来解释。假设大语言模型是一台发动机,有巨大的动力但缺少传动系统和方向盘——它能转,但没法让车跑起来。OpenClaw相当于给这台发动机装上了变速箱、传动轴和方向盘,让它变成一辆可以实际驾驶的车。
具体来说,OpenClaw做了三件事。第一,它定义了一套标准化的"工具调用"协议,让AI可以像人类使用软件一样操作各种工具——从搜索引擎到代码编辑器,从邮件客户端到电商后台。第二,它引入了一个"任务规划器",能把复杂任务拆解成可执行的步骤序列,并在每一步完成后检查结果。第三,也是最重要的,它设计了一个"安全沙箱"机制,确保AI在执行操作时不会越界——比如不会在未经确认的情况下删除文件或发起支付。
这三层设计解决了智能体领域长期存在的两个核心矛盾:能力与可靠性的矛盾,以及自主性与安全性的矛盾。过去人们总觉得,AI要足够聪明才能独立做事。但OpenClaw证明了一个相反的逻辑:如果你给AI一套足够好的"行动基础设施",即使模型本身没有突破,它也能做出令人惊讶的实际成果。
这种思路有点像iPhone的革命。iPhone不是第一个智能手机,但它第一个把触屏、应用商店和移动操作系统整合成一个流畅的整体体验。OpenClaw在AI智能体领域扮演的角色类似——它不发明新的模型,但它让现有模型的能力得以在现实世界中落地。
Peter Steinberger:一个工程师的"玩心"
了解Steinberger的人都知道,他是一个典型的"工程师中的工程师"。他在一次播客采访中说了一段让我印象深刻的话:"我写OpenClaw的初衷很简单——我厌烦了每次让AI帮我做一件事,都要手动复制粘贴来回复制粘贴去。我想让AI直接操作我的电脑,就像我雇了一个实习生。"
这段话点出了一个被很多人忽视的事实:2023到2025年的大模型热潮中,我们花了太多精力让AI变得更"聪明",但很少有人认真思考怎么让AI变得更"有用"。"聪明"和"有用"之间的差距,就是OpenClaw试图解决的问题。
Steinberger本人对项目的商业化非常克制。OpenClaw至今保持完全开源(Apache 2.0协议),他也没有成立公司,而是继续经营着他的PSPDFKit。在接受TechCrunch采访时,他说:"我只是觉得这个东西应该存在。如果它能帮到别人,目的就达到了。"这种"做了再说"的工程师精神,在今天的AI创业环境中显得格外珍贵。当一个领域被万亿市值的巨头们主导时,一个独立开发者用周末时间做出来的东西反而改变了游戏规则,这本身就充满了启示意义。
三部门联合发文——为什么国家要管一个技术框架
2026年5月,中国国家互联网信息办公室、国家发展改革委、工业和信息化部三部委联合发布《智能体规范应用与创新发展实施意见》。这份文件的出台时间点——距离OpenClaw引爆全球讨论不到一个月——引发了许多人的联想。
文件的核心理念可以概括为八个字:"鼓励创新,守住底线"。前半句体现在多个方面:明确支持AI智能体在制造业、金融、医疗、教育、政务服务等领域的试点应用,要求各行业主管部门在2026年底前制定本行业的智能体应用指南,鼓励地方政府建立智能体应用示范区。后半句则体现在安全底线的设定:要求智能体系统必须具备可追溯的决策链路,涉及重大决策场景必须保留人工确认环节,禁止智能体以自然人身份进行商业签约或法律行为。
这份文件标志着中国在全球范围内率先对AI智能体进行系统性规制引导。相比于欧盟的AI法案侧重风险分级,中国的做法更强调"发展导向"——不是先设限再发展,而是在发展中立规矩。从文件的字里行间可以读出一种紧迫感:政策制定者已经意识到,AI智能体不是遥远的未来,而是正在发生的现实,与其等它来临时手忙脚乱,不如提前划好跑道。
大厂已全面入局:一场没有退路的竞赛
政策信号明确之后,中国科技巨头的动作比外界想象的更快。百度的文心智能体平台在2026年第一季度新增了超过50万个智能体实例,覆盖客服、营销、数据分析等场景。阿里云在2026年4月的云栖大会上,重点展示的不是新模型,而是基于通义千问的"百炼智能体平台",号称支持"零代码构建企业级AI Agent"。
腾讯的路径更侧重C端场景。微信小程序生态中已经出现了超过2000款AI智能体应用,从旅行规划到保险比价,从简历优化到法律咨询。字节跳动则把豆包大模型和飞书深度绑定,推出的"飞书智能伙伴"可以自动生成绩效报告、整理会议纪要、追踪项目进度。
创业公司层面,智谱AI在2026年5月推出了AutoGLM,一个对标OpenClaw的开源智能体框架,上线两周GitHub星数突破1.5万。月之暗面(Moonshot AI)的Kimi也在向智能体方向演进,最新版本支持多步骤信息检索和报告自动生成。这些动作的密集程度,在5月达到了一个高峰——几乎每周都有新的智能体产品或更新发布。
大厂全面入局的背后有一个简单而残酷的逻辑:如果你不做智能体,你的模型就只是"会说话的词典",而竞争对手的模型已经变成了"能办事的员工"。在模型能力逐渐趋同的背景下,智能体能力正在成为新的差异化战场。用一位投资人的话说:"2025年大家比的是模型参数,2026年大家比的是'模型+行动层'的组合。"
新华网的深度解读:不止聊天,真能干活
5月26日,新华网发表了一篇题为《AI智能体:不止聊天,真能干活》的深度分析文章。作为国家级媒体,新华网选择在这个时间点发声,本身就是一个强烈的信号。文章的核心观点有两条:第一,AI智能体正在从"辅助工具"升级为"执行主体",这是人工智能发展史上的一个重要拐点;第二,中国在AI智能体应用层面具备独特的先发优势,因为中国拥有全球最丰富的数字化场景和海量数据。
新华网文章举了几个具体案例。浙江一家服装外贸公司,用AI智能体自动处理跨境订单——从接收英文询价邮件、查询库存、计算运费到生成报价单,过去需要三个人花半天的工作,现在一个智能体15分钟完成。深圳一家医院引入智能体系统后,门诊病历的录入时间从平均8分钟降到了1.5分钟,医生可以把更多精力放在真正的诊疗上。这些案例不是科幻,不是概念验证,是正在发生的现实。
"不止聊天,真能干活"这句话之所以打动人心,是因为它精准概括了过去两年AI发展的尴尬——大模型能写诗、能写代码、能过律师资格考试,但在日常工作中,它仍然是一个需要人来操作的"工具",而不是一个能独立完成任务的"助手"。智能体的价值就在于,它把AI从"工具"升级成了"助手",甚至在某些场景下升级成了"代理"。
一个普通人一天中的AI智能体
让我们来想象一个场景——不是五年后的科幻场景,而是2026年下半年一个普通人可能经历的一天。
早上7:30,闹钟响起的同时,你的AI健康智能体已经根据你的睡眠数据、昨天的运动量和今天的日程安排,生成了四个方案供你选择:方案A建议直接洗漱出门多睡15分钟,方案B提议快速跳绳10分钟,方案C推荐一份低升糖的早餐搭配。你半梦半醒间选了一个,智能体已经开始同步执行——它把咖啡机预热,在手机上推送今天的第一个提醒。
上午9:00,你坐在办公室。邮件箱里躺着27封未读邮件。你的AI工作智能体已经对这27封邮件做了预处理:9封垃圾邮件直接归档,6封需要简单回复的已经起草了回复草稿等你确认,8封需要转给同事的已经自动转发并附上了简要说明,剩下4封真正需要你亲自处理的被高亮标记,每封后面附上了相关的背景资料和往期邮件对话摘要。你花15分钟处理完了过去需要一个半小时的工作。
下午2:00,项目周会。AI智能体全程参与,实时生成会议纪要,自动提取待办事项并分配给对应负责人,甚至在你说"下周三之前把方案改好"时,它已经在你的日历上预留了三个工作时段。会议结束,所有人手机上已经收到了一份结构清晰的纪要,不差分毫。
这就是智能体的真正价值——它不是替代你思考,而是把你从碎片化的执行工作中解放出来,让你把精力集中在真正需要创造力和判断力的事情上。这正是一个35到55岁职场人最需要的东西:时间。
智能体能做什么,不能做什么
在看到智能体的巨大潜力时,我们也需要保持清醒。当前阶段的AI智能体有其明确的边界。它能做的是:信息检索与汇总、多步骤流程自动化、基于规则的决策支持、格式化的内容生成。它做不好的是:需要长期规划和战略远见的决策、涉及复杂人际沟通的场景、需要创造性突破的工作、以及任何需要"直觉"和"经验判断"的领域。
一个形象的类比:当前的AI智能体像一个非常聪明但完全没有经验的实习生。你交给它一个明确的任务,它会完成得很漂亮。但如果任务边界模糊、需要大量判断和沟通,它就会陷入困境。理解这个边界,才能更好地利用它。最聪明的做法不是等智能体完美之后再用,而是现在就开始用它做它擅长的事,同时亲自处理那些它做不好的事。这需要判断力——而判断力恰好是目前AI最缺乏的东西。
值得注意的是,智能体的能力边界正在以月为单位向外扩展。2025年初的智能体连一个简单的"订机票"任务都很难独立完成——因为涉及登录、比价、支付等多个环节,任何一个环节出错就全盘崩溃。到了2025年底,随着模型能力提升和工具链成熟,一些特定场景下的成功率已经超过90%。OpenClaw的贡献在于,它把这个从90%到99%的"最后一段路"变成了一个可以工程化解决的问题,而不是只能靠模型随机性碰运气。
我的判断:智能体不是风口,是基础设施
让我说一段掏心窝子的话。看了过去两年AI行业的起起落落,我有一个越来越清晰的判断:AI智能体不是一个新的风口,而是一种正在形成的基础设施。风口的意思是来一阵风,猪都能飞,然后风停了,一地鸡毛。基础设施的意思是,它会像电、互联网、移动支付一样,渗透到每一个行业、每一个岗位、每一个人的日常中,慢慢地、不可逆地改变我们做事的方式。2026年的智能体热潮和2023年的大模型热潮有一个本质区别:大模型是"能力展示",智能体是"能力落地"。展示期会出现大量泡沫,一个能做100分的demo被包装成能做1000分的产品。但落地期的逻辑完全不同——大家不再关心你的智能体会说多漂亮的话,只关心它能不能把一桩具体的活干好。这种从"看热闹"到"看疗效"的转变,对整个行业来说是好事。泡沫会破裂,但真正有价值的东西会留下来,成为未来十年数字世界的底层架构。
我特别想强调一个观点:智能体对普通职场人的意义,远比它对开发者的意义更大。开发者关心的是框架、协议、API,而一个在银行做风控的经理、一个在广告公司做创意的文案、一个在工厂做质量管理的主管,他们不需要懂这些技术细节。他们需要的只是:有一个东西,能把我每天重复做的那些碎片化的、机械性的工作接过去。当这种需求被满足的时候,释放出来的生产力是惊人的。历史已经反复证明这一点——每一次"自动化"的真实价值,都不是在取代人,而是在让人从重复劳动中解脱出来,去做更有创造性的事情。印刷术没有消灭作家,它让作家不用再手抄书稿;Excel没有消灭会计,它让会计不用再手算表格;AI智能体也不会消灭职场人,它会让职场人第一次有机会把精力全部聚焦在"只有人才能做"的事情上——判断、创造、连接、共情。
站在2026年5月这个时间点上,我看到的不是一个"风口来了要不要上车"的问题,而是一个"基础设施正在建成,你准备好了没有"的问题。准备好了的人,会把智能体当成自己的数字同事,让它处理80%的执行工作,自己专注20%的决策和创造。没准备好的人,可能会在几年后发现自己还在手工处理那些同事已经用AI自动完成的工作——而这之间的差距,不是技术差距,是认知差距。
中国的独特优势:场景丰富度
讨论AI智能体,不能不说中国市场的独特优势。中国不是AI基础研究最强的国家,但在AI应用层面,中国的场景丰富度是全球独一无二的。从微信生态到电商平台,从政务服务到制造业,从物流配送到移动支付,中国拥有全球最密集的数字化应用场景。每一个场景都是一个AI智能体的潜在落地点。
以政务服务为例。中国许多城市的政务服务平台已经积累了海量的办事流程数据——从营业执照办理到社保查询,从公积金提取到出入境预约。这些标准化、流程化的场景,恰好是AI智能体最擅长的领域。一些地方的试点已经显示,引入智能体后,在线办事的平均处理时间缩短了60%以上,群众满意度显著提升。
再看制造业。中国拥有全球最大的制造业体量,工厂里的排产、质检、物料管理、设备维护环节,每一个都是AI智能体的潜在应用场景。过去工厂的信息化改造需要巨额投入和很长的实施周期,但AI智能体提供了一条"轻量化"的路径——不需要整个工厂从头到尾改造IT系统,只需要在一个环节部署智能体,就能产生可见的效率提升。
场景丰富带来的另一个好处是数据飞轮效应。智能体用得越多,产生的高质量数据越多,模型能力越强,智能体的表现越好——这是一个正向循环。这意味着,谁先大规模部署智能体,谁就能建立起数据护城河。从目前来看,中国凭借场景优势,在这个正向循环的启动阶段跑在了前面。
2026下半年:智能体将走向何方
站在5月的尾巴上展望下半年,AI智能体领域有几个值得关注的趋势。第一是行业垂直化。通用智能体框架之后,会出现大量针对特定行业深度优化的智能体产品,比如专门服务律所的"法律智能体"、服务医院的"诊疗助手"、服务工厂的"产线管家"。这种垂直化是智能体从"能用"走向"好用"的必经之路。
第二是协作化。单个智能体能做的事情终究有限,真正的生产力跃迁发生在多个智能体协同工作的场景中。想象一个装修项目:一个智能体负责预算和采购,一个智能体负责施工进度,一个智能体负责与业主沟通——它们之间共享一套任务状态和信息流,形成一个虚拟的"项目团队"。这种多智能体协作的架构,目前还在早期探索阶段,但2026年下半年很可能出现标杆案例。
第三是监管框架的完善。三部门发文是第一步,后续会有一系列配套细则出台,涉及数据安全、责任认定、行业准入等具体问题。对于企业和开发者来说,关注监管动态不是在"自找麻烦",而是在"提前看清跑道"。在一个规则明确的场地上跑,比在一片模糊地带中冒进要稳妥得多。
最后,也是我认为最重要的趋势:智能体将从"开发者工具"演变为"普通人工具"。2026年上半年,大多数智能体产品的用户画像还是技术背景的人,但下半年开始,面向非技术用户的智能体产品会成批出现。这些产品的关键特征就是"不用写一行代码"——通过自然语言描述需求,智能体自动完成任务。当这一步实现的时候,AI智能体才真正走进了大多数人的生活。
给普通职场人的三个建议
说完了趋势和判断,我想对正在看这篇文章的你说几句实在话。如果你是一个35到55岁的职场人,面对AI智能体的崛起,你的焦虑和不安全感是完全可以理解的。但焦虑之后,行动才是最重要的。我给你三个建议。
第一,从现在开始,把你日常工作拆成两类:一类是需要你亲自做决策的,一类是执行性质的。然后观察,执行性质的工作中有多少可以被AI替代。不是"未来可能被替代",而是"现在有没有工具可以做"。你会发现,今天已经有很多事情可以通过AI大幅提效,只是我们习惯了手动的舒适区。
第二,学会"指挥"AI。指挥不是敲代码,是描述需求。你需要培养一种能力:把模糊的想法变成清晰的指令。这个能力在智能体时代会比任何具体技能都重要。那些善于向AI清晰表达需求的人,会发现自己的生产力是同事的五倍甚至十倍。
第三,拥抱"人机协作"而不是恐惧"人机替代"。如果你看过一级方程式赛车,你就知道车手和工程师团队是配合关系,不是替代关系。AI智能体就是你的工程师团队——它不会抢走你的方向盘,但它会让你跑得更快、更稳、更安全。未来的核心竞争力,不是你比AI强大,而是你比其他人更会用好AI。
时代不会等你准备好。AI智能体的浪潮已经拍到了脚下,你可以选择站在潮头,也可以选择被潮水打湿。但至少,看完这篇文章,你知道了潮水的方向。剩下的,就是你自己的选择了。
如果觉得有收获,请点赞、转发、关注
问大家一个问题:你工作中最想让AI智能体帮你干的一件事是什么?
(A/处理邮件和日程 B/写报告做总结 C/整理数据做分析 D/替你跟客户聊天)
还想看什么内容?留言告诉我
推荐阅读
AI时代的"卖铲人":为何投资GPU的不如投资半导体的赚得多 Claude Code实战:一个不会写代码的人如何用AI完成数据分析 AI眼镜爆发前夜:谁在抢滩下一代计算平台免责声明:本文内容仅供信息参考,不构成任何决策依据。技术发展具有不确定性。
作者:牛牛 审核:静静 编辑:玻珠
夜雨聆风