
黄仁勋在GTC大会上将OpenClaw看作是个人计算机时代的操作系统,并将其重要性类比为以前的Windows系统。过去传统的软件依靠人工登录并手动点击按钮来使用,使用者需要经历打开浏览器、输入网址、登录账号和寻找功能菜单等繁琐步骤,属于依靠人的时间来换取机器执行结果的图形界面交互方式。现在的行业方向正在向应用程序接口服务转移,使用者不需要再进入软件点击按钮,只要下达一句话的指令,系统就能通过自动调用接口去完成任务,把人找系统彻底变成了系统找人。顺着这个行业动态,本次梳理围绕底层技术原理、能力构成差异以及国内各大科技公司的落地进展展开。
一、核心机制
OpenClaw本质上是一个开源的智能体网关程序,可以在用户的本地电脑上部署运行,并且能够直接访问用户的本地文件。普通用户不需要掌握复杂的编程代码或自己去配置各种技术接口,就能通过飞书、企业微信、QQ等日常熟悉的聊天软件随时使用它。网关在这个过程中扮演了核心中枢的角色,它专门负责接收来自不同通信渠道的消息,然后把这些自然语言消息转发给背后的智能体处理。等智能体处理完任务后,网关再把生成的结果发回给用户最初使用的聊天窗口,同时它还要在后台默默管理整个交互过程中的会话状态和上下文记忆。
以往大家熟悉的聊天机器人大多停留在单次问答阶段,用户输入问题,模型生成文字回答,交互到这里就结束了。这种传统模式无法主动操作外部系统,而且只要当前对话轮次结束,之前的沟通信息就很容易失效,加上每轮对话本身也有字符长度的限制,很难完成复杂的长线任务。相比之下,新的机制是以持续工作流为核心的,它能够主动控制浏览器完成网页自动点击、表单填写和数据采集,也可以直接运行代码来处理本地数据。在文件管理方面,它能够自主读取、编辑和创建文档,甚至还可以针对周期性的常规工作设立定时任务,真正把机器从被动应答推向了主动执行。
二、两大关键能力
要支撑上述这些复杂的自动操作,需要依赖应用程序接口和具体技能这两个相互配合的能力结构。应用程序接口解决的是工具如何连接外部系统的问题,它不处理复杂的业务逻辑,只提供收发消息或获取数据的基础功能。目前市场上存在海量的接口资源,比如企业微信、钉钉、飞书、滴滴、百度翻译以及各类天气和快递查询接口,这些通道极大地拓展了系统获取外部信息的广度。仅飞书平台就开放了大量的接口,涵盖了通讯录、消息群组、文档、日历等多个模块。为了消除不同平台接口标准不一致带来的对接障碍,行业内推出了专门的协议标准,致力于让工具与外部数据源建立起统一规范的双向连接。
另一方面,技能组件解决的是具体怎么去执行的问题。在具体的操作中,技能被定义为由指令、脚本和资源组成的文件夹,它相当于把某一类事情的专业操作方式封装成了一个可以重复使用和自动触发的模块。普通的提示词机制每次执行任务都需要重新描述背景,并且会占用大量的上下文长度限制,稳定性也高度依赖每次输入的语言质量。而封装好的技能只需要进行一次全局设置,在触发时才会读取完整内容,由于采用了固定的流程模板,因此执行的一致性非常高。在一个完整的技能目录结构里,通常包含用来告知身份的主说明文件、界定可使用工具的脚本文件夹、规定执行流程的参考文档以及各类模板素材资源。为了方便国内用户使用,腾讯还专门推出了本土化的技能社区配套服务平台,提供高速下载和中文搜索等功能,直接兼容开源社区的全量生态。
三、国内大厂竞逐
随着技术框架的成型,国内公司迅速开启了密集的产品发布潮。在这场抢占入口的商业竞争中,各家采取了差异化的推进策略。时间回到2026年1月底,腾讯云和阿里云率先在云端上线了相关的轻量级一键部署方案,主要面向有一定动手能力的技术用户。随后在2月中旬,各个独立模型开发商相继入局,月之暗面发布了KimiClaw,MiniMax推出了MaxClaw,智谱上线了AutoClaw,阶跃星辰也推出了StepClaw产品。
进入3月后,老牌互联网大厂开始依托自身原有的产品生态发力,字节跳动上线了飞书妙搭,百度推出了云端部署工具,网易发布了有道龙虾,360上线了安全龙虾产品。同时,华为、小米等智能手机硬件厂商也开始将相关的终端产品推向市场,试图在设备底层建立起新的控制中枢。
在这批竞争者中,腾讯展示出了明显的社交入口倾向。腾讯通过一套多产品的矩阵体系覆盖了不同的使用场景。面向企业办公需求,腾讯推出了可以直接嵌在企业微信里运行的WorkBuddy产品。面向个人日常使用,则发布了可以通过QQ或者微信调用的QClaw产品。为了进一步降低普通人的使用门槛,腾讯在3月下旬直接推出了微信内部的插件,用户不需要打开电脑或者进行复杂的代码部署,就能在普通的微信对话窗口里远程控制本地的智能体,实现语音聊天和文件收发等功能。
庞大的基础用户群体成为了这种策略的底气所在。截至2025年底,微信及合并月活跃账户数达到了14.18亿,其小程序月活跃用户规模也维持在高位。高频次的社交入口加上极低的使用门槛,让腾讯在这场交互习惯争夺战中具备了天然的用户触达优势。
除了直接的产品发布,腾讯还公开了底层的技术支持架构。这套体系从下至上分为五个层次,最底层是提供算力和数据存储的智算底座。往上一层是灵活调度的模型服务平台,能够根据具体需求智能匹配包括腾讯混元大模型在内的全系主流第三方模型。第三层是包含腾讯文档、QQ浏览器等自有产品接口以及外部开源资源的技能工具箱。第四层则是直接与用户接触的微信、企业微信和QQ等四大国民级应用入口。最外围是贯穿全过程的安全防护系统,用来防范高权限带来的隐私泄露和误操作等风险。这种清晰的层级划分,反映了当前行业向体系化和平台化发展的趋势。
四、数据壁垒影响
虽然各家都在积极推出产品形态,但决定这项技术能否真正产生商业价值的根本在于对上下文和数据的获取能力。表面的竞争看似是比拼模型生成文字的速度和质量,底层的真正竞争其实是业务语料的长期积累。对于企业而言,内部的行政制度说明、历史项目总结、客户沟通往来邮件以及各类审批流程数据,都属于非公开性质的核心资产。这些私有语料才是指导机器完成特定任务的关键信息来源,也是区分通用系统和专业系统的核心壁垒。
这种变化将会对现有的企业服务软件行业产生明显的分化影响。那些自身掌握大量私有数据、业务流程高度固化且拥有成熟用户权限体系的软件厂商,可以凭借多年积累的数据资产进一步巩固竞争地位。而那些功能单一、缺乏深度业务场景绑定的纯工具型轻量软件,一旦用户习惯了通过一句话指令让机器自动调用接口去完成任务,这些软件原有的简单界面功能就很容易被直接替代或跳过,生存空间面临被压缩的风险。
伴随这种强大执行能力而来的还有不可忽视的安全挑战。系统要代替人去完成任务,就必须获得极高的系统权限,不仅要读取邮件内容,还要调用日历甚至直接执行代码,权限的加深在提高执行效率的同时,也放大了潜在的数据安全和操作风险,如何在商业落地中做好边界管控是企业面临的现实问题。
五、产业链条汇总
当前的产业主线依然围绕技术能力的落地与应用层面的用户连接展开,通过手机端、超级应用和垂直平台等多个维度持续改变着普通人的数字交互习惯。从投资视角的观察来看,那些具备实际产品落地进度并且能够明确产生收入结构的方向受到了更多的关注。以下为核心公司:
1. 具备原生流量与平台分发优势的公司:腾讯、阿里、快手、哔哩哔哩。
2. 聚集于大型平台周边生态链条的公司:在字节体系中,聚焦广告营销与内容业务的包括引力传媒、蓝色光标、浙文互联、因赛集团、利欧股份、易点天下、天龙集团,涉及内容版权方向的包括荣信文化、中文在线、掌阅科技、博纳影业。
在阿里体系中,以电商业务为重心的包括值得买、光云科技、焦点科技,从事代运营业务的包括壹网壹创、青木科技。在腾讯体系中,贴近消费者端产品的包括微盟、有赞、线上线下。
3. 多应用方向轮动的公司:在发掘权威信息源方面包括人民网、新华网、博瑞传播。在游戏开发及社交陪伴方向包括恺英网络、巨人网络、心动公司、昆仑万维。
以上,仅供参考。














扫码加入知识星球获取更多行业报告

声明:本文仅为行业研究与学术交流之用,不构成任何投资建议或操作指引。市场风险客观存在,应基于独立判断与充分调研作出决策。
点击“阅读原文”,下载所有资料
夜雨聆风