AI智能体的2026:从会推理到能干活
上周的中关村论坛人工智能主题日上,发生了一件挺有意思的事。
月之暗面创始人杨植、智谱AI CEO张鹏、小米大模型负责人罗福莉坐在一起,讨论了一个话题——OpenClaw和AI智能体。结论很一致:接下来大模型要反过来适应智能体的进化方向。
这可不是个小事。它意味着整个AI行业正在经历一次范式转移。
01 从”会推理”到”能干活”
要理解这个转变,得先说说过去两年整个行业的”主旋律”——让模型更会推理。
2024年底到2025年,OpenAI o1和DeepSeek R1代表的推理模型,核心逻辑就是拉长思考链:给你一个数学题,它会在脑子里多转几圈,转得越久,答案越准。这套路在封闭问题(比如数学、编程竞赛)上确实很管用。
但是,现实世界的问题不是数学题。写周报、做调研、开发软件——这些事儿需要的不只是”想”,更需要”做”。信息不全你得去搜,工具不会你得去学,失败了你得重来。
这就是纯推理模型的边界。前阿里千问技术负责人林俊旸在离职后发了一篇长文,提出了一个关键概念——“Agentic Thinking”(智能体式思考)。他说,好的智能体不能只在那里拼命推理,它必须能:搜索、翻网页、调API、根据反馈调整策略,然后把这些能力串成一个循环。
02 OpenClaw为什么火了?
说到智能体式思考,就绕不开OpenClaw。
OpenClaw这个开源AI智能体框架,今年在国内外都火得一塌糊涂。纽约时报专门报道了中国开发者社区对它的追捧,CNBC也分析了硅谷AI Agent落地中的各种”翻车”。
它的核心设计是两个机制:Harness(马具)和Skill(技能)。
Harness中文直译是”马具”,本质上是一套让大模型”被驾驭”的工程框架,包括上下文管理、长记忆、工具调用这些底层能力。它不负责”思考”本身,但决定了思考怎么被组织、什么时候该去执行、失败了怎么办。
Skill则把各种外部能力变成了AI随时能调用的模块——查天气、发邮件、操作浏览器、调支付接口。大模型需要做的,不再是直接给出答案,而是判断”现在该调用哪个Skill”。
这套机制的效果很直接:同样的大模型底座,放在OpenClaw里和放在普通聊天界面里,表现天差地别。不是模型”变聪明了”,而是它能不断试错、修正路径、利用工具,直到把问题搞定。
03 DeepSeek的”智能体化”转身
DeepSeek也在快速跟进这个趋势。
4月24日发布的DeepSeek-V4,一个重要亮点就是智能体能力的大幅提升。在Agentic Coding评测中,V4-Pro达到了开源模型最佳水平。更关键的是,V4专门对Claude Code、OpenClaw、OpenCode等主流智能体产品做了适配和优化。
同时,V4还上线了多模态识图模式的灰度测试。部分用户打开DeepSeek首页,发现多了一个”识图模式”入口。上传图片后,它能像人一样理解画面——不光认出”这是一只猫”,还能看懂隐喻和情绪。
不过有意思的是,DeepSeek这篇多模态论文发出来没多久又连夜删了。业内猜测要么是技术还不稳定,要么是受到某种外部压力。
另外据媒体报道,DeepSeek还在进行首次外部融资,估值不低于100亿美元。创始人梁文锋此前多次拒绝融资,这次松口,也说明AI大模型的商业化竞争进入了新的阶段。
04 智能体时代的三个信号
总结一下,2026年智能体赛道已经出现了几个很明确的信号:
信号一:大模型在适应智能体,而不是反过来。新发布的模型都在针对OpenClaw等框架做适配,推理模型不再是唯一主流,”Agentic Thinking”成了新的方向标。
信号二:基础设施投入在疯狂加速。微软AI业务年化收入达370亿美元,Google Cloud首破200亿美元,Meta资本支出最高至1450亿美元——巨头们不是在赌,是在清场。
信号三:安全挑战随之爆发。Ars Technica和多家安全机构发布警告,AI Agent的自主权越大,安全风险越高。OpenClaw的权限管理、数据隔离、执行审计,已经成为比模型能力更紧迫的议题。
05 结语
去年这个时候,大家还在讨论”AI能不能推理”。到了今年,问题已经变成了”AI能不能干活”。
从DeepSeek R1的推理式思考,到OpenClaw的智能体式思考,不是谁取代谁,而是一次能力的跃迁。会推理是基础,能干活才是终点。
就像中关村论坛上那几位大佬说的——接下来,所有大模型都要学会适应智能体的节奏。因为2026年,确实是智能体之年。
参考来源: 澎湃新闻:《AI大神力挺的”智能体式思考”,DeepSeek式思考的终结?》 CNBC: Silicon Valley’s AI agent hiccups: Wasted tokens and ‘chaotic’ systems CNET: OpenAI and OpenClaw’s alliance — the year of agentic AI DeepSeek官方:《DeepSeek-V4预览版发布公告》 Ars Technica: OpenClaw gives users yet another reason to be freaked out about security
夜雨聆风