AI智能体的2026:从会推理到能干活-夜雨聆风

AI智能体的2026:从会推理到能干活

上周的中关村论坛人工智能主题日上，发生了一件挺有意思的事。

月之暗面创始人杨植、智谱AI CEO张鹏、小米大模型负责人罗福莉坐在一起，讨论了一个话题——OpenClaw和AI智能体。结论很一致：接下来大模型要反过来适应智能体的进化方向。

这可不是个小事。它意味着整个AI行业正在经历一次范式转移。

01 从”会推理”到”能干活”

要理解这个转变，得先说说过去两年整个行业的”主旋律”——让模型更会推理。

2024年底到2025年，OpenAI o1和DeepSeek R1代表的推理模型，核心逻辑就是拉长思考链：给你一个数学题，它会在脑子里多转几圈，转得越久，答案越准。这套路在封闭问题（比如数学、编程竞赛）上确实很管用。

但是，现实世界的问题不是数学题。写周报、做调研、开发软件——这些事儿需要的不只是”想”，更需要”做”。信息不全你得去搜，工具不会你得去学，失败了你得重来。

这就是纯推理模型的边界。前阿里千问技术负责人林俊旸在离职后发了一篇长文，提出了一个关键概念——“Agentic Thinking”（智能体式思考）。他说，好的智能体不能只在那里拼命推理，它必须能：搜索、翻网页、调API、根据反馈调整策略，然后把这些能力串成一个循环。

02 OpenClaw为什么火了？

说到智能体式思考，就绕不开OpenClaw。

OpenClaw这个开源AI智能体框架，今年在国内外都火得一塌糊涂。纽约时报专门报道了中国开发者社区对它的追捧，CNBC也分析了硅谷AI Agent落地中的各种”翻车”。

它的核心设计是两个机制：Harness（马具）和Skill（技能）。

Harness中文直译是”马具”，本质上是一套让大模型”被驾驭”的工程框架，包括上下文管理、长记忆、工具调用这些底层能力。它不负责”思考”本身，但决定了思考怎么被组织、什么时候该去执行、失败了怎么办。

Skill则把各种外部能力变成了AI随时能调用的模块——查天气、发邮件、操作浏览器、调支付接口。大模型需要做的，不再是直接给出答案，而是判断”现在该调用哪个Skill”。

这套机制的效果很直接：同样的大模型底座，放在OpenClaw里和放在普通聊天界面里，表现天差地别。不是模型”变聪明了”，而是它能不断试错、修正路径、利用工具，直到把问题搞定。

03 DeepSeek的”智能体化”转身

DeepSeek也在快速跟进这个趋势。

4月24日发布的DeepSeek-V4，一个重要亮点就是智能体能力的大幅提升。在Agentic Coding评测中，V4-Pro达到了开源模型最佳水平。更关键的是，V4专门对Claude Code、OpenClaw、OpenCode等主流智能体产品做了适配和优化。

同时，V4还上线了多模态识图模式的灰度测试。部分用户打开DeepSeek首页，发现多了一个”识图模式”入口。上传图片后，它能像人一样理解画面——不光认出”这是一只猫”，还能看懂隐喻和情绪。

不过有意思的是，DeepSeek这篇多模态论文发出来没多久又连夜删了。业内猜测要么是技术还不稳定，要么是受到某种外部压力。

另外据媒体报道，DeepSeek还在进行首次外部融资，估值不低于100亿美元。创始人梁文锋此前多次拒绝融资，这次松口，也说明AI大模型的商业化竞争进入了新的阶段。

04 智能体时代的三个信号

总结一下，2026年智能体赛道已经出现了几个很明确的信号：

信号一：大模型在适应智能体，而不是反过来。新发布的模型都在针对OpenClaw等框架做适配，推理模型不再是唯一主流，”Agentic Thinking”成了新的方向标。

信号二：基础设施投入在疯狂加速。微软AI业务年化收入达370亿美元，Google Cloud首破200亿美元，Meta资本支出最高至1450亿美元——巨头们不是在赌，是在清场。

信号三：安全挑战随之爆发。Ars Technica和多家安全机构发布警告，AI Agent的自主权越大，安全风险越高。OpenClaw的权限管理、数据隔离、执行审计，已经成为比模型能力更紧迫的议题。

05 结语

去年这个时候，大家还在讨论”AI能不能推理”。到了今年，问题已经变成了”AI能不能干活”。

从DeepSeek R1的推理式思考，到OpenClaw的智能体式思考，不是谁取代谁，而是一次能力的跃迁。会推理是基础，能干活才是终点。

就像中关村论坛上那几位大佬说的——接下来，所有大模型都要学会适应智能体的节奏。因为2026年，确实是智能体之年。

参考来源： 澎湃新闻：《AI大神力挺的”智能体式思考”，DeepSeek式思考的终结？》 CNBC: Silicon Valley’s AI agent hiccups: Wasted tokens and ‘chaotic’ systems CNET: OpenAI and OpenClaw’s alliance — the year of agentic AI DeepSeek官方：《DeepSeek-V4预览版发布公告》 Ars Technica: OpenClaw gives users yet another reason to be freaked out about security