个人原创 · AI Agent 系列第 2 篇
上篇我们聊了 AI Agent 到底是个啥——简单说,就是「能自己动手干活的 AI」。
但你可能会问:说得这么好,那到底有哪些能用的?
我今天就给你拉一张清单。不是那种罗列几十个工具让你眼花缭乱的「大全」,而是从我实际用过、身边朋友也在用的里面,挑几个真正能打的。
一、Claude Code:程序员的「命令行军师」
如果你见过一个程序员对着黑底白字的终端打字,旁边还有个 AI 在帮他改代码、跑测试、修 bug——那大概率就是 Claude Code。
它是 Anthropic 出的终端 AI Agent,不需要 IDE,直接在命令行里干活。你说一句「帮我把这个项目的登录模块重构了」,它就自己读代码、改文件、跑测试、看报错、再改,直到通过。
2026 年的数据:Claude Code 在 SWE-bench(一个编程能力测试)上拿了 80.8%,业界第一梯队。
适合谁:程序员、技术爱好者。不适合完全不懂命令行的人。
二、Cursor:普通人的「AI 编程搭档」
如果说 Claude Code 是命令行里的高手,那 Cursor 就是图形界面里的全能选手。
它本质上是一个「AI 原生」的代码编辑器——长得像 VS Code,但内置了 AI Agent。你选中一段代码,跟它说「解释一下这段」,它秒回。你说「帮我在这个按钮上加点动画」,它直接帮你写好。
2026 年 Cursor 最大的变化:Agent 模式的使用量已经超过了传统的代码补全。换句话说,大家已经不是让它「猜下一个词」,而是直接让它「干一整件事」。
适合谁:写代码的、学编程的、做小项目的。有免费版,Pro 版 $20/月。
三、Codex:OpenAI 的「终端新贵」
Codex 是 OpenAI 在 2025 年推出的编程 Agent,2026 年已经迭代得非常成熟了。
它最大的特点是省 token——就是省钱。同样一个任务,Codex 消耗的 token 比竞品少不少。而且它支持 VS Code 插件、命令行、云端三种方式,灵活性很高。
跟 Claude Code 比,Codex 在终端/DevOps 类任务上还有反超的趋势。用网友的话说:「Claude Code 写代码更优雅,Codex 部署上线更靠谱。」
适合谁:已经在用 ChatGPT/OpenAI 生态的人,上手成本最低。
四、Gemini CLI:Google 的「免费大胃王」
Google 的 Gemini CLI 有一个让所有竞争对手羡慕的数据:100 万 token 的上下文窗口。
什么意思?你可以把一整个项目的代码、几十页的文档、甚至一本书扔进去,它都能「记住」。而且,目前免费。
它的编程能力(SWE-bench 80.6%)跟 Claude Code 差不多,但实际使用中偶尔不够稳定。不过免费+超大上下文,足够让它成为很多人入门的第一选择。
适合谁:想零成本体验 AI Agent 的人、需要处理大量文档的场景。
五、Manus:不只会编程的「通用 Agent」
上面四个都是编程工具,但 Manus 不一样——它是一个通用 AI Agent。
你让它「帮我找 10 个北京三环内租金低于 5000 的一居室,做成表格」,它自己去搜房源、比价格、排成 Excel。你让它「分析过去一年特斯拉的财报,写份报告」,它读财报、算数据、出文档。
2026 年 Manus 被 Meta 收购了,发展方向是面向企业的 AI 劳动力。虽然现在普通人用还有门槛,但它代表了 AI Agent 从「帮程序员写代码」到「帮所有人干活」的方向。
一张图总结
写在最后
如果你看完这些觉得「都太程序员了,跟我没啥关系」——别急。
AI Agent 现在确实先从编程领域爆发了,因为代码是结构化的、可验证的,最适合 AI 练手。但它不会停在编程。就像当年互联网先改变了邮件,然后是购物,然后是出行——AI Agent 正在走同样的路。
下篇预告:AI Agent 是怎么「思考」的? 聊聊它背后的 ReAct 循环。
个人原创系列,每周更新。如果觉得有用,欢迎转发给你身边对 AI 好奇的朋友。
夜雨聆风