凡人修 AI(二):Agent 入门,该怎么选?OpenClaw、Hermes、Claude Code、Codex 入门避坑指南
来到第二篇文章了。
这一期,我想和大家科普一些 Agent 的基本知识,让大家先对这个新事物建立一个初步认知。
当然,一篇肯定说不全,所以我只挑最核心、最必备的概念来讲。
如果你已经在用 Agent 产品了,可以参考我实际使用后的选择推荐;如果你还完全没接触过,也可以根据这些基本概念,判断一下自己要不要直接硬刚“原装进口”的 Agent 产品。
一、主流 Agent 产品四选一,怎么挑?
现在市面上主流的 Agent 产品,无非就是这几个:OpenClaw、Hermes、Claude Code、Codex。
它们之间的差异其实挺大,我先用一句话帮你快速建立印象:
-
OpenClaw:最早开源把 Agent 接入社交软件对话的产品,功能全面,生态最丰富 -
Hermes:和 OpenClaw 基本类似,但主打记忆能力更强,还能根据错误或经验自己创建 Skill,方便下次同场景调用 -
Claude Code:最早是辅助编程的工具,现在也逐渐吸收了 OpenClaw 的智能体模式,使用场景越来越多,很多专业人士评价它比 OpenClaw 框架更简洁、高效、好用 -
Codex:在 GPT-5.5 模型出来后弯道超车了 Claude Code,目前在非编程场景的好评激增,很多大佬都调整了他们的工具使用比重
这些工具我都在用,但也不好说哪个绝对更好。毕竟我还没到能“嬉笑怒骂”这些产品的程度,也就是浅浅体验了一下。
不过对于入门来说,我的推荐还是很清晰的:
👉 入门首选:OpenClaw
原因很简单:
-
网上教程最多,踩坑了好解决 -
生态最完善,各种功能都有 -
用户基数最大,遇到问题容易找到人问 -
相比 Claude 和 Codex,使用门槛相对最低 -
国内的同类产品,大部分也都是基于 OpenClaw 框架做的
所以接下来,我就主要结合 OpenClaw 来讲讲 Agent 的几个核心概念。

二、概念一:展示形式——别被黑乎乎的终端吓跑
如果你习惯了 App 或者软件那种友好、清晰的展示界面,那你可能要先做好一点心理准备:
除了 Codex 是像 App 一样安装的之外,大部分 Agent 的底层展示形式,都是 终端 或者 CMD 命令窗口。
-
Mac 上叫“终端” -
Windows 上叫“命令提示符”
当然,OpenClaw 也有网页版的后端控制平台。但说实话,那也不是什么傻瓜式操作系统。我到现在还有很多选项看不太懂,大部分时间只是用来看一下它是崩溃了,还是依然在运转。
不过别急。
你完全可以通过连接 飞书、微信 来转换这个对话窗口——就像你跟任何一个飞书或微信的真人好友一样,去跟 Agent 聊天沟通。
三、概念二:渠道——你在哪里跟 Agent 聊天?
刚才说的连接微信、飞书,这个就是“渠道”。
除了这两个,OpenClaw 还提供非常多的渠道选择,比如 QQ、钉钉,以及国外的 Telegram 等等。
我试过的渠道有限,没法逐一点评。正常来说,你选自己最常用的渠道就行。
👉 我的选择:飞书
原因有几个:
-
办公场景无缝衔接:飞书的日历、任务、云文档、知识库可以直接嵌入工作流,非常方便 -
多端同步:飞书消息存在云端,你在手机、电脑、平板、网页任何界面登录,聊天记录都是一样的,方便给 Agent 引用内容,或者跨多终端跟你的 Agent 沟通 -
传输速度:我个人体感就是飞书的信息传输会更快,微信端 Agent 回复总感觉有些慢
四、概念三:API Key——龙虾的养料
这个你可以理解为龙虾的“养料”——只有装上 API Key,你的 Agent 才能真正动起来。
API Key 主要分三种:
1)按量计费 API
有点像手机流量。Key 给到你之后,用多少,就按大模型公司的输入、输出 Token 定价来计算价格。
这种编程人员可能会用,其他场景我理论上不推荐,主要是 成本太不可控。
2)模型集成路由器
比如 OpenRouter 这种,它不属于任何一家大模型,还提供部分免费模型可以用。
原理就是:你用一个 Key,就可以调用几乎现在全世界所有主流大模型的 API,省去了重复配置的麻烦。
但它本质上还是按量收费,只是在使用国外模型上会方便一些,可能不用依靠魔法。
3)套餐模式
国内外都有。
-
国内一般叫 Coding Plan,也有改成 Token Plan 的,价格从几十到四百一月不等,主流套餐基本在 100~200 元 之间 -
国外一般是订阅计划,常见是 20 美元、100 美元、200 美元 三档
其实都跟手机套餐差不多,就是每月有个固定使用量。
不过这个“固定使用量”也有区别:
-
有些是固定请求次数——这种一般用量会足一点,虽然具体我也不知道是怎么个算法 -
有些是固定 Token 额度——比如每月使用上限是 10 亿 Token 这样
反正从我的体感上来说,直接固定 Token 总量 的方式,在使用上是没有 固定请求次数 感觉那么富余的。
👉 我的推荐:买 Coding Plan 模式的 API
综合来说,我更推荐大家去买 Coding Plan 方式的 API。好处就是:
-
✅ 成本可控,不用担心超支 -
✅ 用量上也比较扎实
从我的实际使用频率和时间来看,国内任何一款超过 100 元的套餐,对于非编程需要的人来说,基本都是够的。
当然,由于同时调用 API 的人比较多,无论你使用哪家的 Coding Plan,基本都会遇到高峰期限流——那个时候可能没有响应或者需要等一等,但实质影响不大。
至于国外 100 元左右的套餐……除非是更高的两档,不然使用额度通常是比较低的。
五、概念四:Skill——给 Agent 用的“App”
这个 Skill,你可以按照“给 Agent 用的 App 或软件”来理解。
比如你要让它查天气,就得给它一个查天气的 App,这样它就能用这个 App 去查天气了。
如果更精确一些,Skill 也可以理解成一本 Agent 阅读的 操作手册 ——它拿着这本手册,就能比较精准地去做某个专门的事。
这里有个重点:
Skill 不是给你用的,而是给 Agent 用的。
Skill 不仅能下载安装别人的,或者去专门的 Skill 市场(国内有腾讯的 SkillHub、字节的虾评市场,国外有 ClawHub 等),还可以自己创建。
比如你跑通了某一个特别适合你的场景,你就可以让 Agent 自己制造一个 Skill,以备复用。
因为它的记忆还不是那么完善,如果你不创建的话,下次你俩可能又要为这个场景重新磨合一轮——初期我踩坑了 N 次,人都麻了。
关于 Skill 的适配,无论是 OpenClaw、Hermes 还是 Claude Code,数量都已经可以用“海量”来形容了。
所以不要想着大而全,因为有个最重要的问题是:
现在它们的记忆还没法达到能够自主选用调用技能的程度,还得依靠你自己对某个技能有印象。
否则你安装一大堆,自己也不记得了,这个技能就会在角落里吃灰。
👉 我的选择:精简技能,只装对自己有用的
最好一个类别就一个。这样你能有初步框架印象,就算 Agent 不主动调用,你也可以提醒它。
六、概念五:云端安装 vs 本地部署——决定了 Agent 能帮你到什么程度
综合前面说过的内容,其实使用 Agent 的流程就是:
选择一个 Agent 框架或产品 → 安装它 → 配上你已经购置好的大模型 API Key(也有免费路径,后面会讲)→ 选择一个你方便交流沟通的渠道 → 就可以正常使用了
无论是用渠道还是用基础命令窗口,按照你舒服的方式跟它沟通上后,就可以安排它来促进你的生产力场景,或者帮你打理生活。
但是由于它“出生”之后空有理论知识,没有什么处事或者工作经验,你就要对应地给它安装 Skill——不会联网搜索,那就给它个百度搜索 Skill;不会看微信文章,就给它一个 WeChat 阅读 Skill。
然后呢?它到底可以帮你把事做到什么程度?这就要来到最后一个概念了:云端安装和本地部署。
其实从字面意思就能明白区别:
☁️ 云端部署
-
安装在云端或者个人服务器上 -
能够 7×24 小时运行 -
适合值守、提醒、定时任务 -
但可能没有对应的处理工具或环境支持 -
毕竟不是天然住在你电脑上,它也没法触达你的本地资料,没法直接进行加工处理——如果你不发给它的话
💻 本地部署
-
直接安装在你自己的终端生产力工具上(无论是 Mac、Windows 还是其他系统) -
可以直接操作本机环境 -
可以处理本地资料 -
更适合执行重任务和自动化
打个比方:你想在微信或者飞书发一句话,就让 Agent 把桌面给整理了——这个 本地部署 的 Agent 是可以做到的,但是 云端部署 的就不行。
👉 我的选择:云端 + 本地双部署
-
云端 Agent:主要用来 24 小时值守,方便随时询问,或者安排一些需要定期推送或提醒的任务 -
本地部署 Agent:处理一些“重活”,包括直接利用本地电脑环境、GPU 能力和资料直接处理工作等
如果一定要二选一的话,我推荐 本地部署。
因为云端能做的,本地部署都能做。唯一麻烦点的是 24 小时值守——如果你用 Mac mini 或者国产的零刻等主机,完全也可以 24 小时开机;如果你是笔记本或者台式机,设置自动开机就能实现远程调用,其实影响也不大。

七、给新人的建议:先跑通,再扩展
如果你看到这里,应该已经慢慢有主意了:
其实 Agent 这个东西,最怕的不是学不会,而是 一上来就装一堆、配一堆、结果一个都没跑通。
所以我更建议新人按下面这条路线来:
-
先选框架 -
再选聊天渠道 -
配好 API Key -
先跑通基础对话 -
只装 3~5 个刚需 Skill -
用真实小任务开始磨合 -
再决定要不要本地部署

这条路线的重点就一句话:
先跑通,再扩展。
别一开始就追求大而全,也别一上来就想让它替你管理人生。
你先让它把一个小任务做好,后面的信任、技能、工作流,才会慢慢长出来。
写在最后
基本上就是这些了。
了解这些之后,想必大家都已经慢慢有了自己的判断:有的可能迫不及待要安装体验一番,有的可能已经开始犹豫自己是不是要入坑。
没关系,下一篇我会给大家带来 国产龙虾的全面横评和我的推荐(以我实际使用过的为准)。
国产龙虾的上手门槛极低,所有涉及这些基本概念的内容,它们基本都帮你一键解决了。
无论你的选择是什么,我觉得都可以先通过国产龙虾体验并进阶。
如果这篇对你有帮助,也欢迎你转发给同样正在观望 Agent 的朋友。我们一起交流和学习!

夜雨聆风