凡人修 AI(二):Agent 入门,该怎么选?OpenClaw、Hermes、Claude Code、Codex 入门避坑指南-夜雨聆风

凡人修 AI(二):Agent 入门,该怎么选?OpenClaw、Hermes、Claude Code、Codex 入门避坑指南

来到第二篇文章了。

这一期，我想和大家科普一些 Agent 的基本知识，让大家先对这个新事物建立一个初步认知。

当然，一篇肯定说不全，所以我只挑最核心、最必备的概念来讲。

如果你已经在用 Agent 产品了，可以参考我实际使用后的选择推荐；如果你还完全没接触过，也可以根据这些基本概念，判断一下自己要不要直接硬刚“原装进口”的 Agent 产品。

一、主流 Agent 产品四选一，怎么挑？

现在市面上主流的 Agent 产品，无非就是这几个：OpenClaw、Hermes、Claude Code、Codex。

它们之间的差异其实挺大，我先用一句话帮你快速建立印象：

OpenClaw：最早开源把 Agent 接入社交软件对话的产品，功能全面，生态最丰富
Hermes：和 OpenClaw 基本类似，但主打记忆能力更强，还能根据错误或经验自己创建 Skill，方便下次同场景调用
Claude Code：最早是辅助编程的工具，现在也逐渐吸收了 OpenClaw 的智能体模式，使用场景越来越多，很多专业人士评价它比 OpenClaw 框架更简洁、高效、好用
Codex：在 GPT-5.5 模型出来后弯道超车了 Claude Code，目前在非编程场景的好评激增，很多大佬都调整了他们的工具使用比重

这些工具我都在用，但也不好说哪个绝对更好。毕竟我还没到能“嬉笑怒骂”这些产品的程度，也就是浅浅体验了一下。

不过对于入门来说，我的推荐还是很清晰的：

👉 入门首选：OpenClaw

原因很简单：

网上教程最多，踩坑了好解决
生态最完善，各种功能都有
用户基数最大，遇到问题容易找到人问
相比 Claude 和 Codex，使用门槛相对最低
国内的同类产品，大部分也都是基于 OpenClaw 框架做的

所以接下来，我就主要结合 OpenClaw 来讲讲 Agent 的几个核心概念。

二、概念一：展示形式——别被黑乎乎的终端吓跑

如果你习惯了 App 或者软件那种友好、清晰的展示界面，那你可能要先做好一点心理准备：

除了 Codex 是像 App 一样安装的之外，大部分 Agent 的底层展示形式，都是终端或者 CMD 命令窗口。

Mac 上叫“终端”
Windows 上叫“命令提示符”

当然，OpenClaw 也有网页版的后端控制平台。但说实话，那也不是什么傻瓜式操作系统。我到现在还有很多选项看不太懂，大部分时间只是用来看一下它是崩溃了，还是依然在运转。

不过别急。

你完全可以通过连接 飞书、微信 来转换这个对话窗口——就像你跟任何一个飞书或微信的真人好友一样，去跟 Agent 聊天沟通。

三、概念二：渠道——你在哪里跟 Agent 聊天？

刚才说的连接微信、飞书，这个就是“渠道”。

除了这两个，OpenClaw 还提供非常多的渠道选择，比如 QQ、钉钉，以及国外的 Telegram 等等。

我试过的渠道有限，没法逐一点评。正常来说，你选自己最常用的渠道就行。

👉 我的选择：飞书

原因有几个：

办公场景无缝衔接：飞书的日历、任务、云文档、知识库可以直接嵌入工作流，非常方便
多端同步：飞书消息存在云端，你在手机、电脑、平板、网页任何界面登录，聊天记录都是一样的，方便给 Agent 引用内容，或者跨多终端跟你的 Agent 沟通
传输速度：我个人体感就是飞书的信息传输会更快，微信端 Agent 回复总感觉有些慢

四、概念三：API Key——龙虾的养料

这个你可以理解为龙虾的“养料”——只有装上 API Key，你的 Agent 才能真正动起来。

API Key 主要分三种：

1）按量计费 API

有点像手机流量。Key 给到你之后，用多少，就按大模型公司的输入、输出 Token 定价来计算价格。

这种编程人员可能会用，其他场景我理论上不推荐，主要是 成本太不可控。

2）模型集成路由器

比如 OpenRouter 这种，它不属于任何一家大模型，还提供部分免费模型可以用。

原理就是：你用一个 Key，就可以调用几乎现在全世界所有主流大模型的 API，省去了重复配置的麻烦。

但它本质上还是按量收费，只是在使用国外模型上会方便一些，可能不用依靠魔法。

3）套餐模式

国内外都有。

国内一般叫 Coding Plan，也有改成 Token Plan 的，价格从几十到四百一月不等，主流套餐基本在 100～200 元 之间
国外一般是订阅计划，常见是 20 美元、100 美元、200 美元 三档

其实都跟手机套餐差不多，就是每月有个固定使用量。

不过这个“固定使用量”也有区别：

有些是固定请求次数——这种一般用量会足一点，虽然具体我也不知道是怎么个算法
有些是固定 Token 额度——比如每月使用上限是 10 亿 Token 这样

反正从我的体感上来说，直接固定 Token 总量 的方式，在使用上是没有 固定请求次数 感觉那么富余的。

👉 我的推荐：买 Coding Plan 模式的 API

综合来说，我更推荐大家去买 Coding Plan 方式的 API。好处就是：

✅ 成本可控，不用担心超支
✅ 用量上也比较扎实

从我的实际使用频率和时间来看，国内任何一款超过 100 元的套餐，对于非编程需要的人来说，基本都是够的。

当然，由于同时调用 API 的人比较多，无论你使用哪家的 Coding Plan，基本都会遇到高峰期限流——那个时候可能没有响应或者需要等一等，但实质影响不大。

至于国外 100 元左右的套餐……除非是更高的两档，不然使用额度通常是比较低的。

五、概念四：Skill——给 Agent 用的“App”

这个 Skill，你可以按照“给 Agent 用的 App 或软件”来理解。

比如你要让它查天气，就得给它一个查天气的 App，这样它就能用这个 App 去查天气了。

如果更精确一些，Skill 也可以理解成一本 Agent 阅读的 操作手册 ——它拿着这本手册，就能比较精准地去做某个专门的事。

这里有个重点：

Skill 不是给你用的，而是给 Agent 用的。

Skill 不仅能下载安装别人的，或者去专门的 Skill 市场（国内有腾讯的 SkillHub、字节的虾评市场，国外有 ClawHub 等），还可以自己创建。

比如你跑通了某一个特别适合你的场景，你就可以让 Agent 自己制造一个 Skill，以备复用。

因为它的记忆还不是那么完善，如果你不创建的话，下次你俩可能又要为这个场景重新磨合一轮——初期我踩坑了 N 次，人都麻了。

关于 Skill 的适配，无论是 OpenClaw、Hermes 还是 Claude Code，数量都已经可以用“海量”来形容了。

所以不要想着大而全，因为有个最重要的问题是：

现在它们的记忆还没法达到能够自主选用调用技能的程度，还得依靠你自己对某个技能有印象。

否则你安装一大堆，自己也不记得了，这个技能就会在角落里吃灰。

👉 我的选择：精简技能，只装对自己有用的

最好一个类别就一个。这样你能有初步框架印象，就算 Agent 不主动调用，你也可以提醒它。

六、概念五：云端安装 vs 本地部署——决定了 Agent 能帮你到什么程度

综合前面说过的内容，其实使用 Agent 的流程就是：

选择一个 Agent 框架或产品 → 安装它 → 配上你已经购置好的大模型 API Key（也有免费路径，后面会讲）→ 选择一个你方便交流沟通的渠道 → 就可以正常使用了

无论是用渠道还是用基础命令窗口，按照你舒服的方式跟它沟通上后，就可以安排它来促进你的生产力场景，或者帮你打理生活。

但是由于它“出生”之后空有理论知识，没有什么处事或者工作经验，你就要对应地给它安装 Skill——不会联网搜索，那就给它个百度搜索 Skill；不会看微信文章，就给它一个 WeChat 阅读 Skill。

然后呢？它到底可以帮你把事做到什么程度？这就要来到最后一个概念了：云端安装和本地部署。

其实从字面意思就能明白区别：

☁️ 云端部署

安装在云端或者个人服务器上
能够 7×24 小时运行
适合值守、提醒、定时任务
但可能没有对应的处理工具或环境支持
毕竟不是天然住在你电脑上，它也没法触达你的本地资料，没法直接进行加工处理——如果你不发给它的话

💻 本地部署

直接安装在你自己的终端生产力工具上（无论是 Mac、Windows 还是其他系统）
可以直接操作本机环境
可以处理本地资料
更适合执行重任务和自动化

打个比方：你想在微信或者飞书发一句话，就让 Agent 把桌面给整理了——这个 本地部署 的 Agent 是可以做到的，但是 云端部署 的就不行。

👉 我的选择：云端 + 本地双部署

云端 Agent：主要用来 24 小时值守，方便随时询问，或者安排一些需要定期推送或提醒的任务
本地部署 Agent：处理一些“重活”，包括直接利用本地电脑环境、GPU 能力和资料直接处理工作等

如果一定要二选一的话，我推荐 本地部署。

因为云端能做的，本地部署都能做。唯一麻烦点的是 24 小时值守——如果你用 Mac mini 或者国产的零刻等主机，完全也可以 24 小时开机；如果你是笔记本或者台式机，设置自动开机就能实现远程调用，其实影响也不大。

七、给新人的建议：先跑通，再扩展

如果你看到这里，应该已经慢慢有主意了：

其实 Agent 这个东西，最怕的不是学不会，而是 一上来就装一堆、配一堆、结果一个都没跑通。

所以我更建议新人按下面这条路线来：

先选框架
再选聊天渠道
配好 API Key
先跑通基础对话
只装 3～5 个刚需 Skill
用真实小任务开始磨合
再决定要不要本地部署

这条路线的重点就一句话：

先跑通，再扩展。

别一开始就追求大而全，也别一上来就想让它替你管理人生。

你先让它把一个小任务做好，后面的信任、技能、工作流，才会慢慢长出来。

写在最后

基本上就是这些了。

了解这些之后，想必大家都已经慢慢有了自己的判断：有的可能迫不及待要安装体验一番，有的可能已经开始犹豫自己是不是要入坑。

没关系，下一篇我会给大家带来 国产龙虾的全面横评和我的推荐（以我实际使用过的为准）。

国产龙虾的上手门槛极低，所有涉及这些基本概念的内容，它们基本都帮你一键解决了。

无论你的选择是什么，我觉得都可以先通过国产龙虾体验并进阶。

如果这篇对你有帮助，也欢迎你转发给同样正在观望 Agent 的朋友。我们一起交流和学习！