AI现在是比谁能用出生产力的时期,已经过了追热点的时期了。
其实不要去问“怎么学AI”,因为你真正想问的是“怎么把AI用出生产力”。
先说结论:
要彻底看懂AI,不要去追工具。而是站在高一个维度去看懂AI这个生态。
现在最重要的无非就两个:模型生态和agent生态。
那些大模型更新、agent更新、智能体功能、工作流搭建、skill、MCP有啥新东西,都是这俩生态之下具体的功能。
未来势必会出现更多类似的产品,再出现下一个像小龙虾、爱马仕被全网吹爆的产品,你就能去判断要不要装、要不要学。
能用成生产力的技术,才值得去跟进。
所以今天来系统梳理一下AI Agent这个生态。
本文导览:
1. 三层架构彻底搞懂AI Agent生态
2. Hermes值不值得装?以后新的agent刷屏,如何判断
3. 如何判断一个agent架构是否靠谱
视频版
AI agent确实是一个趋势,模型只能回答问题,而agent可以动手干活。
那agent干活好与不好是什么决定的呢?
分三层。
第一层。上游接的模型。
装任何Agent都需要给他模型接口,这一步决定了这个agent在你手上的基础能力范围。
所以在上游模型这一层,每个agent是公平的,不存在决定性的优劣势。
你调用chatGPT他就比豆包代码写得好、你调用seedance2.0它就比1.5画得漂亮。
第二层,下游接技能和工具。
就是大家很熟悉的skill、MCP。
这一层也是公平的,就像大家用不同的手机,都可以根据自己的需要装应用软件一样。
那有的手机打游戏就卡、有的打游戏就不卡,为什么呢?
就是第三层,这里才是拉开agent差距的核心竞争区。
harness,环境/调度层。
就是通过架构设计和流程编排,设计Agent怎么约束你制定的规则、怎么处理记忆、怎么调度工具的。
所有的agent,不管是小龙虾还是爱马仕,还是顶级的codex和Claudecode,甚至是未来的新面孔,拉开差距的就在这一层。
所以这一层才是你现在选择openclaw、Hermes、或者下一个新agent的重点。
所以你看,根本没有新东西,只是架构变了、优化了。
那爱马仕值得装吗?看场景
爱马仕被吹得最火的自进化、自动学习能力,实现了越用越聪明、越用越懂你的AI。
这是因为爱马仕的架构层有一个设计是:
在和你对话过程中,它会自主判断提取那些可能是你偏好的、可以长期复用的部分,自主写成适合你的skill并储存起来。
这样在你下次提出这个需求的时候,他会直接调用这个为你定制的skill,按照对你的了解去处理,而且过程中如果发现偏差,他会自己修改skill,不用你主动提。
而龙虾的架构层就没有这个,它所有skill都需要你自己写,你发现问题还要自己修改和维护skill,所以很多人会觉得爱马仕比龙虾好用了。
但这个自进化是不是绝对优势呢?
我觉得未必,尤其是在业务场景里。
因为灵活性和主观能动性,确实高效便捷,但随之而来的就是不可控性。
你想,如果我写好的skill,我希望它是可控、可预测的,却因为我某一次任务的反馈就被agent自主修改,那skill的稳定性必然就没那么高。
所以我个人会把Hermes当成一个个人助理,在处理业务进入生产环节的时候,还是会选择更加可控的架构,因为我们在生产力环节需要的是可控性和稳定性。
怎么看一个agent架构是否可靠。
首先最简单的,从开发团队来看:
- openclaw是个人开发者
- 爱马仕是团队开发者
——他们都是开源社区贡献者,项目维护、升级,全靠信念和意愿。
- Claudecode和codex是AI圈最值钱的千亿级公司维护的,这个对比就很明显了。
再看架构设计科学性。
科学的架构,能够合理安排上下文储存,帮你省tokens;合理规划工作流,有序进行少出错。
科学的架构有什么特征,推荐《learn Claude code》免费开源的课程,它分为12节课,循序渐进来讲AI Agent如何让工作流稳定交付。
看完这个项目,我最大的收获还不是理解Claudecode的工作原理,而是理解agent的工作原理之后,能判断科学的agent架构有哪些必要的条件。
所以在龙虾和爱马仕之后,一定还会有新的agent,它大概率是架构优化了、有了新功能了。
你要做的不是马上装一个、学一个,而是先去判断,这次的更新,有没有价值,能不能变成你的生产力。
所以不需要在信息流里感到焦虑。
在AI时代技术迭代很快时间根本不够用,你的关注点必须放在准确地方,热点没有用。
再说一次,能用出生产力的技术,才有必要去跟进。

夜雨聆风