乐于分享
好东西不私藏

你以为AI Agent只是聊天?四大机制才是它的灵魂,一文搞清楚Hermes的核心机制

你以为AI Agent只是聊天?四大机制才是它的灵魂,一文搞清楚Hermes的核心机制

很多人以为AI Agent就是聊天机器人——问它问题,它回你答案,这就完了。其实差远了。

Hermes的本质,是一个大语言模型(LLM)+ 一套工具调用能力 + 持久化系统。它能记住你、能干活、有个性,今天来聊一聊它的四个核心机制。

我是匿星,主业程序员,专注于AI编程,副业工具提效,和5000+朋友一起共同创富!

用户消息进来后,Hermes核心分析意图,调用工具执行,最后返回结果。

核心内部有三件套:记忆系统 + 技能系统 + 人格系统

一句话公式:Hermes = LLM(大脑)+ 工具调用(手脚)+ 持久化系统(记忆)

01 记忆系统:让AI真正”认识你”

这是Hermes最核心的能力——让AI跨会话记住你,而不是每次对话都从零开始。

两层记忆架构

第一层:memory工具——持久知识

跨会话存储,分为两个层级:

  • user层:记录你是谁、你的偏好

    • 比如:你叫什么名字、做什么工作、喜欢什么风格
    • AI每次对话都会自动读取这些信息
  • memory层:记录AI的笔记

    • 比如:你的项目信息、环境配置、之前踩过的坑
    • 相当于AI的”工作日记”

每次对话开始时,这两层记忆会自动注入到上下文。AI不用你重复介绍自己,它已经”认识你”了。

第二层:session_search——历史对话搜索

当你问”上次我们聊了什么”,AI会用关键词搜索过去的对话记录,返回摘要。

这不是全文检索,而是语义匹配——找到相关的对话片段,总结成简短的摘要。

为什么重要?

普通AI聊天,每次都是”陌生人模式”。你问它问题,它回答,然后一切归零。

但有了记忆系统:

  • 它知道你的名字、职业、偏好
  • 它记得上次聊过的项目
  • 它能调用之前的上下文

这才是真正的”智能助手”,而不是”一次性问答机器”。

场景
无记忆系统
有记忆系统
你问”帮我写个脚本”
AI问:什么脚本?什么环境?什么语言?
AI直接写:根据你之前的Python项目,用这个模板
你问”继续上次的工作”
AI问:上次是什么?
AI回复:你上次在调试API连接问题,现在继续吗?
你问”用我喜欢的风格写”
AI问:什么风格?
AI直接用你之前设定的简洁风格输出

02 技能系统:让AI”会干活”

技能 = 预定义的知识 + 执行流程

遇到某类任务,AI不用每次从头想,技能里已经写好了:怎么做、用什么命令、有什么坑。

所有技能放在 ~/.hermes/skills/ 目录下:

skills/├── skill-name/│   ├── SKILL.md          # 核心指令(必选)│   ├── references/       # 参考文档│   ├── templates/        # 模板文件│   └── scripts/          # 脚本工具

SKILL.md 是核心,里面写清楚了:

  • 这个技能解决什么问题
  • 应该怎么执行
  • 有什么注意事项
  • 常见错误怎么避免

技能触发机制

系统提示里会列出所有可用技能。AI判断你的任务和某个技能相关时,会:

  1. 调用 skill_view 工具加载该技能
  2. 读取 SKILL.md 里的指令
  3. 按指令执行任务

触发举例

  • 你说”帮我部署一个服务” → AI加载 deployment 技能
  • 你说”分析这个错误日志” → AI加载 debugging 技能
  • 你说”写一篇公众号文章” → AI加载 writing 技能

为什么重要?

没有技能系统,AI每次遇到任务都要”从头推理”——怎么做?用什么方法?有什么坑?效率低,容易出错。

有了技能系统:

  • 标准化流程:技能里写好了最佳实践
  • 避坑指南:常见错误提前标注
  • 效率提升:不用每次重复思考框架

相当于给AI配了一本”操作手册”,遇到特定任务直接翻手册执行。

技能 vs 工具的区别

对比项
工具
技能
本质
单个函数
知识+流程组合
作用
执行一个动作
解决一类问题
灵活性
固定功能
可自定义扩展
示例
send_message、create_task
deployment、debugging、writing

03 人格系统:让AI”有个性”

soul.md = AI的”性格设定文件”

这个文件定义了AI的说话风格、态度、禁忌。每条消息都会重新加载,确保AI始终按你设定的风格回复。

soul.md 里写什么?

典型内容包括:

  • 说话风格:简洁/详细、口语化/正式、幽默/严肃
  • 态度设定:主动建议/被动回答、是否追问澄清
  • 禁忌事项:不讨论的话题、不使用的表达
  • 角色定位:助手/教练/专家/朋友

优先级机制

人格设定的优先级:soul.md > 系统默认 > memory里的风格记录

这意味着:

  • soul.md 是最高优先级,每条消息都会重新加载
  • 即使memory里记录了你之前的偏好,soul.md 可以覆盖它
  • 系统默认风格是兜底方案

为什么重要?

没有人格系统,所有AI都是千篇一律的”机器人腔调”——礼貌但机械,标准但无聊。

有了人格系统:

  • 你可以定制一个简洁高效的助手:只给答案,不多废话
  • 你可以定制一个耐心的教练:会追问、会解释、会举例
  • 你可以定制一个幽默的朋友:会开玩笑、会用梗、氛围轻松

同样的需求,不同人格的回复对比

需求:”帮我写一个Python脚本读取CSV文件”

人格设定
AI回复风格
简洁助手
import pandas as pd; df = pd.read_csv('file.csv')
耐心教练
我来一步步教你。首先需要安装pandas库…然后创建一个DataFrame对象…
幽默朋友
CSV嘛,Python的老朋友了。三行代码搞定,我给你写好了,拿去用~

04 执行流程:一条消息的完整旅程

理解执行流程,你就知道AI是怎么从”收到消息”到”给出回复”的。

五步执行流程

消息进来    ↓① 加载 soul.md + memory + 可用技能列表    ↓② 分析意图,决定是否加载技能    ↓③ 选择工具,调用执行    ↓④ 生成回复内容    ↓⑤ 返回结果

用一个例子走完流程

你的消息:”帮我检查服务器状态,有问题发到飞书”

① 加载阶段   - soul.md:简洁风格,主动建议   - memory:服务器IP是192.168.1.100,飞书群ID是xxx   - 技能列表:有 monitoring 技能可用② 意图分析   - 任务:检查服务器 + 发消息   - 判断:需要 monitoring 技能 + send_message 工具③ 工具调用   - 加载 monitoring 技能,执行检查脚本   - 发现CPU占用85%,异常④ 生成回复   - 执行结果:CPU异常   - 人格要求:简洁、主动   - 输出:"CPU占用85%,已发送告警到飞书"⑤ 返回结果   - 你收到回复   - 飞书群收到告警消息

四大核心机制:

  • 记忆系统:让它认识你,不用每次从零开始
  • 技能系统:让它会干活,有标准化的操作手册
  • 人格系统:让它有个性,不是千篇一律的机器人
  • 执行流程:让它有条理,从消息到回复的五步闭环

想上手的话,建议从记忆系统开始——这是最能直观感受到”AI真的认识我了”的部分。

如果想和更多人一起交流 AI 使用心得?扫描左下方二维码拉你进「AI自媒体交流群」,同时送你一个破局体验卡,了解AI赛道热门玩法与实战拆解。