Hermes + IMA:当 AI Agent 拥有「会思考」的知识库

IMA 的 slogan 里有四个字很关键:会思考的知识库。
不是存储知识的仓库,是能对知识提问、与知识对话、把知识加工成新内容的工具。腾讯为此搭建了一整套能力体系——从个人笔记到知识库、从 AI 问答到公域广场,ima.qq.com 还有完整的 OpenAPI,外部程序可以直接调用。
Hermes Agent 配上 IMA,本质上是给 AI Agent 接入了一个有脑子、能推理的知识管理系统。
IMA 是什么
IMA 是腾讯推出的 AI 智能笔记与知识管理应用,核心三件事:
搜:基于知识库的精准问答,每条回答标注原文出处读:多格式内容导入,PDF、网页、公众号文章、图片、音频都能解析写:AI 辅助创作,从知识库里拿素材生成报告、播客等各种产物
官方定位三个方向:个人知识管理 + 私域知识共享 + 公域知识探索。
数据告诉你 IMA 有多受欢迎
IMA skill 在腾讯 SkillHub 上的下载量是 3.7 万次,收藏 65 次。安全检测由科恩实验室和云鼎实验室两家腾讯内部安全团队出具报告背书——不是第三方,是腾讯自己的安全团队。
这意味着 IMA 的 API 稳定性、数据传输安全性都经过了内部安全团队的验证。
IMA 支持哪些内容形态
IMA 能接收的内容类型覆盖日常生活和工作的主要信息来源:

|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
公众号文章直接导入这个能力,中文世界最重要的知识载体之一,IMA 原生支持,这是它和 Notion、Obsidian 等工具拉开差距的核心差异点。
AI 能对知识库做什么
IMA 的 AI 能力分两层:
精准问答。 基于你的知识库内容回答问题,每条回答都标注原文出处。你问「这个项目上季度有哪些风险点」,IMA 会召回知识库里相关的会议纪要、邮件、报告,给出有据可查的答案。
任务交付。 不只是问答,而是把知识库里零散的信息整合成完整产物。把多篇碎片文章整合成行研报告,把文本内容转成播客脚本,IMA 能自主完成这个加工过程。
核心功能详解
根据官方 skill 文档(v1.1.7),IMA OpenAPI 的核心能力分成四类:
读取类– 读取笔记列表与内容– 读取知识库内容与文件– 获取文件原文与网页链接
写入类– 新建笔记(Markdown 格式)– 追加内容到已有笔记– 上传文件到知识库(PDF、Word、PPT、Excel 等)– 导入网页/公众号文章到知识库
检索类– 检索笔记(按标题或正文关键词)– 检索知识库内容– 查询知识库列表与文件夹结构
管理类– 创建笔记本– 建立文件夹层级– 将笔记与知识库关联
Hermes + IMA 能做什么
Hermes 是 AI 执行框架,能联网、跑代码、调用各种 API。但会话结束记忆就消失,这是所有 AI Agent 的通病。IMA 补上了持久化这一环。
场景一:文章自动归档
用户:把这篇文章同步到IMA知识库Hermes:1.POST/api/documents → 存到本地文档库2.import_doc → 创建Markdown笔记3.add_knowledge + media_type = 11 → 关联到知识库发布即归档,知识库里随时可查。
场景二:知识采集
用户:把这篇技术文章添加到知识库的「技术资料」文件夹Hermes:调 import_urls 批量导入,或走 COS 上传流程你只说了那句话,剩下全是自动的。
场景三:随时记录
用户:帮我记一下,南头这家咖啡店拿铁很好喝,露台 view 绝了Hermes:调 append_doc 写入笔记下次搜「咖啡店」,它自动作为参考出现。
场景四:跨知识库检索
用户:搜一下知识库里关于「大模型上下文窗口」的内容Hermes:调 search_knowledge 在私域搜索同时搜公域广场有没有相关知识库可以参考私域个人知识 + 公域专业知识,完整认知资产
场景五:知识加工生产
用户:帮我把行业报告里关于 AI 监管的部分整理成摘要Hermes:搜文档 → 读取原文 → 整理摘要 → 写回知识库资产又多了一层加工过的知识产物。
公域知识广场:知识可以流动起来
IMA 不只是私有工具,还有公开的知识库广场。
任何人都可以把知识库发布到广场,让内容被更多人发现。IMA 提供「知识号」体系,给内容创作者提供数据分析、官方认证、创作指南等服务。
广场里已有大量垂直领域的知识库:
- 法律
:企业劳动合规知识库(19 万+文件)、合同示范文本库 - 金融
:中国经济 50人论坛、北交所 IPO 知识库 - 教育
:中小学人工智能教育、大学生创新创业大赛辅导 - 医疗
:AI 营养师 - 科技
:AGI 数据库·腾讯研究院、中国院校前沿 AI 研究
公域知识 + 私域知识整合在一起,才是 IMA 真正完整的价值。
Hermes 接入 IMA 教程
整体架构
你(对话) ↓ 发送提示词Hermes Agent(hermes) ↓ 调用ima-skill(技能模块) ↓ 调用ima_api.cjs(API 封装脚本) ↓ 发送请求IMA OpenAPI(ima.qq.com) ↓ 返回数据笔记模块 / 知识库模块
Hermes 通过 skill 封装了 IMA 的所有 API 调用细节。你在对话里说「帮我记一下」,hermes内部自动走完完整流程,不需要你懂任何 API 细节。
安装指引(对话式,两步完成)
安装过程由hermes自动完成,你只需要复制发送。
第一步:部署 ima skill
把下面这段话发给hermes:
请安装 ima 技能下载地址:https://app-dl.ima.qq.com/skills/ima-skills-1.1.7.zip
hermes收到后会自动下载 skill 包、解析文件结构、完成部署。
第二步:配置 API 凭证
把下面这段话发给hermes:
API Key 获取:https://ima.qq.com/agent-interfaceClient ID:cfcd782d6a0e5078863e68749f6effc3状态:有效有效期至:2026-05-29
hermes会把凭证写入 ~/.config/ima/ 配置文件,完成 API 认证配置。
两步操作,对话完成安装。
验证连接
在 Hermes 对话框里直接测试:
帮我记一下:今天测试了 Hermes + IMA 的连接,一切正常。
如果返回「已记录」,说明凭证配置正确,API 连接正常。
常见问题
Q:提示「NO CREDENTIALS」A:检查 ~/.config/ima/client_id 和 ~/.config/ima/api_key 是否存在且有内容。文件权限是否可读。
Q:提示「文件夹不存在」(错误码 310001)A:调用 import_doc 时不要传 folder_id,写入默认笔记本即可。这个问题由 IMA 账户侧笔记本配置引起,不影响笔记写入。
Q:笔记内容乱码A:notes 写入前未做 UTF-8 校验。Hermes 的 ima-skill 已内置 UTF-8 校验逻辑,如果出现乱码说明来源内容编码本身有问题,需要先转码再写入。
Q:文件上传失败A:视频文件、Bilibili/YouTube 链接、file:// 开头的本地路径不支持上传到知识库,需通过 IMA 桌面客户端操作。
凭证有效期
API Key 有有效期限制(本文档撰写时到期日为 2026-05-29),过期后需到 https://ima.qq.com/agent-interface 重新生成。
技术架构:两个模块
IMA OpenAPI 分成两个独立模块:
笔记模块(openapi/note/v1/*)
search_note // 按标题或正文检索list_notebook // 列出笔记本list_note // 列出某笔记本下的笔记get_doc_content // 读取正文import_doc // 新建笔记(Markdown)append_doc // 追加内容到已有笔记
知识库模块(openapi/wiki/v1/*)
create_media+COSupload+add_knowledge//上传文件import_urls//批量导入网页add_knowledge(media_type=11)//将笔记关联到知识库search_knowledge//知识库内搜索get_knowledge_list//浏览文件夹内容search_knowledge_base//搜索知识库列表
文件上传走腾讯云 COS 临时凭证,不经过 IMA 服务器中转。
为什么是 IMA
中文互联网内容的采集是刚需。公众号文章、微信文件、腾讯文档——这些是中文世界最重要的知识载体,没有之一。IMA 原生支持这些格式,是它和 Notion、Obsidian、飞书文档拉开差距的核心差异点。
API-first 的设计让 OpenAPI 和 App 功能保持同步,不存在「App 有但 API 没有」的功能落差。
3.7 万下载量说明已经有相当规模的用户基础,腾讯科恩实验室和云鼎实验室的安全背书意味着 API 稳定性经过了内部验证。
对 Hermes Agent 来说,IMA 补上了记忆层和研究素材库两个缺口。输出不再是一锤子买卖,每一次有价值的对话都被留住、归档、下次复用。
夜雨聆风



