Obsidian + AI 工具链:造轮子的尽头是 Agent
一、一个"没有 AI"的工具,怎么就成了 AI 的战场?
Obsidian 在 2026 年依然没有内置任何 AI 功能。
这件事放在今天简直有点叛逆。隔壁 Notion 早把 AI 塞进了每一个输入框,Logseq 也在接入各种大模型,连 Apple 备忘录都开始帮你补全句子了。但 Obsidian 的创始人选择了另一条路:不做 AI,把门打开,让社区去做。
结果有点出乎意料。Obsidian 的 AI 插件生态繁荣到了一种近乎疯狂的程度。从最早的文本自动补全,到语义搜索,再到可以直接在笔记里跑 Agent——三年时间,Obsidian 的 AI 工具链经历了三次代际进化。
这篇文章不是插件推荐清单(那种文章已经够多了)。我想聊的是这条进化路线本身:从"给编辑器加个补全"到"让 AI 在你的知识库里自主行动",这中间到底发生了什么?对普通用户和开发者来说,又意味着什么?
二、第一代:文本生成——你的高级自动补全
Obsidian AI 插件的起点很简单:帮你写东西。
Text Generator 是最早一批 AI 插件的代表。你写几个关键词,它帮你扩写成一篇文章;你给它一个模板大纲,它帮你填充内容。本质上就是一个更聪明的自动补全——你说上半句,它补下半句。
这类插件解决的问题其实挺实际的。很多人用 Obsidian 写日记、写读书笔记、写周报,但说实话不是每个人都擅长把碎片想法组织成通顺的文字。Text Generator 降低了这个门槛。
但问题也很明显:它只是"补全"。
它不懂你的笔记库,不知道你上周写了什么、上个月研究过什么主题。它只是一个语言模型的 API 调用,套了一层 Obsidian 的外壳。你换个窗口打开 ChatGPT 粘贴进去,效果差不多。
这个阶段的 AI 插件,说白了就是少了一步切换窗口的操作。仅此而已。
三、第二代:语义搜索 + 对话——AI 开始"读"你的笔记
真正的转折点出现在 2024 年底到 2025 年。两个插件彻底改变了游戏规则:Smart Connections 和 Obsidian Copilot。
Smart Connections 做的事听起来简单,但意义重大——它把你的全部笔记变成向量嵌入(对,就是那个 embedding),然后做语义搜索。
你搜"上次那个关于时间管理的想法",它能找到三个月前随手记的一条笔记,即使那条笔记里根本没有"时间管理"四个字。这种体验有点像……嗯,像是你的笔记库突然有了记忆。
关键是,这一切都在本地完成。你的日记、你的研究资料、你那些乱七八糟的随手记——不会上传到任何服务器。对一个可能存了十年内容的东西来说,隐私不是锦上添花,是底线。
Copilot 走了另一条路。它连接 OpenAI 的 API,让你可以像和 ChatGPT 聊天一样,直接在你的笔记库里提问。"我关于 Python 异步编程的笔记有哪些?帮我总结一下核心要点。"——它会在你的 Vault 里检索相关内容,然后给你一个带引用的回答。
这两个插件暴露了一个经典的选择题:隐私还是能力?
Smart Connections 的语义搜索完全免费(后来改为 $20/月的订阅制),因为嵌入计算在本地跑。但它只能"找",不能"说"。Copilot 能对话、能总结,但你的笔记数据要经过 OpenAI 的服务器。
说实话,这个阶段的用户体验有点割裂。你在两个插件之间来回切换:用 Smart Connections 找笔记,用 Copilot 问问题。两套上下文,两套设置,两套付费方案。我当时经常想:为什么不能是一个插件做完所有事呢?(后来还真出现了,等下聊。)
但不管怎么说,AI 终于开始"理解"你的笔记了。这不再是补全,而是检索、关联、推理。质变发生了。
四、第三代:Agent 化编辑——从"建议"到"执行"
2025 年下半年,事情开始变得不一样了。
Smart Composer(也叫 CAO)的出现让 Obsidian 的 AI 体验突然向 Cursor 靠拢。你选中一段文字,它直接给你展示改写后的 diff,你点确认就生效。不是弹出对话框"建议你可以这样改",而是直接动手改。
这个区别很微妙但很关键。一个是事前审批,一个是展示结果让你确认——效率差了一个数量级。
这种交互模式的转变背后,是 AI 从"辅助工具"变成了"协作者"。它不再等你问问题,而是主动在你工作的时候介入:帮你润色这段措辞、帮你把这五个零散笔记合并成一篇结构化文档、帮你在写作的时候实时查找相关引用。
更激进的尝试是 AI Agent Sidebar 和 Obsidian ACP Client。这些插件做的事情更疯狂——它们把外部的编程 Agent(比如 Claude Code)直接接入你的 Obsidian Vault。Agent 可以读你的笔记、改你的笔记、甚至根据你的笔记生成代码或执行任务。
你的笔记库不再只是"被阅读"的被动知识库,而是变成了 Agent 可以操作的工作空间。你的 Obsidian 第一次有了手脚。
说实话,这个阶段我自己用了之后有点恍惚。你在笔记里写了一段模糊的想法,Agent 帮你整理成结构化文档,然后根据文档内容去查资料补充细节,最后问你一句"要不要我把这个存到你的项目笔记里?"——这个体验已经不太像在用笔记工具了,更像是在和一个了解你所有知识储备的助手共事。
有点吓人,但更多是兴奋。
五、开发者视角:用 AI 给 Obsidian 造轮子
聊了这么多用户端的东西,换个角度——作为开发者,怎么用 AI 给 Obsidian 造轮子?
Obsidian 的插件 API 设计有一套自己的哲学:不侵入、可撤销、可组合。每个插件应该做好一件事,不搞全家桶,不留副作用。这种设计哲学和 AI 时代的"万能 Agent"思路其实有点张力,但也正因如此,Obsidian 的插件开发成了一个很好的实验场。
我自己用 AI 辅助开发插件的体验大概是这样的:
第一步,让 Copilot 或 Claude Code 生成骨架代码。Obsidian 的 API 虽然文档齐全,但概念比较多——Plugin 基类、MarkdownPostProcessor、EditorExtension、Vault 抽象、MetadataCache……光搞清楚这些概念之间的关系就要半天。AI 能直接给你搭好框架,省去从零摸索的时间。
第二步,人工把控核心逻辑。AI 生成的代码能跑,但经常忽略 Obsidian 特有的约束:比如在 onunload 里清理事件监听、处理 mobile 端的兼容性、避免在大型 Vault 里做阻塞操作。这些坑 AI 踩不到,得人来踩。
第三步,迭代和调试。这时候 AI 又能帮上忙了——你告诉它"我在用 metadataCache 的时候遇到 undefined",它能快速定位问题。
一个最小可行插件的开发流程大概是这样:花 10 分钟和 AI 聊清楚需求,让它生成基础代码(30 分钟),然后花 1-2 小时手动打磨、测试、修 bug。总的下来,一个简单的插件从零到能用大概半天到一天。
对比没有 AI 辅助的时代,这个速度快了不止一倍。但说实话,AI 最大的价值不是写代码本身,而是降低了"理解 Obsidian API"的认知门槛。你不需要把官方文档从头读到尾,只要描述清楚你要什么,AI 帮你把 API 调用串起来。
当然,AI 写的插件代码有时候会让你哭笑不得——它能正确调用 API,但会忘记处理边界情况,或者写出一个在 10 条笔记的小 Vault 里跑得飞快、但在 10000 条笔记的大 Vault 里直接卡死的实现。这种坑,踩一次就记住了(别问我怎么知道的)。
六、选型指南:我该用哪个?
说了这么多,到底该怎么选?按场景来:
如果你是内容创作者(写博客、写 newsletter): 推荐 Smart Connections + Text Generator。一个帮你在笔记库里找素材,一个帮你把素材组织成文章。基本不需要云端 API,隐私安全。
如果你是研究者或学生: 推荐 Copilot + Smart Connections 组合。Copilot 帮你快速总结文献笔记,Smart Connections 帮你发现笔记之间隐藏的连接。如果预算有限,可以只用 Smart Connections。
如果你是开发者或技术写作者: Smart Composer 是必装。选中文本直接改写的体验用过就回不去了。如果已经在用 Claude Code 或 Cursor,可以考虑 AI Agent Sidebar,让编程 Agent 直接在你的笔记库里工作。
如果你在意隐私到偏执的程度(理解,毕竟可能是十年日记): 本地 LLM 方案。用 Ollama 或 LM Studio 跑本地模型,配合 Smart Connections 的本地嵌入。数据零出本机,代价是模型能力会弱一些。但说实话,2026 年的本地小模型已经能做很多事了。
七、展望:造轮子的尽头
回到标题的问题:造轮子的尽头是什么?
回头看 Obsidian AI 工具链的进化,有一个很清晰的弧线:从补全到搜索到对话到执行。每一步都在减少人和信息之间的距离。补全减少了打字的时间,搜索减少了找信息的时间,对话减少了组织信息的时间,执行减少了……行动的时间。
下一步是什么?我猜是 Agent 原生。
现在已经有几个信号了。Agent Client Protocol(ACP)正在成为 Agent 之间通信的标准协议,Obsidian 已经有插件支持。本地模型的能力在快速逼近云端模型。Smart Connect 的架构已经支持把 ChatGPT 的上下文替换成 Ollama 或 LM Studio——换模型不用换笔记,换引擎不用换车。
终局可能是这样的:你的 Obsidian Vault 里常驻一个 Agent。它知道你所有的笔记、你的写作风格、你最近在研究什么。你不需要主动搜索,它会在合适的时候把相关信息推到你面前。你不需要手动整理,它会持续维护你的知识网络。你甚至不需要告诉它该做什么——它会根据你的笔记内容自主判断哪些事情值得做。
这不是科幻。这些技术今天已经存在了,只是还不够成熟,需要有人把它们串起来。
而 Obsidian 的插件生态,恰好就是最适合做这件事的地方。
(全文约 2800 字)
夜雨聆风