[绿建之外]浅聊AI第2.5期|什么是 Codex / VSCode / Obsidian

声明
本系列文章只是一组阶段性的思考与实践记录，主要用于抛砖引玉，并不构成对所有学科、所有工具或所有研究场景都适用的标准答案。由于 AI 工具迭代很快，本文中的部分判断、界面描述与工作流经验都具有较强时效性，随着模型、插件和平台的发展，后续很可能需要重新修订，因此也请读者结合自己的实际情况自行甄别。另需特别说明：本文讨论的是 AI 对研究工作区、材料组织与日常流程的辅助作用，而不是鼓励任何形式的学术不端。无论工具如何发展，文献理解、研究判断、结果核查与学术责任都不能外包给 AI。
此文章中的示意图与分析图由Gemini Nano Banana Pro生成，特此声明。

写到这里，有必要先停一下，把几个反复出现的名字说清楚。因为如果不先把 Codex、VSCode、Obsidian 这三个词放回各自的位置，后面很多讨论都容易变成“名词看起来都懂，实际还是混在一起”。这并不是读者的问题，而是现在工具生态本身变化太快，很多产品既有旧身份，又在长出新能力。结果就是，大家一边在用，一边又很难用一句话把它们真正说清楚。

先说最容易被误解的一个：Codex。按照 OpenAI 现在的官方定位，Codex 已经不只是传统意义上的代码补全工具，也不只是一个网页里回答编程问题的模型。官方更愿意把它描述成一种能够在编辑器、终端和云端协同工作的 coding agent，既可以回答问题，也可以围绕一个真实工作环境去执行任务、编辑文件、运行检查、推进流程。这个变化很关键，因为它意味着 Codex 的价值不再只在“写几行代码”，而在于它开始接近一种能够进入工作区、理解上下文并持续行动的工具形态。对研究者来说，这一点的重要性甚至可能超过它本身到底会不会写代码，因为研究现场本来就包含大量需要整理、说明、连接和维护的材料。

如果把视野再放宽一点，Codex 并不是唯一一条路线。Anthropic 的 Claude Code，同样强调 agentic coding system，会读代码库、改文件、跑测试，并把“描述目标、由系统继续往下做”作为核心能力；Google 的 Gemini CLI 则代表了另一种更偏命令行与终端协作的路径，强调通过 CLI 把模型能力直接带进本地工具链。把这些名字放在一起看，比较合适的理解并不是“哪一个工具彻底替代另一个”，而是它们共同指向了一类新工具：不再只是聊天，不再只是补全，而是开始进入工作区、接触文件、执行步骤、处理上下文。这里之所以重点谈 Codex，只是因为这组文章目前主要围绕它展开，而不是说只有它值得讨论——当然从成本角度来考虑，也许Codex是较为平衡的选择。

再说 VSCode。很多人一听到这个名字，第一反应还是“程序员用的代码编辑器”。这当然没错，Visual Studio Code 本来就是微软推出的编辑器，而且今天它仍然是一个很强的开发环境。但如果只把它理解成“写代码的地方”，也会把它用窄。对我们这一组文章来说，VSCode 更重要的地方在于，它是一个非常适合打开整个目录、查看文件树、维护说明文件、运行脚本、调用终端、查看版本变化并接入 Agent 的工作台。官方文档里本来就强调它的集成终端、资源管理器和 source control 视图，这些能力放在研究场景里会特别顺手，因为你真正需要处理的，往往不是一篇孤立文档，而是一整个项目现场。

这里还需要顺手说清一个选择问题。对于很多程序员来说，纯命令行工具当然经常是更高效的解决方案，像 Codex CLI 这样的形态在某些任务里也会更直接。但这组文章之所以更偏向 VSCode，并不是因为命令行不好，而是因为 VSCode 在“可见性”和“可维护性”上更友好（难道你想对着一个黑黢黢的命令行操作界面写论文？不会吧！）。目录树、文件内容、终端输出、版本变化和 Agent 协作入口可以同时摆在一个界面里，这对研究工作尤其重要。研究现场里往往不只是代码，还有文档、笔记、图表、说明文件和中间结果。把这些东西放在一个更直观的工作台里，很多人会更容易理解，也更容易长期维护。

当然，这并不意味着只有 VSCode 才能承担这个角色。像 PyCharm 这样的 IDE，本来就强调面向 Python 开发的完整集成环境；Cursor 则把自己明确定位成 AI code editor，也在尝试把代码编辑和 AI 协作更紧地绑在一起。它们在很多场景下都可以完成类似工作。这里之所以选择 VSCode，说到底还是一个很朴素的理由：我自己以前就在用它，已经习惯了，也更清楚它在工作区层面好用在哪里。工具选择并没有唯一正确答案，顺手、稳定、能长期维护，往往比“理论上最先进”更重要。

最后说 Obsidian。这个名字在中文互联网里经常和“第二大脑”“双链笔记”“知识管理”绑在一起，所以很多人一听到它，就会自动把它理解成一种很重的知识管理方法，甚至觉得不用它就不配谈研究工作流。我的看法没有那么夸张。Obsidian 的官方帮助文档其实很朴素：它本质上是一个围绕本地 Markdown 文件工作的笔记环境，提供文件浏览、链接、搜索、图谱、模板、同步、发布等能力。它真正适合的，不是取代所有工具，而是承担研究过程中的“阅读、回看、关联与沉淀”这一层工作，同时Codex之类的工具，markdown格式与其天然产生了较好的兼容性。说得更直白一点，Codex 更像一个能在工作区里协助你做事的助手，VSCode 更像一个处理项目现场的工作台，而 Obsidian 更像一个适合承接思考痕迹与笔记网络的阅读界面。只要把这个分工看明白，Obsidian 就不会显得神秘，也不会显得非用不可。

把这三个工具放在一起时，最容易犯的错误就是把它们看成同一层面的东西。其实并不是。Codex 更偏“智能执行与协作层”，VSCode 更偏“工作台与项目现场层”，Obsidian 更偏“笔记与知识沉淀层”。这也是为什么我一直不太喜欢那种简单粗暴的说法，比如“用某某工具替代某某工具”。在一个成熟一点的研究工作流里，它们往往不是替代关系，而是分工关系。只有把分工说清楚，后面讨论工作区时才不会变成工具堆砌。

这一点背后，其实还牵涉一个更大的问题：今天很多工具之所以让人困惑，不只是因为名字多，而是因为工具边界本身正在移动。代码编辑器开始接入 AI，AI 开始进入目录，笔记工具开始兼具数据库和发布能力，聊天工具开始长出执行环境。于是我们很容易在语言上继续沿用旧理解，在实际使用中却已经站到了新的场景里。结果就是，明明已经进入了一个新的工作方式，却还在用旧词解释新问题。第二点五期存在的意义，某种程度上就是先把这些词捋顺。不是为了做名词解释题，而是为了让后面的讨论有一个更稳的起点。

如果要用一句最短的话来概括，我会这样说：Codex、VSCode 和 Obsidian 不是三个堆在一起的热门名词，而是三种不同层次的工具。前者更像进入工作区的智能助手，中间那个更像处理项目现场的工作台，后者则更像承接阅读和思考痕迹的界面。只要这层关系理顺了，后面关于工作区、日志、索引、模板和协作的讨论，才不会一开始就跑偏。