乐于分享
好东西不私藏

AI编程工具,选哪个?

AI编程工具,选哪个?

花了三天时间,我把最近冒出来的几个AI编程工具全跑了一遍。

说实话,有点眼花缭乱。

以前选工具很简单,要么ChatGPT,要么Claude。现在不一样了,每个工具都号称解决了某个“痛点”,听起来都挺厉害。

但到底哪个真有用?

我拆解了一下,发现这些新工具其实分成了三类:帮你记住的、帮你协作的、帮你感知的

今天我就把这几个工具挨个拆开,告诉你哪个值得花时间。

🧠 第一类:解决“金鱼记忆”

先说我测的第一个:Claude代码记忆插件。

这个东西,说白了就是给Claude Code这个IDE插件加了个“外挂大脑”。

它的核心功能就一个:自动记住你和Claude的所有编程对话。

你肯定遇到过这种情况:写代码写到一半,切出去查个资料,回来再问Claude,它已经忘了刚才在聊什么。你得重新解释一遍上下文。

这个插件就是解决这个的。

它会把你们的对话自动压缩、存储,下次你打开项目,它能立刻接上。

我实测了一下,在同一个项目里连续工作,确实不用反复提醒AI“我们刚才在做什么”。尤其是写一些复杂功能,需要来回讨论的时候,省了不少重复劳动。

但这里有个前提:你得用Claude Code。

如果你平时不用这个IDE插件,那这个工具对你来说就是零。国内讨论Claude Code的人本来就不多,更别说这种深度优化插件了。

所以,如果你是Claude Code的重度用户,这个插件值得一试。如果不是,可以直接跳过。

📄 第二类:解决“格式战争”

第二个工具,微软开源的MarkItDown

这个名字起得很直白:把东西标记成Markdown。

它能一键把任何Office文档(Word、Excel、PPT)转换成Markdown格式。

我拿一个十几页的产品需求文档试了试,转换效果比我之前用的在线工具好不少。表格、标题层级、列表,基本都能正确识别。

这东西最大的价值,是“官方出品”

微软自己做的文档转换工具,对自家格式的理解肯定比第三方深。而且开源了,你可以自己部署,不用担心文档上传到第三方服务器的隐私问题。

但说实话,如果你不是经常需要把Office文档转成Markdown,它的使用频率不会太高。

程序员和写作者可能会喜欢,因为Markdown是他们最熟悉的格式。但对普通用户来说,可能就是个“偶尔用用”的工具。

我的判断是:它是一个高质量的专项工具,解决一个具体问题。有需求就用,没需求也不用硬找需求。

👥 第三类:“单打独斗”到“团队作战”

第三个工具,开源多智能体协作平台。

这个概念就有点意思了。

它不是给你一个更强的AI程序员,而是给你一队AI程序员,并且让你能像管理真人团队一样管理它们。

你可以给不同的AI智能体分配任务:让A写前端,B写后端,C做测试。然后在这个平台上跟踪每个人的进度,协调它们之间的协作。

我跑了一下他们的示例项目。

说实话,现阶段还比较粗糙,更像一个“实验性框架”。设置起来需要一些技术基础,不是开箱即用那种。

但它的方向是对的。

AI编程的未来,肯定不是“一个人工智能帮你写代码”,而是“一个人工智能团队和你一起开发”。

这个平台就是在探索这个方向:怎么让多个AI智能体有效协作,怎么管理它们的工作流。

如果你对AI智能体开发感兴趣,想研究多智能体协作,这个项目值得关注。如果你只是想找个工具提高日常编码效率,那它可能还太早了。

👁️ 第四类:能“看见”和“听见”的助手

第四个工具,屏幕AI助手Omi。

这个是我觉得最有想象力的一个。

它不是通过聊天框和你交互,而是通过“看”你的屏幕和“听”你说话来理解上下文。

比如你在操作一个软件,卡住了,不知道下一步该点哪里。你可以直接说“我现在想导出这个文件,该怎么操作?”,Omi会分析你的屏幕截图,然后告诉你具体点击哪个按钮。

我测试的时候,让它指导我完成一个我之前没用过的设计工具的几个操作。它确实能识别界面元素,给出正确的操作步骤。

这种交互模式,比打字描述“我在哪个软件的哪个界面”要自然得多。

但它的局限性也很明显:对网络要求高(需要实时截图上传),对复杂任务的指导能力有限,而且目前支持的场景还不多。

不过,这种“感知型”AI助手,可能是未来人机交互的一个方向。国内几乎没看到同类产品,这个项目走得很前。

🌱 第五类:会“自我进化”的智能体

最后一个,自进化智能体。

这个概念非常前沿。

它不是被预先编程好所有功能,而是从一段3300行的“种子代码”开始,通过“基因组进化协议”,自我学习、进化出复杂的系统控制能力。

你可以把它理解成一个有“生命”的AI:给它一个核心,它自己能生长出技能树。

我仔细看了他们的论文和代码。

说实话,这东西离实用还很远。它属于AI智能体研究的前沿领域,更多是学术探索性质。

但它的意义在于,提出了一个完全不同的AI构建思路:不是我们教AI做什么,而是给AI一套进化规则,让它自己学会做什么。

国内技术圈对这类深度研究项目的讨论很少,因为确实太“硬核”了,和日常应用距离太远。

🔍 横向对比:到底怎么选?

测完这五个工具,我画了个简单的对比表。

但我不想给你一个冷冰冰的表格,因为工具好不好用,完全取决于你用它在什么场景下解决什么问题

我拆解一下我的选择逻辑:

如果你经常在同一个项目里长时间编码,而且用Claude Code,那么记忆插件能显著提升你的连续工作效率。它解决的是“上下文断裂”的痛点。

如果你需要频繁处理文档格式转换,特别是Office转Markdown,微软的MarkItDown是目前最好的选择之一。官方工具,质量有保障。

如果你在探索AI智能体的可能性,想了解多智能体协作或者自进化机制,那么后面三个工具都值得一看。它们代表的是AI编程的未来方向,虽然现在还不成熟。

如果你想要一个更自然的交互助手,解决日常软件操作问题,Omi这种“感知型”助手很有潜力。但它现在更像一个技术演示,不要期待太高。

🎯 我的推荐

说完工具,说人。

对于大多数程序员和开发者,我建议先关注前两类工具。

记忆插件和文档转换工具,解决的是你实际工作中会遇到的具体问题。它们不改变你的工作流,只是让现有流程更顺畅。

投入产出比最高。

对于AI技术爱好者和研究者,后面三类工具更有价值。

多智能体协作、感知交互、自进化机制,这些是AI智能体发展的关键方向。虽然现在不成熟,但提前了解、实验,能帮你建立认知优势。

对于普通用户,说实话,这些工具可能都还太“硬核”。

如果你只是想找个AI帮你写写代码、改改bug,ChatGPT和Claude依然是最成熟、最易用的选择。这些新工具,等它们再进化一两代再说。

🤔 一个还没想明白的问题

测完这些工具,我一直在想一个问题:

AI编程工具的终点是什么?

是变成一个无所不能的超级程序员?还是变成一群分工协作的AI团队?或者是变成一个能自我进化、自己写自己的“生命体”?

每个工具都在往不同的方向探索。

记忆插件在优化现有交互,多智能体平台在探索协作模式,自进化智能体在挑战AI的构建范式。

没有谁对谁错,都是在试。

我自己的感觉是,我们可能高估了AI在短期内取代程序员的能力,但低估了AI在改变编程方式上的速度。

这些工具,每一个都在重新定义“人怎么和机器一起写代码”。

最后说个真事。

我测Omi的时候,它指导我完成一个操作,我按照它的指示点了按钮,任务完成。那一瞬间,我感觉不是在用“工具”,而是在和一个人合作。

虽然它还很笨拙,但那种感觉,和打字问ChatGPT完全不一样。

也许这就是方向。