真正值得使用的60个AI工具清单
点击下面卡片,快速关注本公众号
本文作者花了100 多个小时亲自测试各类 AI 工具,从每周不断涌现的新框架、新 Agent 和每天登上 GitHub 热榜的新仓库中,过滤掉噪音,只保留 60 个”在真实工作流里跑得起来的工具”。
这份清单的价值不在于”全”,而在于”筛”。2026年的AI工具生态已经过剩:仅Claude Code社区就有超过8万个Skills(数据截至 2026 年 3 月),MCP服务器的数量每月都在翻倍,GitHub每天都有新的Agent框架冲上trending。真正的问题从”有什么工具”变成了”哪些工具值得花时间配置”。本文按九大类逐一梳理,并补充横向对比层次图与四类使用者的起步组合。

第一类:AI 编程智能体与 IDE
这是最拥挤也最关键的一类:让 AI 真正写代码、审代码、跑测试,而不只是做花哨的 demo。
|
|
|
|
|---|---|---|
| Claude Code |
|
|
| Cursor |
|
|
| Codex |
|
|
| Windsurf |
|
|
| Superpowers |
|
|
| Spec Kit |
|
|
| Aider |
|
|
这一组里,Claude Code 和 Cursor 是事实上的两极:前者面向命令行原教旨主义者,后者面向习惯编辑器的多数开发者。Superpowers 和 Spec Kit 不是 IDE,而是覆盖其上的”方法论层”,在解决同一个问题的两个侧面:前者靠积累的技能包约束 Claude 的行为,后者靠规格文档强制开发者先想清楚再动手。
第二类:Agent 框架
构建能自主思考、行动、迭代的系统。
|
|
|
|
|---|---|---|
| OpenClaw |
|
|
| LangGraph |
|
|
| CrewAI |
|
|
| AutoGPT |
|
|
| Dify |
|
|
| OWL |
|
|
| CopilotKit |
|
|
| pydantic-ai |
|
|
这一类的分化很明显。LangGraph、pydantic-ai 面向”要工程化落地”的团队,代码即图、类型校验、可测试;CrewAI、AutoGPT 面向”要快速原型”的场景,抽象程度更高、配置更少;Dify、CopilotKit 则面向”要交付产品”的开发者,前者让非开发者也能搭应用,后者让 React 开发者几行代码嵌入 Copilot。
第三类:MCP 服务器与工具连接
一句话概括 Skills 与 MCP 的分工:Skills 教 AI 怎么做事,MCP 给 AI 外部世界的访问权限。
|
|
|
|
|---|---|---|
| Tavily |
|
|
| Context7 |
|
|
| Task Master AI |
|
|
| Playwright |
|
|
| fastmcp |
|
|
| markdownify-mcp |
|
|
| MCPHub |
|
|
Context7 解决的是一个非常具体但被严重低估的问题:LLM 训练数据有截止日期,而库 API 每周都在变。把最新文档实时注入上下文,直接消除了”AI 写出已废弃代码”这一类最常见的幻觉来源。
第四类:Claude Skills 精选
整个 Claude 生态里,社区 Skills 已突破 8 万个,这份清单只挑最值得装的八个。
|
|
|
|
|---|---|---|
| PDF Processing(官方) |
|
|
| Frontend Design(官方) |
|
|
| Skill Creator(官方) |
|
|
| Marketing Skills |
|
|
| Claude SEO |
|
|
| Obsidian Skills |
|
|
| Context Optimization |
|
|
| Deep Research Skill |
|
|
第五类:本地 AI 与模型运行
在自己的硬件上跑模型:隐私、速度、零 API 成本。
|
|
|
|
|---|---|---|
| Ollama |
|
|
| Open WebUI |
|
|
| LlamaFile |
|
|
| Unsloth |
|
|
| vLLM |
|
|
本地 AI 五件套的分工很清晰: Ollama 管”能跑起来”,Open WebUI 管”好用的界面”,Unsloth 管”训练自己的模型”,vLLM 管”上生产”。LlamaFile 是体验路径最短的异类:一个可执行文件就能分发整个模型,适合演示和内部分享。
第六类:工作流与自动化
把 AI 接入已有工具链,而不是让它孤立存在。
|
|
|
|
|---|---|---|
| n8n |
|
|
| Langflow |
|
|
| Huginn |
|
|
| DSPy |
|
|
| Temporal |
|
|
DSPy 是这一类里的异类,它解决的是一个哲学问题:当你希望 LLM 的行为可复现、可调优、可回归测试时,提示词工程本身就是不够的,应当把它当成”程序”而不是”咒语”来写。对严肃使用 LLM 的团队,这是一个值得认真学的方向。
第七类:搜索、数据与 RAG
把信息送进 AI、把结构化结果从 AI 中取出来。
|
|
|
|
|---|---|---|
| GPT Researcher |
|
|
| Firecrawl |
|
|
| Vanna AI |
|
|
| Instructor |
|
|
| Chroma |
|
|
| dlt |
|
|
| ExtractThinker |
|
|
Instructor 是这一层的隐形冠军。 生产环境里用 LLM 写的 AI 工程师几乎都在用它,不是因为功能多花哨,而是因为”结构化输出”是所有严肃 AI 应用绕不开的问题,而 Instructor 用最薄的一层把它解决干净。
第八类:API 与基础设施
让一切在生产环境跑起来的”管道层”。
|
|
|
|
|---|---|---|
| FastAPI |
|
|
| Portkey Gateway |
|
|
| OmniRoute |
|
|
| lmnr |
|
|
| Codebase Memory MCP |
|
|
Portkey 和 OmniRoute 的价值在 2026 年被再次放大:大模型价格持续波动、供应商可用性有波峰波谷,一套”模型路由网关”几乎已经是生产 AI 应用的标配。
第九类:精选合集与学习资源
找更多工具、持续学习的地方。
|
|
|
|
|---|---|---|
| Awesome Claude Skills |
|
|
| Anthropic Skills 官方仓库 |
|
|
| Awesome Agents |
|
|
| PromptingGuide |
|
|
| Anthropic Prompt Engineering Tutorial |
|
|
| SkillsMP |
|
|
| MAGI//ARCHIVE |
|
|
| Anthropic 官方文档 |
|
|
零基础的读者应优先花时间读 Anthropic Prompt Engineering Tutorial 和官方文档,因为这两份材料决定你对整个 Claude 生态的底层心智模型,一旦扭曲后面再补很难。社区合集(Awesome Claude Skills、SkillsMP)的作用是”持续发现”,不是”入门”,在你已经能判断”什么是好 Skill”之后去翻收益才会最大。
横向对比:六类核心工具的定位
把九大类收敛到更粗的粒度会发现一个变化:2024 年 Agent 框架层还在混战,Skills 和 MCP 都还是新概念,每个月都有”新范式”的说法出现;到 2026 年,各层的代表项目已经基本收敛,边界也清晰了很多。九大类合并可以归为六个功能层,更容易看清整个工具栈的结构:
|
|
|
|
|
|---|---|---|---|
| 编程执行层 |
|
|
|
| 智能体编排层 |
|
|
|
| 工具连接层 |
|
|
|
| 行为规范层 |
|
|
|
| 数据与记忆层 |
|
|
|
| 基础设施层 |
|
|
|
这种分层的好处是:当你要为一个具体任务选工具时,不是在 60 个项目里线性挑,而是先判断”我缺哪一层”。
四类使用者的起步组合
我的建议是:不要一次装 60 个工具。 以下是四类典型使用者的”最小可用组合”。
如果你是开发者:Claude Code + Superpowers + Context7 + Tavily。编程智能体 + 技能合集 + 最新文档 + 搜索,组成一套几乎开箱即用的 AI 编程工作流。
如果你是创作者或知识工作者:OpenClaw + Obsidian Skills + PDF Processing + Frontend Design。跨渠道 AI 助手 + 笔记库集成 + 文档处理 + 设计能力,覆盖”读—记—写—发”全链路。
如果你在构建产品:FastAPI + Instructor + Chroma + LangGraph。后端框架 + 结构化输出 + 向量记忆 + 多智能体编排,生产级 AI 应用的骨架。
如果你在系统学习:Anthropic Prompt Engineering Tutorial + PromptingGuide + Anthropic 官方文档。先把基础打牢,再谈工具选型。
这份清单意味着什么
回到 60 个工具之外看整个图景:2026 年 AI 工具生态的真正特征不是”多”,而是分层已经稳定。
稳定的证据至少有三条:第一,编程智能体层两年来反复验证下来就是 Claude Code 与 Cursor 两极,Aider、Windsurf、Codex CLI 都找到了明确的生态位而不是互相取代;第二,Agent 编排层从 2024 年数十个框架乱斗,收敛到 LangGraph、CrewAI、pydantic-ai 三种主导范式——代码即图、角色扮演、类型安全;第三,Skills 和 MCP 从”新概念”变成了”必备层”,从 Anthropic 官方仓库到 SkillsMP 的 8 万条目,已经形成了围绕它们的独立生态。
这意味着工具选型的策略也要变。过去两年的流行做法是”新项目即机会”,每个周末都有人在微信群里吼”又一个 Agent 框架出来了”;到了 2026 年,更理性的做法是先把六层里每层的”第一梯队”用熟:
-
• Claude Code 在编程层 -
• LangGraph 在编排层 -
• Tavily/Context7 在连接层 -
• Superpowers 在行为层 -
• Chroma/Instructor 在数据层 -
• FastAPI/Portkey 在基础设施层
这套组合拳打熟,再谈”尝鲜”。
欢迎扫码加入知识星球,获取更多优质内容

夜雨聆风