乐于分享
好东西不私藏

真正值得使用的60个AI工具清单

真正值得使用的60个AI工具清单

点击下面卡片,快速关注本公众号

本文作者花了100 多个小时亲自测试各类 AI 工具,从每周不断涌现的新框架、新 Agent 和每天登上 GitHub 热榜的新仓库中,过滤掉噪音,只保留 60 个”在真实工作流里跑得起来的工具”。

这份清单的价值不在于”全”,而在于”筛”。2026年的AI工具生态已经过剩:仅Claude Code社区就有超过8万个Skills(数据截至 2026 年 3 月),MCP服务器的数量每月都在翻倍,GitHub每天都有新的Agent框架冲上trending。真正的问题从”有什么工具”变成了”哪些工具值得花时间配置”。本文按九大类逐一梳理,并补充横向对比层次图与四类使用者的起步组合。


第一类:AI 编程智能体与 IDE

这是最拥挤也最关键的一类:让 AI 真正写代码、审代码、跑测试,而不只是做花哨的 demo。

工具
定位与备注
链接
Claude Code
Anthropic 官方命令行编程智能体。读文件、写代码、跑测试、直接操作本地环境,开发者要”完全可控”时的首选
https://docs.anthropic.com/en/docs/claude-code
Cursor
AI 原生代码编辑器。基于 VS Code,行内补全、代码库对话、多文件编辑
https://www.cursor.com
Codex 
OpenAI 的终端编程智能体。擅长多步骤实现任务,读代码库后自动写并执行
https://github.com/openai/codex
Windsurf
Codeium 出品的 AI IDE。Cascade 智能体支持多文件编辑和深度代码库理解
https://codeium.com/windsurf
Superpowers
Claude Code 技能合集。覆盖 TDD、调试、计划到执行的流水线,GitHub 96,000+ stars
https://github.com/obra/superpowers
Spec Kit
规格驱动开发。GitHub 官方项目,先写规格再让 AI 生成代码,50,000+ stars
https://github.com/github/spec-kit
Aider
终端里的 AI 结对编程。兼容任意 LLM,擅长在已有代码库上工作,30,000+ stars
https://github.com/paul-gauthier/aider

这一组里,Claude Code 和 Cursor 是事实上的两极:前者面向命令行原教旨主义者,后者面向习惯编辑器的多数开发者。Superpowers 和 Spec Kit 不是 IDE,而是覆盖其上的”方法论层”,在解决同一个问题的两个侧面:前者靠积累的技能包约束 Claude 的行为,后者靠规格文档强制开发者先想清楚再动手。


第二类:Agent 框架

构建能自主思考、行动、迭代的系统。

项目
核心特征
链接
OpenClaw
持久化、跨渠道(WhatsApp/Telegram/Discord)、能自己写 Skills。原推文称 210,000+ stars,是原作者清单里星标最高的项目
https://github.com/openclaw/openclaw
LangGraph
把多智能体编排写成代码,图结构 + 分支逻辑 + 人机协同 + 持久状态,26,000+ stars
https://github.com/langchain-ai/langgraph
CrewAI
给 Agent 定义角色、目标、背景故事,像团队那样协作
https://github.com/crewAIInc/crewAI
AutoGPT
早期自主 Agent 平台,长任务场景,近年趋于稳定
https://github.com/Significant-Gravitas/AutoGPT
Dify
开源 LLM 应用构建平台,工作流 + RAG + Agent + 模型管理一体化
https://github.com/langgenius/dify
OWL
多智能体协作框架,GAIA 基准上当前最强之一
https://github.com/camel-ai/owl
CopilotKit
把 AI Copilot 嵌入 React 应用
https://github.com/CopilotKit/CopilotKit
pydantic-ai
基于 Pydantic 的类型安全 Agent 框架
https://github.com/pydantic/pydantic-ai

这一类的分化很明显。LangGraph、pydantic-ai 面向”要工程化落地”的团队,代码即图、类型校验、可测试;CrewAI、AutoGPT 面向”要快速原型”的场景,抽象程度更高、配置更少;Dify、CopilotKit 则面向”要交付产品”的开发者,前者让非开发者也能搭应用,后者让 React 开发者几行代码嵌入 Copilot。


第三类:MCP 服务器与工具连接

一句话概括 Skills 与 MCP 的分工:Skills 教 AI 怎么做事,MCP 给 AI 外部世界的访问权限。

项目
用途
链接
Tavily
为 AI Agent 设计的搜索引擎,返回结构化 LLM-ready 数据,提供 search/extract/crawl/map 四种工具
https://github.com/tavily-ai/tavily-mcp
Context7
向 LLM 注入最新的库文档,解决”AI 调用已废弃 API”的老问题,提示词里加 “use context7” 即可
https://github.com/upstash/context7
Task Master AI
AI 的项目经理:输入 PRD,自动拆分为带依赖关系的结构化任务,Claude 逐条执行
https://github.com/eyaltoledano/claude-task-master
 Playwright
让 LLM 控制真实浏览器,用于测试、爬取、交互
https://github.com/executeautomation/mcp-playwright
fastmcp
极简 Python 构建 MCP 服务器的最快方式
https://github.com/jlowin/fastmcp
markdownify-mcp
把 PDF、图片、音频统一转为 Markdown 喂给 AI
https://github.com/zcaceres/markdownify-mcp
MCPHub
通过 HTTP 管理多个 MCP 服务器,一个仪表盘统管所有连接
https://github.com/samanhappy/mcphub

Context7 解决的是一个非常具体但被严重低估的问题:LLM 训练数据有截止日期,而库 API 每周都在变。把最新文档实时注入上下文,直接消除了”AI 写出已废弃代码”这一类最常见的幻觉来源。


第四类:Claude Skills 精选

整个 Claude 生态里,社区 Skills 已突破 8 万个,这份清单只挑最值得装的八个。

Skill
作用与亮点
链接
PDF Processing(官方)
读取、提取表格、填表、合并拆分。知识工作者效用最高的单个 Skill
https://github.com/anthropics/skills/tree/main/skills/pdf
Frontend Design(官方)
真正的设计系统、大胆排版、产品级 UI,277,000+ 安装量,摆脱”AI slop”审美
https://github.com/anthropics/skills/tree/main/skills/frontend-design
Skill Creator(官方)
描述工作流,5 分钟自动生成 SKILL.md。元技能:做 Skill 的 Skill
https://github.com/anthropics/skills/tree/main/skills/skill-creator
Marketing Skills
CRO、文案、SEO、邮件序列、增长策略 20+ 技能,营销团队瑞士军刀
https://github.com/coreyhaines31/marketingskills
Claude SEO
全站 SEO 审计、Schema 验证、关键词分析,12 个子技能覆盖完整 SEO 流程
https://github.com/AgriciDaniel/claude-seo
Obsidian Skills
自动打标签、自动双向链接、笔记库原生操作,由 Obsidian CEO 亲自开发
https://github.com/kepano/obsidian-skills
Context Optimization
减少 Token 消耗、优化 KV-cache 命中率,长对话场景省钱利器,13,900+ stars
https://github.com/muratcankoylan/agent-skills-for-context-engineering
Deep Research Skill
8 阶段深度研究、支持自动续跑,需要”真深挖”而不是”只浏览”时的选择
https://github.com/199-biotechnologies/claude-deep-research-skill

第五类:本地 AI 与模型运行

在自己的硬件上跑模型:隐私、速度、零 API 成本。

项目
定位
链接
Ollama
一条命令本地运行开源 LLM,支持 Llama、Mistral、Gemma 等数十种模型,从零到本地 AI 最快路径
https://github.com/ollama/ollama
Open WebUI
自托管的 ChatGPT 风格界面,和 Ollama 组合就是一套完整的私有 AI
https://github.com/open-webui/open-webui
LlamaFile
把整个 LLM 打包成单个可执行文件,零依赖,下载即跑
https://github.com/Mozilla-Ocho/llamafile
Unsloth
微调速度 2 倍、显存占用减少 70%,想训自己的模型从这里开始
https://github.com/unslothai/unsloth
vLLM
高吞吐推理引擎,相比原生 serving 快 2–4 倍,生产部署开源模型的事实标准
https://github.com/vllm-project/vllm

本地 AI 五件套的分工很清晰: Ollama 管”能跑起来”,Open WebUI 管”好用的界面”,Unsloth 管”训练自己的模型”,vLLM 管”上生产”。LlamaFile 是体验路径最短的异类:一个可执行文件就能分发整个模型,适合演示和内部分享。


第六类:工作流与自动化

把 AI 接入已有工具链,而不是让它孤立存在。

项目
特征
链接
n8n
开源工作流自动化,400+ 集成 + AI 节点,自托管可用,AI 驱动自动化的最佳可视化构建器
https://github.com/n8n-io/n8n
Langflow
拖拽式 Agent 流水线构建,140,000+ stars
https://github.com/langflow-ai/langflow
Huginn
自托管的网页 Agent,用于监控、告警、数据采集,隐私优先
https://github.com/huginn/huginn
DSPy
“用编程(而非提示词)驱动基础模型”,斯坦福研究成果转化,追求可复现与可优化
https://github.com/stanfordnlp/dspy
Temporal
持久化工作流引擎,面向长时任务,自动处理崩溃、重试、超时
https://github.com/temporalio/temporal

DSPy 是这一类里的异类,它解决的是一个哲学问题:当你希望 LLM 的行为可复现、可调优、可回归测试时,提示词工程本身就是不够的,应当把它当成”程序”而不是”咒语”来写。对严肃使用 LLM 的团队,这是一个值得认真学的方向。


第七类:搜索、数据与 RAG

把信息送进 AI、把结构化结果从 AI 中取出来。

项目
用途
链接
GPT Researcher
自主研究智能体,给一个主题返回一份有来源的分析报告
https://github.com/assafelovic/gpt-researcher
Firecrawl
把任意网站变成 LLM-ready 数据,专为 AI 管线设计的爬虫
https://github.com/mendableai/firecrawl
Vanna AI
自然语言转 SQL,用英文问问题、得到数据库查询
https://github.com/vanna-ai/vanna
Instructor
借助 Pydantic 从任意 LLM 拿到结构化 JSON 输出,支持 OpenAI、Anthropic、Google 等 15+ 提供商
https://python.useinstructor.com
Chroma
开源向量数据库,给 AI 应用加语义搜索和长期记忆最简路径
https://github.com/chroma-core/chroma
dlt
LLM 原生的数据管线,支持 5000+ 数据源
https://github.com/dlt-hub/dlt
ExtractThinker
文档智能领域的 ORM,从任意文档类型抽取结构化数据
https://github.com/enoch3712/ExtractThinker

Instructor 是这一层的隐形冠军。 生产环境里用 LLM 写的 AI 工程师几乎都在用它,不是因为功能多花哨,而是因为”结构化输出”是所有严肃 AI 应用绕不开的问题,而 Instructor 用最薄的一层把它解决干净。


第八类:API 与基础设施

让一切在生产环境跑起来的”管道层”。

项目
用途
链接
FastAPI
服务化 AI 应用的 Python Web 框架,文档一流,Pydantic 校验内建
https://github.com/tiangolo/fastapi
Portkey Gateway
一个 API 路由到 250+ LLM,不改代码切换模型
https://github.com/Portkey-AI/gateway
OmniRoute
44+ AI 提供商的 API 代理,负载均衡、降级、成本优化
https://github.com/diegosouzapw/OmniRoute
lmnr
追踪和评估 Agent 行为,既能看它在做什么,也能衡量做得好不好
https://github.com/lmnr-ai/lmnr
Codebase Memory MCP
把代码库转成持久化知识图谱,跨会话记忆整个项目结构
https://github.com/DeusData/codebase-memory-mcp

Portkey 和 OmniRoute 的价值在 2026 年被再次放大:大模型价格持续波动、供应商可用性有波峰波谷,一套”模型路由网关”几乎已经是生产 AI 应用的标配。


第九类:精选合集与学习资源

找更多工具、持续学习的地方。

资源
用途
链接
Awesome Claude Skills
最好的 Claude Skills 精选列表,22,000+ stars,找新技能从这里开始
https://github.com/travisvn/awesome-claude-skills
Anthropic Skills 官方仓库
Anthropic 官方参考实现,Skills 应该怎么写的”金标准”
https://github.com/anthropics/skills
Awesome Agents
100+ 开源 Agent 工具合集
https://github.com/kyrolabs/awesome-agents
PromptingGuide
从入门到进阶的提示工程完整参考
https://www.promptingguide.ai
Anthropic Prompt Engineering Tutorial
9 章的动手教程(含 Jupyter 笔记本),学提示工程最结构化的路径
https://github.com/anthropics/prompt-eng-interactive-tutorial
SkillsMP
80,000+ 社区 Skills 市场,最大规模的 Claude Skills 目录
https://skillsmp.com
MAGI//ARCHIVE
每日更新的 AI 新仓库 feed,跟踪最新项目
https://tom-doerr.github.io/repo_posts/
Anthropic 官方文档
API、提示工程、工具调用、Agent,所有”严肃项目”开工前的必读
https://docs.anthropic.com

零基础的读者应优先花时间读 Anthropic Prompt Engineering Tutorial 和官方文档,因为这两份材料决定你对整个 Claude 生态的底层心智模型,一旦扭曲后面再补很难。社区合集(Awesome Claude Skills、SkillsMP)的作用是”持续发现”,不是”入门”,在你已经能判断”什么是好 Skill”之后去翻收益才会最大。


横向对比:六类核心工具的定位

把九大类收敛到更粗的粒度会发现一个变化:2024 年 Agent 框架层还在混战,Skills 和 MCP 都还是新概念,每个月都有”新范式”的说法出现;到 2026 年,各层的代表项目已经基本收敛,边界也清晰了很多。九大类合并可以归为六个功能层,更容易看清整个工具栈的结构:

层次
代表工具
解决的问题
典型用户
编程执行层
Claude Code, Cursor, Aider
让 AI 真的写代码并操作本地环境
开发者
智能体编排层
LangGraph, CrewAI, OpenClaw
构建多步骤、可控的自主系统
AI 工程师
工具连接层
Tavily, Context7, MCP Playwright
把外部世界接入 LLM
所有使用者
行为规范层
Superpowers, Claude Skills
约束 AI “怎么做事”
深度使用者
数据与记忆层
Chroma, Instructor, Codebase Memory MCP
让 AI 有结构化输入输出和长期记忆
构建产品者
基础设施层
FastAPI, Portkey, vLLM
让一切在生产环境稳定运行
后端工程师

这种分层的好处是:当你要为一个具体任务选工具时,不是在 60 个项目里线性挑,而是先判断”我缺哪一层”。


四类使用者的起步组合

我的建议是:不要一次装 60 个工具。 以下是四类典型使用者的”最小可用组合”。

如果你是开发者:Claude Code + Superpowers + Context7 + Tavily。编程智能体 + 技能合集 + 最新文档 + 搜索,组成一套几乎开箱即用的 AI 编程工作流。

如果你是创作者或知识工作者:OpenClaw + Obsidian Skills + PDF Processing + Frontend Design。跨渠道 AI 助手 + 笔记库集成 + 文档处理 + 设计能力,覆盖”读—记—写—发”全链路。

如果你在构建产品:FastAPI + Instructor + Chroma + LangGraph。后端框架 + 结构化输出 + 向量记忆 + 多智能体编排,生产级 AI 应用的骨架。

如果你在系统学习:Anthropic Prompt Engineering Tutorial + PromptingGuide + Anthropic 官方文档。先把基础打牢,再谈工具选型。


这份清单意味着什么

回到 60 个工具之外看整个图景:2026 年 AI 工具生态的真正特征不是”多”,而是分层已经稳定

稳定的证据至少有三条:第一,编程智能体层两年来反复验证下来就是 Claude Code 与 Cursor 两极,Aider、Windsurf、Codex CLI 都找到了明确的生态位而不是互相取代;第二,Agent 编排层从 2024 年数十个框架乱斗,收敛到 LangGraph、CrewAI、pydantic-ai 三种主导范式——代码即图、角色扮演、类型安全;第三,Skills 和 MCP 从”新概念”变成了”必备层”,从 Anthropic 官方仓库到 SkillsMP 的 8 万条目,已经形成了围绕它们的独立生态。

这意味着工具选型的策略也要变。过去两年的流行做法是”新项目即机会”,每个周末都有人在微信群里吼”又一个 Agent 框架出来了”;到了 2026 年,更理性的做法是先把六层里每层的”第一梯队”用熟:

  • • Claude Code 在编程层
  • • LangGraph 在编排层
  • • Tavily/Context7 在连接层
  • • Superpowers 在行为层
  • • Chroma/Instructor 在数据层
  • • FastAPI/Portkey 在基础设施层

这套组合拳打熟,再谈”尝鲜”。

欢迎扫码加入知识星球,获取更多优质内容