昨天刷到一个视频。
Ali Abdaal ,那个靠效率频道做到六百万粉的英国人,发了个 Shorts ,给 AI 工具排名。
一分钟的视频,他按 S 到 F 分档,评了十来个工具。
我看了两遍。
不是因为他多权威,而是因为每个档位,我基本都自己用过。 Hermes 我天天在用, Codex 也没少折腾, Perplexity 三天两头打开。说人话就是,这些工具我都付过钱、踩过坑、流过泪。
所以今天这篇,不是翻译他的排名,而是拿他的框架当引子,放上我自己的体感和判断。
不一定对,但肯定真。
先说结论
AI 工具这个赛道,变化快到你没法形成固定记忆。
三个月前的好东西,今天可能已经掉队。 Ali 自己的排名里有一个细节特别有意思——他给 OpenAI 的最新版打了 S 级,但补了一句:如果是几周前,我还会给 S 级,现在我只能给 B 级。
为什么?因为 Claude 在这几周内,把 OpenAI 的好功能一个一个抄过去,还加了自己的。
这就是 2026 年的 AI 工具格局。
没有永远的第一,只有此刻最好用的。
S 级:真能替代人的
先放一张图,省得一个个念——这是 Ali 的排名和我自己体感的汇总:

先说排在最前面的。
Claude Code, Ali 给的 S 级,我完全同意。
我现在写代码的基本盘就是它。 Hermes 就是基于 Claude Code 的,每天用它来写代码、抓数据、写文章。不是说它不会犯错,而是它犯错之后纠正的效率太高了。你说"这个地方不对",它看一眼,改掉,继续。
我写这篇文章,有一半是靠 Hermes+Claude Code 完成的。
Voice Power,也是 S 级。语音输入工具做到这个程度,基本可以告别打字了。我写公众号初稿很多时候就是用语音先过一遍,然后修。
但最让我意外的 S 级是Perplexity。
Ali 说它是 S 级,因为 Perplexity 本质上是一个套壳——它套了其他所有模型。你买高级版,可以在一个对话框里切 GPT 、 Claude 、 Gemini 。 Perplexity Computer 这个产品做得也很克制,不是硬塞功能,是把切换这件事做到极简。
我自己的体验是, Perplexity 的搜索质量确实稳。比直接去 Google 搜 AI 新闻靠谱。
A 级:有用,但不是不可替代
NotebookLM, Ali 给了 A 级。
说它 A 级的原因是,如果你是学生想做学习笔记,它很好用。但除此之外,普通场景不刚需。我用下来感觉差不多,搭一个知识库查资料还行,但不会天天打开。
Whisper Flow,也是 A 级。语音转写做到这个程度很好了,问题是竞品太多,没有不可替代性。
Gemini 最新版和Grock 最新版, Ali 都给了 A 级。这些模型各有长处,但说到综合水平,都还差 Claude 半档。
B 级:曾经的好东西,现在是追赶者
这一段最有意思。
Claude Opus 4.7, Ali 给了 B 级。
如果你用过 Opus 4.6 ,可能还记得那种惊艳感。当时 Claude 就是碾压级的,你说什么它都能接住。但 4.7 反而退了?不是技术退步,是别人追上了。
AI 工具的竞争就是这样的。不是你变差了,是你停止变好的一瞬间,就被超过了。
OpenAI 5.5也是同理。
Ali 的原话是:几周前我还会给 OpenAI 打 S 级,现在只能打 B 级。
我自己的感受也是。 Codex 好用,但用久了你会发现边界——它更擅长一件事做到极致,但不太擅长在多个任务间灵活切换和我对话。 Claude 是边聊边干的风格, Codex 更像派单模式。
对我来说, Claude 风格更适合我这种一个人干活的状态。
F 级:只有一个
Ali 的原话是: Oh god, that's F tier. It's like the worst thing ever.
他没说名字。但看上下文,应该是某个曾经的明星产品。
所以 AI 工具这个赛道最大的风险不是做不好,而是做得还不错的时候,被别人用更好的方式打败了。
我自己的排序方法
用多了你会发现一个规律:
与其追着工具跑,不如先搞清楚自己要什么。
你要写代码? Claude Code 目前没有对手。
你要搜信息? Perplexity 比 GPT Search 和 Google 都稳。
你要做内容?组合拳才是答案。语音输入打初稿, Claude 扩框架,人做最后一公里。
Ali 的那个一分钟视频只是一个切片,但它切出了一个真相: 2026 年的 AI 工具,没有全能冠军,只有单项强者。
我现在桌面上的工具组合,三个月前完全不一样。
三个月后,肯定又会换一批。
所以别焦虑,追不上才是常态。挑一个当下最适合你的,用熟它,比什么都强。
觉得有用的话,点个赞,收藏一下。
夜雨聆风