用了13款AI工具之后,我得出一个反直觉的结论

CAIO进化论 · 个人使用笔记

工具清单 · 真实体验

用了13款AI工具之后
我得出一个反直觉的结论

不是测评，是真实使用记录
一个设计公司IT负责人的AI工具清单

个人笔记 · 约7000字 · 阅读约18分钟

我不太喜欢写工具测评。测评这件事，往往要装出一副客观中立的姿态，逐项打分，然后给出一个”视情况而定”的结论，读完之后大家都不知道到底该用哪个。

这篇文章不是测评，是使用记录。我同时在跑好几件事——包括一个面向CIO群体的公众号，以及在企业AI落地上的持续探索——这一年多来几乎每天都在用这些工具。写下来，一是给自己做个盘点，二是给同样在摸索的CIO们一个参照。

那个反直觉的结论是什么？用了这么多工具之后，我发现不存在全能的AI工具。每一款，都有它断档第一的场景，也都有它力不从心的地方。试图找一个”最好的”来替代所有其他的，这个想法本身就是错的。

下面是我真实在用的13款工具，以及我用它们做什么、不用它们做什么。

第一部分

大模型 — 脑力的分工

这是我用得最频繁的一层，也是分工最细的一层。很多人倾向于选一个模型然后用到底，但我的体验是，不同模型之间的差距是真实存在的，混用才是正确姿势。

Claude Opus

逻辑与判断力断档第一

我给Claude Opus的定位只有一个：帮我想清楚。

逻辑推理、文章润色、给方案提建议——这些事交给它，做完基本可以直接发。不是说它写的文字有多华丽，而是它能抓住问题的核心，给出真正有用的反馈，而不是那种听起来很对但完全没用的套话。

举个例子：我给它一篇写好的文章，让它找问题，它会直接告诉我”第三段的逻辑跳跃太大，读者会失去你”，而不是”这篇文章整体不错，可以考虑在某些地方适当调整”。这个区别很重要。

弱点也很明显：搜索能力一般，知道的东西没有Gemini多，时效性差。凡是需要搜资料、查数据、了解最新动态的事，我不找它。

我什么时候找它

输出质量不能将就的活——文章收尾润色、重要方案的逻辑检查、给别人反馈之前先让Claude帮我过一遍。凡是”发出去之后不能后悔”的东西，都过它一遍。

Claude Chat（claude.ai）

能直接出文件

我觉得很多人只把Claude Chat当成一个聊天框，没有发现它接入Skills之后能做什么。这里单独写一下，因为这块确实超出了我的预期。

接入各种Skills之后，Claude Chat能直接生成可用的文件，而不是让你把内容复制粘贴到其他地方再手动整理。这个区别，用一次就能感受到。

我实际在用的三个场景

软件架构图

描述系统需求，直接生成可复制的SVG或Mermaid格式架构图。不是截图，是可以拖进Figma或其他设计工具继续编辑的矢量图。AI落地项目里，几个核心架构示意图就是这么出来的。

Excel / Word 表格

让它生成结构化数据，直接输出可下载的Excel文件或Word文档。不是复制粘贴，是真正的文件。整理竞品对比表、部门汇报数据的时候，省了大量手动搬运的时间。

可编辑的PPT框架

说清楚汇报主题和内容要点，它能生成有结构的PPT框架，可以直接在PowerPoint里打开编辑。在我试过的所有PPT工具里，这个流程目前是最顺的——虽然还不完美，但比手搓快多了。

核心体验的改变是：过去是”AI给建议，我去执行”；现在是”AI直接做好，我来确认”。这个方向上，Claude Chat是目前我用得最顺的工具。

Gemini

搜索整理断档第一

我做的工作需要大量搜集资料——行业动态、竞品分析、数据背书、案例研究。这件事上，Gemini的Deep Research是断档第一，没有任何工具能替代它。

有人会问：Claude搜索不也可以吗？可以，但差距很大。Claude知道的东西没有Gemini多，而且它的幻觉率虽然低，但”知道的少”这件事本身就是问题。Gemini在搜索和整理上，知道的多、更新的快、整合的逻辑也清楚。

但Gemini也有它的局限：它知道的多，但需要你来判断哪些是有用的。它给你一堆资料，筛选和提炼还是需要你来做——或者交给Claude来做。这就是为什么这两个工具是互补关系，不是竞争关系。

一句话总结：Gemini负责”知道”，Claude负责”想清楚”。少了任何一个，另一个都会很费劲。

Google AI Studio

Gemini 背后那扇门

大多数人用Gemini，只是用了它的对话界面。AI Studio才是Gemini真正的能力入口——可以切换模型版本、调整参数、上传文件批量处理、跑各种实验。

对我来说，AI Studio最大的价值是快速验证AI应用的可行性。比如我想知道”用AI分析设计稿，自动提取设计规范”这件事到底能做到什么程度，我不需要找外包问报价，自己在AI Studio里折腾半小时，就能得出一个基本判断。

另一个优势是免费额度。在免费范围内，AI Studio能调用到Gemini最新模型的完整能力，包括2M超长上下文。我处理一些需要把整本书或整套文档一起喂进去分析的任务，基本都在这里做。

对CIO最实用的一句话：在投入资源做一个AI应用之前，先去AI Studio里试一试，10分钟能让你判断这件事值不值得做。比问任何顾问都快、比找任何外包都省钱。

Gemini Canvas 插件

对话里直接做出来

这个插件改变了我一个很根深蒂固的工作习惯：过去我觉得”在对话框里只能聊天，真正的东西要在专门的软件里做”。Canvas打破了这个边界。

做网站：把需求说清楚，Canvas直接生成可以在浏览器预览的HTML页面，包括样式和交互。我给项目做了几个小型工具的原型页面，就是这么出来的。不需要写代码，不需要跳出对话框，描述需求→预览→调整，全在一个地方完成。

做海报图文：结合Nano Banana出图之后，用Canvas直接在图上加文字、排版，生成可以直接用于公众号或微信的图文内容。这个组合比单独用任何一个工具都顺。

核心体验：从”AI给内容，我去排版”变成了”AI直接做好，我来确认发布”。这一步看起来小，但实际上省掉了大量工具切换和手动整理的摩擦。

Grok

信息边界的通道

Grok不是我日常主力工具，但它有一个我无法用其他工具替代的场景：其他家不愿意聊或者明确限制讨论的话题。

一些敏感的竞品分析、争议性话题的多角度收集、某些涉及政策或行业监管的信息——这些在Claude或Gemini那里往往会触发限制。Grok在这方面的边界明显宽松很多，加上它能拉取X平台的实时数据，对于追踪行业动态和真实用户反馈很有用。

用得不多，但用的时候没有替代品。

ChatGPT + Codex

不如预期的替补

说实话，GPT-5.4没有达到我的预期。在文本工作上，我现在的默认组合已经是Claude+Gemini，ChatGPT在这个场景下排不进前两位。

但额度我没有浪费，主要留给Codex。Codex在代码执行和自动化脚本方面很实用——给它一个任务描述，它能写代码并直接运行，返回结果。处理批量数据、自动化重复性操作、快速验证一段逻辑，这些场景我还是找它。

诚实评价：如果你现在只打算订阅一个OpenAI产品，订Codex比订ChatGPT更值——至少对我的使用场景来说。

第二部分

Google生态的隐藏武器

NotebookLM是我用了很久才发现价值的工具。它不像其他AI产品那么高调，但用对了之后，它是整个研究工作流里不可或缺的一环。

NotebookLM

私域知识库

NotebookLM解决了一个我一直很头疼的问题：看了很多资料，但过两天就忘了，需要的时候又要重新找一遍。

它的逻辑是：把PDF、网页链接、YouTube视频、音频文件全部导入进去，NotebookLM把这些变成一个可以对话的私域知识库。你问它问题，它从你上传的资料里给你答案，每一个回答都标注来源——点击来源可以直接跳到原文的对应段落。

这个”标注来源”的特性，对我来说是最重要的。其他AI工具告诉你一个结论，你很难判断它是真的还是编的。NotebookLM只在你的资料范围内回答，答案可以追溯到原文，这个可信度完全不同。

我怎么用它

每次做一个新的研究课题，先用Gemini Deep Research搜集资料，把输出的报告下载成PDF或复制为文本，连同相关的行业报告、文章链接一起导入NotebookLM，建一个专属笔记本。

之后我不用再去翻原始资料，直接问NotebookLM就行，它帮我在所有资料里找答案。公众号文章的初稿也经常让它来生成——因为它基于我上传的资料，不会乱编，观点都有出处。

另一个很好玩的功能：它能把你上传的资料变成一段双人播客音频。把一份行业报告扔进去，十几分钟后出来一段两个人对谈的播客，可以在通勤路上听。我经常用这个功能快速消化长文档。

第三部分

创意工具 — 视觉内容的分工

这一部分变化最快，也是让我最惊喜的区域。一年前我觉得AI生成的视觉内容还是玩具级别，现在我已经在真实项目里用了。

Nano Banana

生图准确性断档第一

Nano Banana是Google DeepMind的生图模型，本质上是Gemini的理解能力+Imagen的画质引擎的结合体。最初是以匿名代号在全球最大的AI评测平台上出现的，结果被用户发现效果惊人，迅速出圈。

它和其他生图工具最大的区别，是对指令的理解和遵循能力。你让它在图里放一个带具体文字的标题，它真的能把文字渲染正确——这件事放到一年前，几乎所有生图模型都做不到。你让它保持某个人物在不同场景里的一致性，它能做到。

我用它的场景主要是：公众号配图、信息图、需要带中文文字的商业素材。这些场景都要求”准”，而不只是”好看”。Nano Banana在”准”这件事上，目前没有对手。

要说缺点：艺术性和情绪感不是它最强的地方。如果你需要的是那种让人眼前一亮的创意视觉，它可能不如Midjourney。但如果你需要的是一张信息准确、可以直接拿去用的图，就找它。

Seedance 2.0

生视频断档第一

字节2026年2月发布Seedance 2.0的时候，内部文档的标题直接叫”Kill the game”。我第一次看到这个标题觉得挺大言不惭的，然后看了几个demo，不说话了。

它支持四种模态混合输入——图片、视频、音频、文字可以随意组合；生成视频的同时会同步生成匹配的音效和配乐；口型同步做到了精准匹配；多个镜头之间的角色一致性可以维持。

我用一张图片加一句提示词，生成了一个15秒的品牌展示视频，音效、光影、运镜全部到位。这件事放到一年前，需要一个专业视频团队做好几天。

有人说AI视频已经通过了”图灵测试”——肉眼很难判断是不是AI生成的。我同意这个说法，Seedance 2.0就是让我改变这个判断的工具。

目前的限制：生成时长最长15秒，算力成本较高，高峰期要排队等待。但这些是工程问题，不是能力问题。能力已经到位了，其他的只是时间。

Lovart

设计工作流 Agent

Lovart定位是”全球首款设计Agent”，这个说法不算夸张。它和其他生图工具的本质区别在于：它解决的不是”出一张漂亮图”的问题，而是”解决一个设计业务需求”的问题。

你告诉它”我要做一套夏日饮品的品牌物料，包括主视觉、海报、包装设计”，它会自动规划步骤，调用不同工具，给你出一整套方案，而不是出一张图让你自己拼凑。它的无限画布可以让你在生成之后继续精细调整，把AI生成的结果一步步打磨成可以商业使用的成品。

Lovart的价值在于把设计执行层面的重复性工作交出去，让设计师专注于真正需要创意判断的部分。

要说它不擅长的地方：视频生成还在完善中，稳定性偶尔不够好。但静态设计物料这块，它已经是我最常用的工具之一。

TapNow

商业视频全流程

Seedance 2.0解决了”AI能生成高质量视频”的问题，TapNow解决的是另一个问题：我知道AI能生成视频，但我不知道一支商业TVC应该怎么做。

TapNow是一个”影视流程工具化”平台，它把专业导演的工作拆解成了普通人可以执行的步骤：上传灵感参考→AI解析分镜语言→建立Storyboard→节点化管理每个镜头→生成视频→合成成片。整个流程在一个画布里完成，不需要跳工具。

它还聚合了Seedance、Veo、可灵等主流视频模型，你可以根据每个镜头的需要选最合适的模型来生成，然后在同一个平台里合并成完整成片。

汤臣倍健那支在行业里流传的百万级TVC，就是用TapNow做的，制作团队还把整个工作流程在社区里公开了。我反复看了几遍，对AI视频制作的理解完全不同了。

TapNow解决的核心问题不是技术，是认知。AI有能力了，但大多数人不知道一支专业视频该怎么做。TapNow把导演的思维方式变成了可以复用的模板，这是它真正的价值所在。

第四部分

Claude Code — 藏着舍不得用

Claude Code

代码疑难杂症终极武器

不太舍得用，主要是成本的问题。Claude Code的token消耗在各种AI工具里属于高的，做一个稍微复杂的工程任务，费用累积得很快。

但用过就回不去了。它对代码的理解深度、对复杂工程问题的分析能力，是目前我用过的所有工具里最强的。遇到真正复杂的架构问题、难以复现的bug、需要跨多个文件分析的工程难题，我才会请出Claude Code。

在文本工作上，Claude Code对我的替代性暂时不强——这块的需求Claude Chat已经覆盖得很好了。Claude Code是一个留给真正硬核场景的工具。

我的分工逻辑：普通代码问题→Codex；稍复杂的工程问题→Claude Chat；真正啃不下来的硬骨头→Claude Code。三级分工，按需调用，不浪费。

最后一章

把工具串起来 — 一条完整的创作链路

上面介绍的工具，单独用都有价值。但把它们串起来之后，效率是另一个量级。我用来生产这个公众号文章的流程，就是最好的例子。

从选题确认到文章发布，我的完整流程是这样的：

Gemini Deep Research — 搜集资料

确定选题后，第一步交给Gemini。让它做Deep Research，搜集行业动态、相关数据、案例、竞品信息。一般一次搜索能给出几千字的综合报告，包含多个来源的交叉验证。这一步省掉了过去我要花半天手动查资料的时间。

↓

NotebookLM — 导入资料 · 生成初稿

把Gemini输出的报告、相关PDF、参考链接全部导入NotebookLM，建立这篇文章专属的知识库。然后让NotebookLM基于这些资料生成文章初稿——因为所有内容都来自上传的资料，观点有据可查，不会凭空编造。初稿可能有点干燥，但骨架和信息是准确的。

↓

Claude — 润色文字 · 排版输出

把NotebookLM的初稿交给Claude Opus。这一步做两件事：第一是润色，调整语气、逻辑结构、段落节奏，让文章从”信息准确但读起来干”变成”既准确又有人味”；第二是按微信公众号的排版规范输出HTML格式，包括标题层级、段落间距、重点标注、引用格式。这个HTML是可以直接导入135编辑器的。

↓

135编辑器 — 导入 · 视觉调整

把Claude输出的HTML文件导入135编辑器，做最终的视觉排版调整——颜色、字体、模块样式、配图位置。135是目前我用过对微信公众号兼容性最好的排版工具，它能预览手机端的真实渲染效果，避免发布后格式跑偏。这一步通常只需要15-20分钟。

↓

微信公众平台 — 发布

从135编辑器直接复制到微信公众号后台，做最后一遍通读，确认没有问题，定时或直接发布。

这条链路的核心逻辑

Gemini

知道

→

NotebookLM

整理

→

Claude

表达

→

135

呈现

→

公众号

发布

跑通这条链路之后，一篇深度文章从选题到发布，时间从过去的一整天压缩到了两三个小时。省下来的不只是时间，是精力——你可以把注意力放在真正需要判断和创意的地方，其他的让工具去跑。

一个框架，不是一个答案

用这些工具一年多，最大的感受是：不要试图找一个最好的来替代所有其他的，这个想法本身就是错的。每个工具都有它断档第一的场景，也都有它力不从心的地方。找准分工，按需调用，才是正确姿势。

我的需求

我找谁

逻辑推理 / 质量润色

Claude Opus

直出文件 / 架构图 / PPT

Claude Chat + Skills

搜索 / 资料整理

Gemini Deep Research

验证AI可行性

Google AI Studio

快速出网站 / 海报

Gemini Canvas 插件

私域知识库 / 文档消化

NotebookLM

敏感话题 / 实时信息

Grok

代码执行 / 自动化脚本

Codex

代码疑难杂症

Claude Code

精准生图 / 带文字的图

Nano Banana

品牌视频 / 创意短片

Seedance 2.0

设计物料 / 品牌视觉

Lovart

商业TVC / 专业视频流程

TapNow

写在最后

这份清单不是规划出来的，是被业务一个一个逼出来的。每一个工具进入我的工作流，都是因为我碰到了某个以前解决不好的问题，然后发现它能解决。

AI工具这个赛道变化太快，我现在的清单半年后可能已经有几个需要更新。但有一件事我觉得不会变：每一个工具都有它最适合的场景，没有万能的，也不需要万能的。

如果你正在搭建自己的AI工具栈，我的建议是：从一个你最高频的工作场景开始，找到一个能真正改变这个场景效率的工具，用熟了再往外扩展。比一口气订阅十个工具然后每个都用不深，要有用得多。

你在用哪些工具？

欢迎评论区分享你的清单，或者告诉我哪个我没提到的工具，你觉得值得加进来。

CAIO进化论 · 见证AI每一次进化，与你共赴智能纪元

用了13款AI工具之后我得出一个反直觉的结论