乐于分享
好东西不私藏

用了13款AI工具之后,我得出一个反直觉的结论

用了13款AI工具之后,我得出一个反直觉的结论

CAIO进化论 · 个人使用笔记

工具清单 · 真实体验

用了13款AI工具之后
我得出一个反直觉的结论

不是测评,是真实使用记录
一个设计公司IT负责人的AI工具清单

个人笔记  ·  约7000字  ·  阅读约18分钟

我不太喜欢写工具测评。测评这件事,往往要装出一副客观中立的姿态,逐项打分,然后给出一个”视情况而定”的结论,读完之后大家都不知道到底该用哪个。

这篇文章不是测评,是使用记录。我同时在跑好几件事——包括一个面向CIO群体的公众号,以及在企业AI落地上的持续探索——这一年多来几乎每天都在用这些工具。写下来,一是给自己做个盘点,二是给同样在摸索的CIO们一个参照。

那个反直觉的结论是什么?用了这么多工具之后,我发现不存在全能的AI工具。每一款,都有它断档第一的场景,也都有它力不从心的地方。试图找一个”最好的”来替代所有其他的,这个想法本身就是错的。

下面是我真实在用的13款工具,以及我用它们做什么、不用它们做什么。

第一部分

大模型 — 脑力的分工

这是我用得最频繁的一层,也是分工最细的一层。很多人倾向于选一个模型然后用到底,但我的体验是,不同模型之间的差距是真实存在的,混用才是正确姿势。

01

Claude Opus

逻辑与判断力 断档第一

我给Claude Opus的定位只有一个:帮我想清楚。

逻辑推理、文章润色、给方案提建议——这些事交给它,做完基本可以直接发。不是说它写的文字有多华丽,而是它能抓住问题的核心,给出真正有用的反馈,而不是那种听起来很对但完全没用的套话。

举个例子:我给它一篇写好的文章,让它找问题,它会直接告诉我”第三段的逻辑跳跃太大,读者会失去你”,而不是”这篇文章整体不错,可以考虑在某些地方适当调整”。这个区别很重要。

弱点也很明显:搜索能力一般,知道的东西没有Gemini多,时效性差。凡是需要搜资料、查数据、了解最新动态的事,我不找它。

我什么时候找它

输出质量不能将就的活——文章收尾润色、重要方案的逻辑检查、给别人反馈之前先让Claude帮我过一遍。凡是”发出去之后不能后悔”的东西,都过它一遍。

02

Claude Chat(claude.ai)

能直接出文件

我觉得很多人只把Claude Chat当成一个聊天框,没有发现它接入Skills之后能做什么。这里单独写一下,因为这块确实超出了我的预期。

接入各种Skills之后,Claude Chat能直接生成可用的文件,而不是让你把内容复制粘贴到其他地方再手动整理。这个区别,用一次就能感受到。

我实际在用的三个场景

1

软件架构图

描述系统需求,直接生成可复制的SVG或Mermaid格式架构图。不是截图,是可以拖进Figma或其他设计工具继续编辑的矢量图。AI落地项目里,几个核心架构示意图就是这么出来的。

2

Excel / Word 表格

让它生成结构化数据,直接输出可下载的Excel文件或Word文档。不是复制粘贴,是真正的文件。整理竞品对比表、部门汇报数据的时候,省了大量手动搬运的时间。

3

可编辑的PPT框架

说清楚汇报主题和内容要点,它能生成有结构的PPT框架,可以直接在PowerPoint里打开编辑。在我试过的所有PPT工具里,这个流程目前是最顺的——虽然还不完美,但比手搓快多了。

核心体验的改变是:过去是”AI给建议,我去执行”;现在是”AI直接做好,我来确认”。这个方向上,Claude Chat是目前我用得最顺的工具。

03

Gemini

搜索整理 断档第一

我做的工作需要大量搜集资料——行业动态、竞品分析、数据背书、案例研究。这件事上,Gemini的Deep Research是断档第一,没有任何工具能替代它。

有人会问:Claude搜索不也可以吗?可以,但差距很大。Claude知道的东西没有Gemini多,而且它的幻觉率虽然低,但”知道的少”这件事本身就是问题。Gemini在搜索和整理上,知道的多、更新的快、整合的逻辑也清楚。

但Gemini也有它的局限:它知道的多,但需要你来判断哪些是有用的。它给你一堆资料,筛选和提炼还是需要你来做——或者交给Claude来做。这就是为什么这两个工具是互补关系,不是竞争关系。

一句话总结:Gemini负责”知道”,Claude负责”想清楚”。少了任何一个,另一个都会很费劲。

04

Google AI Studio

Gemini 背后那扇门

大多数人用Gemini,只是用了它的对话界面。AI Studio才是Gemini真正的能力入口——可以切换模型版本、调整参数、上传文件批量处理、跑各种实验。

对我来说,AI Studio最大的价值是快速验证AI应用的可行性。比如我想知道”用AI分析设计稿,自动提取设计规范”这件事到底能做到什么程度,我不需要找外包问报价,自己在AI Studio里折腾半小时,就能得出一个基本判断。

另一个优势是免费额度。在免费范围内,AI Studio能调用到Gemini最新模型的完整能力,包括2M超长上下文。我处理一些需要把整本书或整套文档一起喂进去分析的任务,基本都在这里做。

对CIO最实用的一句话:在投入资源做一个AI应用之前,先去AI Studio里试一试,10分钟能让你判断这件事值不值得做。比问任何顾问都快、比找任何外包都省钱。

05

Gemini Canvas 插件

对话里直接做出来

这个插件改变了我一个很根深蒂固的工作习惯:过去我觉得”在对话框里只能聊天,真正的东西要在专门的软件里做”。Canvas打破了这个边界。

做网站:把需求说清楚,Canvas直接生成可以在浏览器预览的HTML页面,包括样式和交互。我给项目做了几个小型工具的原型页面,就是这么出来的。不需要写代码,不需要跳出对话框,描述需求→预览→调整,全在一个地方完成。

做海报图文:结合Nano Banana出图之后,用Canvas直接在图上加文字、排版,生成可以直接用于公众号或微信的图文内容。这个组合比单独用任何一个工具都顺。

核心体验:从”AI给内容,我去排版”变成了”AI直接做好,我来确认发布”。这一步看起来小,但实际上省掉了大量工具切换和手动整理的摩擦。

06

Grok

信息边界的通道

Grok不是我日常主力工具,但它有一个我无法用其他工具替代的场景:其他家不愿意聊或者明确限制讨论的话题。

一些敏感的竞品分析、争议性话题的多角度收集、某些涉及政策或行业监管的信息——这些在Claude或Gemini那里往往会触发限制。Grok在这方面的边界明显宽松很多,加上它能拉取X平台的实时数据,对于追踪行业动态和真实用户反馈很有用。

用得不多,但用的时候没有替代品。

07

ChatGPT + Codex

不如预期的替补

说实话,GPT-5.4没有达到我的预期。在文本工作上,我现在的默认组合已经是Claude+Gemini,ChatGPT在这个场景下排不进前两位。

但额度我没有浪费,主要留给Codex。Codex在代码执行和自动化脚本方面很实用——给它一个任务描述,它能写代码并直接运行,返回结果。处理批量数据、自动化重复性操作、快速验证一段逻辑,这些场景我还是找它。

诚实评价:如果你现在只打算订阅一个OpenAI产品,订Codex比订ChatGPT更值——至少对我的使用场景来说。

第二部分

Google生态的隐藏武器

NotebookLM是我用了很久才发现价值的工具。它不像其他AI产品那么高调,但用对了之后,它是整个研究工作流里不可或缺的一环。

08

NotebookLM

私域知识库

NotebookLM解决了一个我一直很头疼的问题:看了很多资料,但过两天就忘了,需要的时候又要重新找一遍。

它的逻辑是:把PDF、网页链接、YouTube视频、音频文件全部导入进去,NotebookLM把这些变成一个可以对话的私域知识库。你问它问题,它从你上传的资料里给你答案,每一个回答都标注来源——点击来源可以直接跳到原文的对应段落。

这个”标注来源”的特性,对我来说是最重要的。其他AI工具告诉你一个结论,你很难判断它是真的还是编的。NotebookLM只在你的资料范围内回答,答案可以追溯到原文,这个可信度完全不同。

我怎么用它

每次做一个新的研究课题,先用Gemini Deep Research搜集资料,把输出的报告下载成PDF或复制为文本,连同相关的行业报告、文章链接一起导入NotebookLM,建一个专属笔记本。

之后我不用再去翻原始资料,直接问NotebookLM就行,它帮我在所有资料里找答案。公众号文章的初稿也经常让它来生成——因为它基于我上传的资料,不会乱编,观点都有出处。

另一个很好玩的功能:它能把你上传的资料变成一段双人播客音频。把一份行业报告扔进去,十几分钟后出来一段两个人对谈的播客,可以在通勤路上听。我经常用这个功能快速消化长文档。

第三部分

创意工具 — 视觉内容的分工

这一部分变化最快,也是让我最惊喜的区域。一年前我觉得AI生成的视觉内容还是玩具级别,现在我已经在真实项目里用了。

09

Nano Banana

生图准确性 断档第一

Nano Banana是Google DeepMind的生图模型,本质上是Gemini的理解能力+Imagen的画质引擎的结合体。最初是以匿名代号在全球最大的AI评测平台上出现的,结果被用户发现效果惊人,迅速出圈。

它和其他生图工具最大的区别,是对指令的理解和遵循能力。你让它在图里放一个带具体文字的标题,它真的能把文字渲染正确——这件事放到一年前,几乎所有生图模型都做不到。你让它保持某个人物在不同场景里的一致性,它能做到。

我用它的场景主要是:公众号配图、信息图、需要带中文文字的商业素材。这些场景都要求”准”,而不只是”好看”。Nano Banana在”准”这件事上,目前没有对手。

要说缺点:艺术性和情绪感不是它最强的地方。如果你需要的是那种让人眼前一亮的创意视觉,它可能不如Midjourney。但如果你需要的是一张信息准确、可以直接拿去用的图,就找它。

10

Seedance 2.0

生视频 断档第一

字节2026年2月发布Seedance 2.0的时候,内部文档的标题直接叫”Kill the game”。我第一次看到这个标题觉得挺大言不惭的,然后看了几个demo,不说话了。

它支持四种模态混合输入——图片、视频、音频、文字可以随意组合;生成视频的同时会同步生成匹配的音效和配乐;口型同步做到了精准匹配;多个镜头之间的角色一致性可以维持。

我用一张图片加一句提示词,生成了一个15秒的品牌展示视频,音效、光影、运镜全部到位。这件事放到一年前,需要一个专业视频团队做好几天。

有人说AI视频已经通过了”图灵测试”——肉眼很难判断是不是AI生成的。我同意这个说法,Seedance 2.0就是让我改变这个判断的工具。

目前的限制:生成时长最长15秒,算力成本较高,高峰期要排队等待。但这些是工程问题,不是能力问题。能力已经到位了,其他的只是时间。

11

Lovart

设计工作流 Agent

Lovart定位是”全球首款设计Agent”,这个说法不算夸张。它和其他生图工具的本质区别在于:它解决的不是”出一张漂亮图”的问题,而是”解决一个设计业务需求”的问题。

你告诉它”我要做一套夏日饮品的品牌物料,包括主视觉、海报、包装设计”,它会自动规划步骤,调用不同工具,给你出一整套方案,而不是出一张图让你自己拼凑。它的无限画布可以让你在生成之后继续精细调整,把AI生成的结果一步步打磨成可以商业使用的成品。

Lovart的价值在于把设计执行层面的重复性工作交出去,让设计师专注于真正需要创意判断的部分。

要说它不擅长的地方:视频生成还在完善中,稳定性偶尔不够好。但静态设计物料这块,它已经是我最常用的工具之一。

12

TapNow

商业视频全流程

Seedance 2.0解决了”AI能生成高质量视频”的问题,TapNow解决的是另一个问题:我知道AI能生成视频,但我不知道一支商业TVC应该怎么做。

TapNow是一个”影视流程工具化”平台,它把专业导演的工作拆解成了普通人可以执行的步骤:上传灵感参考→AI解析分镜语言→建立Storyboard→节点化管理每个镜头→生成视频→合成成片。整个流程在一个画布里完成,不需要跳工具。

它还聚合了Seedance、Veo、可灵等主流视频模型,你可以根据每个镜头的需要选最合适的模型来生成,然后在同一个平台里合并成完整成片。

汤臣倍健那支在行业里流传的百万级TVC,就是用TapNow做的,制作团队还把整个工作流程在社区里公开了。我反复看了几遍,对AI视频制作的理解完全不同了。

TapNow解决的核心问题不是技术,是认知。AI有能力了,但大多数人不知道一支专业视频该怎么做。TapNow把导演的思维方式变成了可以复用的模板,这是它真正的价值所在。

第四部分

Claude Code — 藏着舍不得用

13

Claude Code

代码疑难杂症 终极武器

不太舍得用,主要是成本的问题。Claude Code的token消耗在各种AI工具里属于高的,做一个稍微复杂的工程任务,费用累积得很快。

但用过就回不去了。它对代码的理解深度、对复杂工程问题的分析能力,是目前我用过的所有工具里最强的。遇到真正复杂的架构问题、难以复现的bug、需要跨多个文件分析的工程难题,我才会请出Claude Code。

在文本工作上,Claude Code对我的替代性暂时不强——这块的需求Claude Chat已经覆盖得很好了。Claude Code是一个留给真正硬核场景的工具。

我的分工逻辑:普通代码问题→Codex;稍复杂的工程问题→Claude Chat;真正啃不下来的硬骨头→Claude Code。三级分工,按需调用,不浪费。

最后一章

把工具串起来 — 一条完整的创作链路

上面介绍的工具,单独用都有价值。但把它们串起来之后,效率是另一个量级。我用来生产这个公众号文章的流程,就是最好的例子。

从选题确认到文章发布,我的完整流程是这样的:

1

Gemini Deep Research — 搜集资料

确定选题后,第一步交给Gemini。让它做Deep Research,搜集行业动态、相关数据、案例、竞品信息。一般一次搜索能给出几千字的综合报告,包含多个来源的交叉验证。这一步省掉了过去我要花半天手动查资料的时间。

2

NotebookLM — 导入资料 · 生成初稿

把Gemini输出的报告、相关PDF、参考链接全部导入NotebookLM,建立这篇文章专属的知识库。然后让NotebookLM基于这些资料生成文章初稿——因为所有内容都来自上传的资料,观点有据可查,不会凭空编造。初稿可能有点干燥,但骨架和信息是准确的。

3

Claude — 润色文字 · 排版输出

把NotebookLM的初稿交给Claude Opus。这一步做两件事:第一是润色,调整语气、逻辑结构、段落节奏,让文章从”信息准确但读起来干”变成”既准确又有人味”;第二是按微信公众号的排版规范输出HTML格式,包括标题层级、段落间距、重点标注、引用格式。这个HTML是可以直接导入135编辑器的。

4

135编辑器 — 导入 · 视觉调整

把Claude输出的HTML文件导入135编辑器,做最终的视觉排版调整——颜色、字体、模块样式、配图位置。135是目前我用过对微信公众号兼容性最好的排版工具,它能预览手机端的真实渲染效果,避免发布后格式跑偏。这一步通常只需要15-20分钟。

5

微信公众平台 — 发布

从135编辑器直接复制到微信公众号后台,做最后一遍通读,确认没有问题,定时或直接发布。

这条链路的核心逻辑

Gemini

知道

NotebookLM

整理

Claude

表达

135

呈现

公众号

发布

跑通这条链路之后,一篇深度文章从选题到发布,时间从过去的一整天压缩到了两三个小时。省下来的不只是时间,是精力——你可以把注意力放在真正需要判断和创意的地方,其他的让工具去跑。

一个框架,不是一个答案

用这些工具一年多,最大的感受是:不要试图找一个最好的来替代所有其他的,这个想法本身就是错的。每个工具都有它断档第一的场景,也都有它力不从心的地方。找准分工,按需调用,才是正确姿势。

我的需求
我找谁
逻辑推理 / 质量润色
Claude Opus
直出文件 / 架构图 / PPT
Claude Chat + Skills
搜索 / 资料整理
Gemini Deep Research
验证AI可行性
Google AI Studio
快速出网站 / 海报
Gemini Canvas 插件
私域知识库 / 文档消化
NotebookLM
敏感话题 / 实时信息
Grok
代码执行 / 自动化脚本
Codex
代码疑难杂症
Claude Code
精准生图 / 带文字的图
Nano Banana
品牌视频 / 创意短片
Seedance 2.0
设计物料 / 品牌视觉
Lovart
商业TVC / 专业视频流程
TapNow

写在最后

这份清单不是规划出来的,是被业务一个一个逼出来的。每一个工具进入我的工作流,都是因为我碰到了某个以前解决不好的问题,然后发现它能解决。

AI工具这个赛道变化太快,我现在的清单半年后可能已经有几个需要更新。但有一件事我觉得不会变:每一个工具都有它最适合的场景,没有万能的,也不需要万能的。

如果你正在搭建自己的AI工具栈,我的建议是:从一个你最高频的工作场景开始,找到一个能真正改变这个场景效率的工具,用熟了再往外扩展。比一口气订阅十个工具然后每个都用不深,要有用得多。

你在用哪些工具?

欢迎评论区分享你的清单,或者告诉我哪个我没提到的工具,你觉得值得加进来。

CAIO进化论 · 见证AI每一次进化,与你共赴智能纪元