乐于分享
好东西不私藏

我花了一周,把主流 AI 工具全用了一遍,发现了一些很离谱的事

我花了一周,把主流 AI 工具全用了一遍,发现了一些很离谱的事

事情是这样的。

上周五下午,部门群里突然炸了。一个同事甩出来一张截图,是用某 AI 编程工具 30 秒跑出来的一个小功能。

然后另一个同事不服气,用另一个工具也跑了一遍。

然后又一个人加入了战局。

然后我也加入了。

然后我们花了一整个下午,谁也没干活。

但我发现了一些很有意思的事情。

先说结论

不绕弯子,直接说:

2024 年到现在的 AI 工具生态,已经完全不是去年那个样子了。

你如果还在用「调 API」那套老思路,对不起,你可能错过了半个时代。

具体怎么回事,我慢慢说。

第一个离谱的事

AI 编程工具,现在已经卷成这样了吗?

我之前一直觉得,AI 写代码嘛,无非就是帮你补全个函数、解释个报错。

但当我看到同事用 Cursor 做一个完整的小项目,从设计到代码到调试,全程 AI 主导,40 分钟搞定一个本来要两天的东西的时候,我是真的愣住了。

就是那种,黑暗森林的感觉。

你知道这东西很强,但你不知道它已经强到这个地步了。

逐个说,我测了哪些

测了差不多七八个吧,有国外的也有国内的。按我的理解分个类:

编程类:Claude Code、Cursor、GitHub Copilot、通义灵码、文心快码

生图类:Midjourney、DALL-E 3、Stable Diffusion、国产的几个

写作类:Claude、豆包、Kimi、秘塔写作猫

搜索类:Perplexity、秘塔搜索、AskYourPDF

每一类我都会先说基础用法,再说一个骚操作。遵循升番逻辑,最炸的留最后。

编程类:从「辅助」到「主导」

Claude Code

这玩意我用了差不多两个月了。

怎么说呢,它不是一个写代码的工具,它是一个会写代码的同事。

你给它一个需求,它会先理解,然后自己规划、自己写、自己测试、自己迭代。全程你只需要盯着看,必要的时候说「这个不对,换一个思路」。

我前两天让它帮我写一个数据可视化的页面,本来想的是让它帮我搭个框架我自己填内容。结果它直接把图表、交互、响应式全做了,还顺手加了我没要求的动画效果。

我看了半天,没毛病。

它的骚操作:你可以直接丢给它一个 GitHub issue 的链接,它会自己去看代码、定位问题、给出修复方案。这对于维护老项目的人来说,简直是作弊。

Cursor

Cursor 走的是另一条路。它不是让你当甩手掌柜,而是让你当一个更高效的程序员。

它的核心是「双人编程」的概念。你写一行,AI 帮你补全五句。你写错了,AI 马上告诉你。你想重构,AI 直接帮你动手。

我最骚的一次用法是这样的:我把竞品的产品截图丢给它,说「仿这个做一个登录页面,用 Vue」。它直接给我还原了七八成像。

七八成像。

一张截图进去,一个可以跑的前端出来。

我当时就给我整懵了。

通义灵码 & 文心快码

国产的两款我也有用。

说实话,功能上没有 Claude Code 和 Cursor 那么惊艳,但胜在本土化做得好。中文注释、中文文档理解、还有对国内开源项目的熟悉度,都更强一些。

而且,免费。

这个就很香了。

生图类:审美这件事,AI 开始有了

Midjourney

还是那个 Midjourney,还是那个味儿。

它的强项一直是「我也不知道我要什么,但我知道你帮我画出来我认」。

你只需要给一个模糊的描述,它给你一堆选项,然后你再慢慢调。

我上周用它做了一套文章配图,就是那种赛博朋克风的。加上中文文字后期处理,发出去之后有人说「这是专门找人画的?」

我不知道该怎么回答。

DALL-E 3

DALL-E 3 的强项是「理解你的意图」。

你跟它说「画一个穿着牛仔裤的猫」,Midjourney 可能给你一只穿着牛仔裤的真实的猫,但 DALL-E 3 可能给你一只穿着牛仔裤的二次元的猫,或者一只穿着牛仔裤的猫的抽象画。

它会根据上下文自己判断你可能想要什么。

我试过一个用法:让它画一套表情包,同一个角色,不同表情。结果出来的图,风格高度统一,表情精准到位。

直接可以用的那种。

国产生图:卷到离谱

这块我重点试了两个:即梦和秒画。

怎么说呢,国产的进步速度是肉眼可见的快。

即梦的中文文字生成能力已经是第一梯队了,你想在图里加中文,它基本不会给你糊成一团。这点 Midjourney 到现在都做得不好。

秒画的风格迁移做得很好,你给它一张参考图,它能抓住那个风格生成新的内容。这对于做系列图的人来说,效率提升是巨大的。

写作类:AI 写的东西,AI 能看出来

这个就很有意思了。

我用 Claude 写了一篇差不多 2000 字的文章,然后让另一个 AI 去检测是不是 AI 写的。

结果是,两个 AI 都说「大概率是真人写的」。

然后我自己读了一遍,发现确实还挺像那么回事的。

但我总觉得少了点什么。

少了什么呢?少了那种「愚钝如我」的真诚感,少了那种「你敢信?」的废话感,少了那种「这个尼玛就是」的吐槽感。

这些是 AI 写不出来的。

至少现在还写不出来。

豆包

豆包的强项是「本土化」。

你让它写小红书文案,它给你出来的东西是真的像那么回事。你让它写朋友圈文案,它能给你加上那种「啊啊啊」和「姐妹们」的语气词。

这个就很骚了。

我有个朋友做微商,用豆包写产品文案,订单量翻了一倍。不是我瞎编,是他自己跟我说的。

Kimi

Kimi 的长文本能力是真的强。

我丢给它一篇 10 万字的文档,让它总结要点,5 秒钟给我出来一份结构清晰的重点摘要。

这个在以前是不可想象的。

它的骚操作:你可以让它帮你读论文、读财报、读合同。我上周让它帮我读了一份合作协议,10 分钟给我标出来三个可能的风险点。

一个专业的法务review,10 分钟,免费的。

搜索类:从「关键词」到「问题」

Perplexity

这个我必须说。

Perplexity 改变了我搜索的习惯。

以前搜索是:想一个问题,拆成几个关键词,挨个搜,翻一堆网页,自己总结。

现在搜索是:直接把完整的问题丢给 Perplexity,它给你一个带出处、有分析、可验证的答案。

你不需要再去「找」信息了,你只需要「确认」信息。

这个转变是革命性的。

秘塔搜索

国产的替代方案,中文内容覆盖率更高。

最骚的用法是搜索那种长尾问题,比如「某款产品五代产品的对比」,或者「某部小说的人物关系图」。它能给你整理成结构化的输出,而不是一堆链接让你自己翻。

第二个离谱的事

我发现了一个很有意思的规律:

用 AI 用得好的人,不是那些技术最强的,而是那些最会「提需求」的。

这个听起来像废话,但我发现它不是。

我见过很多人抱怨 AI 不好用,给出来的回答是垃圾。但当我看他跟 AI 对话的时候,我通常会看到这样的对话:

用户:「帮我写一篇文章」

AI:「好的,请问主题是什么?」

用户:「关于科技的」

AI:「好的,请问你想要什么风格?」

用户:「就普通的吧」

然后 AI 给了一个四平八稳的废话文,用户一看,说「你看,垃圾吧」。

但问题在谁呢?

我自己的经验是,跟 AI 对话,你需要把你的需求「具象化」。

不要只说「帮我写文章」,要说「帮我写一篇给 25-35 岁互联网从业者的文章,主题是 AI 编程工具怎么改变他们的工作方式,语气要像在跟朋友聊天,要有具体的案例,要有我自己的感受,要有能让人「卧槽」的点」。

你描述得越具体,AI 给你的东西就越精准。

这不是 AI 的问题,是 prompt 工程的问题。

而 prompt 工程,本质上是一种表达能力。

第三个离谱的事

也是我最近感触最深的一个。

AI 工具现在最大的瓶颈,不是技术,是想象力。

我认识一个大哥,他用 AI 工具做的事情,让我看了之后愣了好久。

他不是程序员,但他用 AI 做了一个自己的数据库,把自己十几年积累的客户信息、产品资料、行业经验全部结构化存进去了。

然后他让 AI 帮他分析数据、生成报告、起草方案、回复客户。

一个人,干了一个团队的活。

他说了一句话让我印象很深:「我不需要 AI 帮我写代码,因为我不写代码。但我需要 AI 帮我做那些重复的、耗时间的、但又不得不做的事情。」

这话听着很朴素,但细想一下,这不就是降本增效的本质吗?

说这么多,我想说什么

回到开头那个下午。

我们一群人,花了一整个下午折腾各种 AI 工具,最后得出的结论是:

工具已经有了,接下来拼的是谁用得更溜。

就像当年电脑普及的时候,会打字和不会打字的人,是两个世界。现在 AI 工具普及的时候,会用和不会用,又是两个世界。

但这个「会不会」,不是说你会不会调 API、会不会写代码,而是你会不会「提问」。

会不会把自己的需求清晰化。

会不会把自己的经验结构化。

会不会把自己的流程自动化。

这些东西,比学一门编程语言简单多了,但很多人就是迈不出那一步。

最后

这篇文章,我没有用任何 AI 参与写作。

但我用了 AI 做选题、做配图、做排版、做内容校验。

AI 不是我的替代品,是我的放大器。

这可能是现在这个时代,最正确的一种跟 AI 相处的方式。

好了,以上。

既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标。

谢谢你来看我的文章。

我们,下次再见。