歌手胡彦斌最近用 Vibe Coding 的方式自己开发了一个 App “彦火”,引发了不少讨论。
Vibe Coding(氛围编程)就是用自然语言让 AI 写代码。
这给人一种幻觉,氛围编程这事儿挺简单的。
其实没那么简单。但路径对了,也没那么难。
否则过程中会踩很多坑,上线了应用也容易被恶意攻击打成筛子。
所谓路径对了,就是选对模型和工具,并且具备必要的安全与架构意识。
这也是我通过 Vibe Coding 上线两款应用(儿童打字大师和围棋复盘大师)后总结下来的经验。这里面的坑,我大多也都踩过。
要更好地理解 Vibe Coding ,我们需要先回顾一下它的历史。
Vibe Coding 历史
2024 底,Cursor 爆火。它依托于迅速发展的大模型编程能力,8 岁的小朋友已经能够通过它用纯自然语言写一个相对简单的完整应用了。
随后几年大模型编程能力不断提升,工具也在不断进化。Vibe Coding 越来越火。更多的非程序员开始接触 Vibe Coding。
从这段历史我们就能看到 Vibe Coding 的两个关键信息:模型与工具。
模型和工具
那对普通人来说模型和工具哪个更重要?
这跟需求有关。
如果你做的是一个非常简单的项目:比如基于班上小朋友的信息做一个漂亮的网页看板。这种情况下就是模型最重要,你甚至不需要工具,打开大模型的聊天界面,让它帮你生成一个网页文件,你直接下载下来就行。不满意你再提出修改意见继续改。
这种情况我推荐的模型如下:
国外模型:Gemini: 写的程序界面非常漂亮,逻辑和指令遵循要差点。ChatGPT/Claude: 逻辑能力很强,但审美差点。
国内模型:GLM:首推这个模型,实际体验效果很好。逻辑能力强,而且会严格遵循指令,不会在猜测的情况做额外操作。写的界面美观程度一般,用它主打一个放心可靠。
其他模型:国内其他编程模型非常多,包括Qwen,Kimi,Xiaomi MiMo,MiniMax 等等,都处于互相追赶的阶段。但大部分都是评分很高,体验一般。比如可能会出现你让它排查问题,并且只回答问题在哪儿,它可能直接去一顿瞎改,改来改去把正常的功能都改出问题来了。容易直接上演一出《 Vibe Coding ,从入门到放弃》。
如果是复杂的项目,那就需要优先考虑工具了。
本地编程工具自带的 Harness 能够弥补模型的短板,而且可以有效地对项目代码情况(包括代码架构,技术选型等)进行持久化缓存,工具启动的时候会自动加载这些。
Harness:马鞍,更好地驾驭模型,让模型规范化地工作。
这时候,选一个好工具就非常重要了。
工具分两种,一种是带界面的应用,用这个编程跟在网页聊天窗里体验类似。另一种是 CLI 编程工具(首推 Claude Code),需要使用命令行,效果会更好,但门槛稍高,初学者不建议使用。
这里工具也按国外国内的分开来讲。
国外工具:
现在最火的编程客户端非 Codex 莫属。这也是我现在的主力编程工具。它是 OpenAI 公司推出的编程应用。购买 ChatGPT 的 Plus 或 Pro 会员就可以使用,它默认是与 ChatGPT 系列模型绑定的(也可以切换到其他自定义模型,但不建议)。 而且 GPT 5.5 是当前最好的编程模型之一,所以选这个组合准没错。

它唯一的缺点就是贵。如果订阅的是 20 美金的会员,高强度编程,可能 1 个多小时就能把 5 小时限额的模型额度用光。
其次是 Cursor。Cursor 作为带火 Vibe Coding 的现象级产品,它的产品实力还是挺强的。而且可以选择包括 Claude、ChatGPT、Gemini 在内的国内外的主流编程模型。Cursor 里也有自家的编程模型 Composer,用量充足,性价比比较高。而且 Cursor 对国内用户非常友好,支持支付宝付费。

至于 Google 家的 Antigravity,强烈建议新手避坑,它的放飞程度是一般新手无法驾驭的。
再说说国内的工具。
国内工具最资深的当属字节跳动(抖音母公司)推出的 Trae ,它分为国内版和国外版。建议直接用国内版,用国外版还不如直接用 Cursor。
国内版的 Trae 能够使用国内的主流编程模型,但它的编程效果,内存占用,编程速度方面都比 Cursor 要差一截。

其他的像腾讯旗下的 Code Buddy 不太推荐,它的内存占用相对 Trae 更高,编程速度更慢,而且长上下文容易丢失。
工具选好之后强烈建议安装一个叫 SuperPowers 的 Skill(技能,让大模型按一个相对明确的规范做某一方面的事)。这个 Skill 是一套能力的合集,它能够规范化编程流程,包括写文档、代码回归测试、提交前自检等等。
安装方式就是在输入框里写:帮我安装 SuperPowers 这个 Skill。 然后发送就可以了,工具会通过大模型自动帮你安装这个 Skill。
工具准备完毕就是意识层面了。
编程意识
“彦火”上线后,就有人指出它的安全措施几乎为 0。
发送短信接口没有限制,背后的短信服务很容易被刷爆。
用户上传文件图片以及发言内容都没做任何限制。如果用户大量恶意发布上传一些敏感内容,一方面会有监管方面的问题,另外应用也会直接被平台下架。
为什么说这是意识层面的事,做 Vibe Coding 不需要知道如何去实现应用的安全,但是需要明确地大模型说帮我检查一下这个应用有没有安全问题,然后帮我全部解决掉。
之前我通过 Vibe Coding 做围棋复盘大师的时候,内置了大模型的访问 Key 在应用中方便用户免费试用。后来仔细想想,再强的反编译技术也无法确保应用内部信息不被破解,然后我又花了很大力气把这个 Key 转移到服务器上,所有大模型调用都通过服务器接口控制,避免应用侧有任何敏感信息。
做应用架构和技术选型时也一样,我们也不需要知道哪一种架构和技术是最好的。我们可以直接通过工具让大模型写一个架构和技术选型文档,列出最合适的架构和技术,以及选择的原因。
这其实是在帮大模型梳理思路,大模型最容易犯的错就是会偷懒,它经常会走最短路径完成你的指示,不会主动去做更深层次的思考,去选择长期更优但当前更麻烦的实现方式。
比如当我们需要做跨平台应用时,我们需要清楚地告诉模型应用是否要上线 App Store,还是只打包一个安装包让用户下就可以了。这中间差别很大,上线 App Store 更方便分发,但它审查更严格,所有三方包都需要做签名处理。这个事儿如果事后来改就会非常麻烦。
这些东西只要意识到了也就约等于实现了,这就是 Vibe Coding 的好处。
更好的方式就是提前跟 AI 聊聊 Vibe Coding 需要注意事情,做的那个方向的应用可能会有哪些需要注意的问题。
人不需要知道如何去实现,但是在意识层面还是需要高于大模型,你需要比大模型更懂你自己的应用。遵循正确的路径,才能踩很多坑。
关于 Vibe Coding 的那些踩坑细节,也可以看看我之前的文章:Vibe Coding 更像的,可能不是编程,而是导演
夜雨聆风