Coding 将跟用 Word 一样简单和日常-夜雨聆风

Coding 将跟用 Word 一样简单和日常

最近拿到了 TRAE SOLO 的内测邀请，玩了几天，有点上头。虽说是邀请内测的，但体验下来确实有些兴奋，想跟大家分享一下。

先聊聊 TRAE SOLO 跟以前用过的 AI 编程工具有什么不一样。

我虽然大学是计算机专业，但毕业后做产品，写代码一直是「能跑就行」的水平。这两年 Cursor 之类的工具越来越火，我也一直在用，确实能做出一些小东西。

但每次打开 IDE，看到文件树、终端窗口、代码面板，心理上还是有点紧绷的。每次在终端、文件夹和代码页面来回横跳，也有点心慌。

TRAE SOLO 的上手感受就完全不同。打开之后，核心界面就是一个对话框，跟 Chatbot 一样，干净清爽。全部靠对话来工作，创建文件、写代码、跑脚本、输出结果，整个流程都在对话里完成。

过去的 IDE 主体是代码和文件，AI 在旁边辅助。SOLO 把这个关系翻过来了，对话是主体，代码在后面跑着，不用盯着看。这次真的有点像一个 chatbot 长出了手脚。

它覆盖了 PC 端和 Web 端，在电脑上开始的项目，异地用浏览器也能接着看进度，不用很麻烦的远程连接。

还分了两个模式。一个叫 Work（也叫 MTC，more than coding），处理文档、数据分析、文件管理这类事情；一个叫 Code，就是以代码为主正经写程序。两个模式解决不同的问题。

值得单独说的是 Skills。

可以理解成「可插拔的技能包」。一个 Skill 就是一套干某件事的工作流，装上之后，Agent 该用的时候会自己用，不用每次都从头教它，有点像给 AI 预装了行业经验。

具体能干嘛呢？

先说文件处理。图片、视频、音频、Word、PDF、PPT、压缩包，这些格式它都能读。不只是读，还能做事情，比如把一个乱七八糟的「下载」文件夹丢给它，让它按图片、视频、文档、压缩包分类整理到子文件夹里，顺便把超过 100M 的大文件列个清单出来，它就真的给你整完了。批量重命名、按内容归档，也都能做。

再说内容生成。根据文稿生成 PPT、根据数据生成图表、根据需求写文档，这些后面案例里会细聊。还有 SEO 报告生成、头脑风暴、计划编写这类偏运营和产品的场景，也有对应的 Skill 覆盖。

数据分析也是一块。丢几份 Excel 或 CSV 进去，让它清洗、合并、统一格式、跑公式、画图表，一句话就行。跑不动的大数据量，它会自己写 Python 脚本去处理。

还有一个 Browser Use 的 Skill，可以让 Agent 直接操作浏览器，做信息采集和网页交互。

这些 Skill 都在 Skills Marketplace 里，逻辑类似 VS Code 的插件市场，装上生效。

拿到手短短半天，我就做了三次尝试。

第一个案例，半拿铁周刊选题器。

我和潇磊做播客「半拿铁·周刊」，选题一直是个体力活。日常要刷大量新闻源，看权威媒体每天发了什么，哪些话题有热度，哪些适合拿来做播客，全靠人肉判断。这个流程重复了很久，一直想自动化，但写爬虫又不知道从何下手。

这次我跟 SOLO 说的大意是：帮我设计一个脚本，从这些权威媒体抓取最近 7 天的新闻，聚合筛选，然后调用大模型来判断和评分，输出推荐的 10 个选题和备选的 20 个选题。

它不光很快就设计完了，还贴心地解释了，为了节省 token 消耗，专门撰写了更合理的 prompt。

当然，不能直接把原始数据列出来，需要做一步整理和判断，所以我接入了 Minimax 的环境变量，它也能很迅速一步帮忙处理好。

第一版很快就跑出来了，框架没问题，但很多来源的文章全部获取失败。要是我自己弄，可能就卡在这里，得去网上搜别人的经验，折腾很久。

但在 SOLO 里，我在对话框里说一句「这几个源全部失败了，重新调整获取策略」，它就自己去搜索，自己想办法改方案。

接下来我又调了好几轮，包括：

– 增加喷嚏图卦作为补充来源；

– 初步聚合的工作用 MiniMax 完成，后续评分和整理交给 OpenRouter 上的模型；

– 输出结果生成 Markdown 文件；

– 给文件名加上时间戳，旧的不会被新的覆盖。

最后跑出来的 Markdown 效果非常好。选题分成了推荐和备选两个板块，每条有标题、来源、摘要、推荐理由和评分，排列整齐，看着舒服。

这脚本跑一次几分钟，按 token 算花几块钱，就能解决我之前可能要 1-2 个小时，多则半天的搜索整理的工作量。

这也可以慢慢迭代成日常看的简讯，搭配声音生成的 skill 又能做成专属自己的早间新闻播客了。对话几次即可，难度真的不大。

第二个案例，整理文件。

这就是我第一次意识到，低成本的 coding 不光解决开发产品的问题，也能解决日常使用电脑的大大小小的问题。

说实话，用 AI 生成 PPT 我试过不少工具了。

Manus 用过，NotebookLM 也用过。第一眼看确实精彩，会觉得好像比自己做的还好看。但真用，小细节问题非常多，字号不统一、排版错位、配色跟品牌风格对不上、图文位置诡异。都是小毛病，加在一起就很麻烦，改起来极其痛苦，要么就自己继续改，改的工夫不如从头做。要么就是再抽盲盒，但生成逻辑不清楚，改了 A 可能 B 又乱了。

所以我一直是手搓。理想方案是做好一个 PPT 模板，定好字体、颜色、版式，然后让 AI 理解文稿内容后，往模板里填总结出来的内容。逻辑很简单，但之前的工具都做不好。

而 TRAE SOLO 的脚本就能做到。

我跟它说：帮我把文件夹里这个 PDF 理解一下，根据内容撰写脚本。参考的内容是我在半拿铁刚讲过的浏览器的历史。

第一个版本出来的效果可能不太理想，但别着急。TRAE SOLO 不是一个一键 PPT 的工具，而是一个灵活调整的 AI chat+coding 的产品。

所以我可以跟它说我的习惯：把内容的结构都改成，左边是大标题、小标题、大标题、小标题，而右边都是图片。

转眼就搞定。

然后我觉得视觉风格不是我想要的，于是我把我收藏的一个红底的喂给它，让它帮我调整。就变成了这样。

这是做 PPT 的灵活所在。如果用别的 PPT 工具，很难用语言让它完全帮我修改，更重要的是：这次的修改，从格式到视觉风格，我可以存成一个模板（skill），下次再喂给它稿子，它可以直接产出。

第三个案例，shownotes 概念解释器。

我在播客里经常需要在 shownotes 里放一些重要概念的解释。比如这期聊到了什么人物、什么公司、什么术语，给不熟悉的听众做个背景铺垫。这种工作以前都是人工完成的，一条条查、一条条写，不难，但费时间。

我跟 SOLO 说：帮我做一个工具，输入一篇 Word 文档的播客文字稿，做语义分析，把里面出现比较多的人名、公司名、品牌名和重要概念提取出来，做名词解释。用在我的播客 shownotes 里面。需要调用大模型的话，用环境变量里配好的模型。

它就很快给做出来了。

提取的准确度不错，名词解释写得也克制，不会写成百科全书那种冗长的样子，基本上拿来就能用。

另外的一个类似的场景是，我把半拿铁里中国互联网故事的稿件都丢给他，让他帮我整理一个导读文章，也是几分钟就写好脚本，搞定了。

在相当程度上，文本相关的整理工作，现在已经不需要人工完成。这也是官方推荐的使用方式之一。日报汇总成周报，日记汇总成长期的感悟，等等。

还有个有意思的地方。它自动复用了我在第一个选题器项目里配好的模型调用模块（需要大模型做文本分析总结）。我没提，是它自己找到了能复用的轮子，就直接拿来用。

而用得越多，积累的轮子越多，后面的活儿就会越顺手。

三个案例之外，一个很重要的感受。

这两年 AI 编程工具太多了，很多都主打「一键搞定」。演示的时候非常惊艳，但真的作为生产力的时候，就会发现问题：改不动。

我把它叫做收口难题。所谓「编筐编篓，重在收口」，编个筐编个篓子，主体编起来不难，收口的时候才发现费劲。就跟下载软件的进度条一样，看着 80% 了，殊不知工作量才刚刚开始。

刚才提到文本工作，肯定有朋友会疑惑：日报都扔给现在的 Chatbot，不是也能生成周报吗？没错。核心的差异在于，它做出来的是脚本，不是一次性的、下次还要重新思考的任务，而是写死的、准确的工作流。

工作流就意味着可控、不是黑盒。

在过去的脚本，生成的代码看不懂，项目结构不熟悉，出了 bug 不知道在哪里。只能重新生成一遍，祈祷运气好。这跟生图生视频一样，是抽卡抽盲盒。

而 SOLO 不一样的地方在于，它能支持不断改、不断调。而且是可以自然语言沟通，对话里说哪里不对，它就改哪里，改完能看到变化，不满意就继续说。你需要关注的就是哪里跟想象的不一样，反复跟它磨合。整个过程是可控的，走了几步、当前什么状态，都清楚。

可控就意味着确定性。确定性才是真的生产力。

脚本的形式，大大节省了 token 和时间成本，也让确定性更强。这很好理解：你每次让龙虾给你从头学习研究今天的美股盘前简讯，和用一个工作流去运转跑一次简讯，后者第一次也许不那么亮眼，但经过迭代，一定会比前者更稳定、更可控，尤其是，更省钱。

这是未来融入大家的工作生活的一个趋势，就像 PPT 模版或者 Excel 模板一样，你都有自己专属的，每次复用。

再加上足够丰富的 skills ，让对话就更有意义，它真的有能力去尝试调整和解决，不是告诉你让你去哪里改个什么东西，文件和资源对它相对透明。给它权限，也才真的是生产力。

生产力之外还有用户体验的价值。像它支持多个任务同时跑，不用排队等。比如我可以一边让它改选题器的 bug，一边让它跑 shownotes 的分析，互不耽误。路上想到什么可以 remote 直接发过去，随想随改，就是数字员工。

Vibe coding 很多人的理解可能还停留在「程序员有了新的工具用自然语言写代码」。现实情况是，随着门槛进一步降低，就跟谁都能顺手编辑个视频一样（犹记得 10 年前用绘声绘影做视频的痛苦），不会写代码的人，现在也能把自己的需求做成真正能跑的工具，而且可以乐在其中。

各位，如果对比刚才，跟我之前每次用 coding 和 AI agent 工具的举例，就能明显发现区别。过去还有拿来当玩具展示的感受，目前已经都在做日常能辅助工作的工具了。这个趋势相当明显。我身边不会写代码的朋友，在 vibe coding 的也越来越多，做完炫技的少了，用得自己上瘾的多了。

以前想做一个小工具，要么找程序员帮忙，要么自己学编程。现在只需要把需求想清楚，跟 AI 一轮一轮打磨就行，不需要懂什么参数配置，用哪种语言和插件，还是全靠一轮一轮的对话。

未来做 coding ，就跟我们在 Excel 里输入公式、在 Word 里搜索替换一样简单，一样融入日常。而这些操作在电脑刚普及的时候，对多数人还是神技一般。

TRAE SOLO 目前还在内测阶段，产品本身也在快速迭代，也有一些瑕疵和小问题，但从已经能做到的事情来看，方向是没错的。

可以预见的是，这类工具会越来越多，也会越来越卷。底层模型的能力大家都在拉齐，接下来比的就是谁的场景吃得更透、谁的交互体验更舒服、谁能让非技术背景的人真正用起来。这跟当年移动互联网的逻辑也差不多，基础设施和流量（token）铺完之后，拼的就是产品了。目前在国内，暂时还没有强有力的对手。

就说到这，希望能帮到你。