乐于分享
好东西不私藏

Coding 将跟用 Word 一样简单和日常

Coding 将跟用 Word 一样简单和日常

最近拿到了 TRAE SOLO 的内测邀请,玩了几天,有点上头。虽说是邀请内测的,但体验下来确实有些兴奋,想跟大家分享一下。

1

先聊聊 TRAE SOLO 跟以前用过的 AI 编程工具有什么不一样。

我虽然大学是计算机专业,但毕业后做产品,写代码一直是「能跑就行」的水平。这两年 Cursor 之类的工具越来越火,我也一直在用,确实能做出一些小东西。

但每次打开 IDE,看到文件树、终端窗口、代码面板,心理上还是有点紧绷的。每次在终端、文件夹和代码页面来回横跳,也有点心慌。

TRAE SOLO 的上手感受就完全不同。打开之后,核心界面就是一个对话框,跟 Chatbot 一样,干净清爽。全部靠对话来工作,创建文件、写代码、跑脚本、输出结果,整个流程都在对话里完成。

过去的 IDE 主体是代码和文件,AI 在旁边辅助。SOLO 把这个关系翻过来了,对话是主体,代码在后面跑着,不用盯着看。这次真的有点像一个 chatbot 长出了手脚。

它覆盖了 PC 端和 Web 端,在电脑上开始的项目,异地用浏览器也能接着看进度,不用很麻烦的远程连接。

还分了两个模式。一个叫 Work(也叫 MTC,more than coding),处理文档、数据分析、文件管理这类事情;一个叫 Code,就是以代码为主正经写程序。两个模式解决不同的问题。

2

值得单独说的是 Skills。

可以理解成「可插拔的技能包」。一个 Skill 就是一套干某件事的工作流,装上之后,Agent 该用的时候会自己用,不用每次都从头教它,有点像给 AI 预装了行业经验。

具体能干嘛呢?

先说文件处理。图片、视频、音频、Word、PDF、PPT、压缩包,这些格式它都能读。不只是读,还能做事情,比如把一个乱七八糟的「下载」文件夹丢给它,让它按图片、视频、文档、压缩包分类整理到子文件夹里,顺便把超过 100M 的大文件列个清单出来,它就真的给你整完了。批量重命名、按内容归档,也都能做。

再说内容生成。根据文稿生成 PPT、根据数据生成图表、根据需求写文档,这些后面案例里会细聊。还有 SEO 报告生成、头脑风暴、计划编写这类偏运营和产品的场景,也有对应的 Skill 覆盖。

数据分析也是一块。丢几份 Excel 或 CSV 进去,让它清洗、合并、统一格式、跑公式、画图表,一句话就行。跑不动的大数据量,它会自己写 Python 脚本去处理。

还有一个 Browser Use 的 Skill,可以让 Agent 直接操作浏览器,做信息采集和网页交互。

这些 Skill 都在 Skills Marketplace 里,逻辑类似 VS Code 的插件市场,装上生效。

拿到手短短半天,我就做了三次尝试。

3

第一个案例,半拿铁周刊选题器。

我和潇磊做播客「半拿铁·周刊」,选题一直是个体力活。日常要刷大量新闻源,看权威媒体每天发了什么,哪些话题有热度,哪些适合拿来做播客,全靠人肉判断。这个流程重复了很久,一直想自动化,但写爬虫又不知道从何下手。

这次我跟 SOLO 说的大意是:帮我设计一个脚本,从这些权威媒体抓取最近 7 天的新闻,聚合筛选,然后调用大模型来判断和评分,输出推荐的 10 个选题和备选的 20 个选题。

它不光很快就设计完了,还贴心地解释了,为了节省 token 消耗,专门撰写了更合理的 prompt。

当然,不能直接把原始数据列出来,需要做一步整理和判断,所以我接入了 Minimax 的环境变量,它也能很迅速一步帮忙处理好。

第一版很快就跑出来了,框架没问题,但很多来源的文章全部获取失败。要是我自己弄,可能就卡在这里,得去网上搜别人的经验,折腾很久。

但在 SOLO 里,我在对话框里说一句「这几个源全部失败了,重新调整获取策略」,它就自己去搜索,自己想办法改方案。

接下来我又调了好几轮,包括:

– 增加喷嚏图卦作为补充来源;

– 初步聚合的工作用 MiniMax 完成,后续评分和整理交给 OpenRouter 上的模型;

– 输出结果生成 Markdown 文件;

– 给文件名加上时间戳,旧的不会被新的覆盖。

最后跑出来的 Markdown 效果非常好。选题分成了推荐和备选两个板块,每条有标题、来源、摘要、推荐理由和评分,排列整齐,看着舒服。

这脚本跑一次几分钟,按 token 算花几块钱,就能解决我之前可能要 1-2 个小时,多则半天的搜索整理的工作量。

这也可以慢慢迭代成日常看的简讯,搭配声音生成的 skill 又能做成专属自己的早间新闻播客了。对话几次即可,难度真的不大。

4

第二个案例,整理文件。

这就是我第一次意识到,低成本的 coding 不光解决开发产品的问题,也能解决日常使用电脑的大大小小的问题。

说实话,用 AI 生成 PPT 我试过不少工具了。

Manus 用过,NotebookLM 也用过。第一眼看确实精彩,会觉得好像比自己做的还好看。但真用,小细节问题非常多,字号不统一、排版错位、配色跟品牌风格对不上、图文位置诡异。都是小毛病,加在一起就很麻烦,改起来极其痛苦,要么就自己继续改,改的工夫不如从头做。要么就是再抽盲盒,但生成逻辑不清楚,改了 A 可能 B 又乱了。

所以我一直是手搓。理想方案是做好一个 PPT 模板,定好字体、颜色、版式,然后让 AI 理解文稿内容后,往模板里填总结出来的内容。逻辑很简单,但之前的工具都做不好。

 TRAE SOLO 的脚本就能做到。

我跟它说:帮我把文件夹里这个 PDF 理解一下,根据内容撰写脚本。参考的内容是我在半拿铁刚讲过的浏览器的历史。

第一个版本出来的效果可能不太理想,但别着急。TRAE SOLO 不是一个一键 PPT 的工具,而是一个灵活调整的 AI chat+coding 的产品。

所以我可以跟它说我的习惯:把内容的结构都改成,左边是大标题、小标题、大标题、小标题,而右边都是图片。

转眼就搞定。

然后我觉得视觉风格不是我想要的,于是我把我收藏的一个红底的喂给它,让它帮我调整。就变成了这样。

这是做 PPT 的灵活所在。如果用别的 PPT 工具,很难用语言让它完全帮我修改,更重要的是:这次的修改,从格式到视觉风格,我可以存成一个模板(skill),下次再喂给它稿子,它可以直接产出。

5

第三个案例,shownotes 概念解释器。

我在播客里经常需要在 shownotes 里放一些重要概念的解释。比如这期聊到了什么人物、什么公司、什么术语,给不熟悉的听众做个背景铺垫。这种工作以前都是人工完成的,一条条查、一条条写,不难,但费时间。

我跟 SOLO 说:帮我做一个工具,输入一篇 Word 文档的播客文字稿,做语义分析,把里面出现比较多的人名、公司名、品牌名和重要概念提取出来,做名词解释。用在我的播客 shownotes 里面。需要调用大模型的话,用环境变量里配好的模型。

它就很快给做出来了。

提取的准确度不错,名词解释写得也克制,不会写成百科全书那种冗长的样子,基本上拿来就能用。

另外的一个类似的场景是,我把半拿铁里中国互联网故事的稿件都丢给他,让他帮我整理一个导读文章,也是几分钟就写好脚本,搞定了。

在相当程度上,文本相关的整理工作,现在已经不需要人工完成。这也是官方推荐的使用方式之一。日报汇总成周报,日记汇总成长期的感悟,等等。

还有个有意思的地方。它自动复用了我在第一个选题器项目里配好的模型调用模块(需要大模型做文本分析总结)。我没提,是它自己找到了能复用的轮子,就直接拿来用。

而用得越多,积累的轮子越多,后面的活儿就会越顺手。

6

三个案例之外,一个很重要的感受。

这两年 AI 编程工具太多了,很多都主打「一键搞定」。演示的时候非常惊艳,但真的作为生产力的时候,就会发现问题:改不动。

我把它叫做 收口难题。所谓「编筐编篓,重在收口」,编个筐编个篓子,主体编起来不难,收口的时候才发现费劲。就跟下载软件的进度条一样,看着 80% 了,殊不知工作量才刚刚开始。

刚才提到文本工作,肯定有朋友会疑惑:日报都扔给现在的 Chatbot,不是也能生成周报吗?没错。核心的差异在于,它做出来的是脚本,不是一次性的、下次还要重新思考的任务,而是写死的、准确的工作流

工作流就意味着可控、不是黑盒。

在过去的脚本,生成的代码看不懂,项目结构不熟悉,出了 bug 不知道在哪里。只能重新生成一遍,祈祷运气好。这跟生图生视频一样,是抽卡抽盲盒。

而 SOLO 不一样的地方在于,它能支持不断改、不断调。而且是可以自然语言沟通,对话里说哪里不对,它就改哪里,改完能看到变化,不满意就继续说。你需要关注的就是哪里跟想象的不一样,反复跟它磨合。整个过程是可控的,走了几步、当前什么状态,都清楚。

可控就意味着确定性。确定性才是真的生产力。

脚本的形式,大大节省了 token 和时间成本,也让确定性更强。这很好理解:你每次让龙虾给你从头学习研究今天的美股盘前简讯,和用一个工作流去运转跑一次简讯,后者第一次也许不那么亮眼,但经过迭代,一定会比前者更稳定、更可控,尤其是,更省钱。

这是未来融入大家的工作生活的一个趋势,就像 PPT 模版或者 Excel 模板一样,你都有自己专属的,每次复用。

再加上足够丰富的 skills ,让对话就更有意义,它真的有能力去尝试调整和解决,不是告诉你让你去哪里改个什么东西,文件和资源对它相对透明。给它权限,也才真的是生产力。

7

生产力之外还有用户体验的价值。像它支持多个任务同时跑,不用排队等。比如我可以一边让它改选题器的 bug,一边让它跑 shownotes 的分析,互不耽误。路上想到什么可以 remote 直接发过去,随想随改,就是数字员工。

Vibe coding 很多人的理解可能还停留在「程序员有了新的工具用自然语言写代码」。现实情况是,随着门槛进一步降低,就跟谁都能顺手编辑个视频一样(犹记得 10 年前用绘声绘影做视频的痛苦),不会写代码的人,现在也能把自己的需求做成真正能跑的工具,而且可以乐在其中。

各位,如果对比刚才,跟我之前每次用 coding 和 AI agent 工具的举例,就能明显发现区别。过去还有拿来当玩具展示的感受,目前已经都在做日常能辅助工作的工具了。这个趋势相当明显。我身边不会写代码的朋友,在 vibe coding 的也越来越多,做完炫技的少了,用得自己上瘾的多了。

以前想做一个小工具,要么找程序员帮忙,要么自己学编程。现在只需要把需求想清楚,跟 AI 一轮一轮打磨就行,不需要懂什么参数配置,用哪种语言和插件,还是全靠一轮一轮的对话。

未来做 coding ,就跟我们在 Excel 里输入公式、在 Word 里搜索替换一样简单,一样融入日常。而这些操作在电脑刚普及的时候,对多数人还是神技一般。

TRAE SOLO 目前还在内测阶段,产品本身也在快速迭代,也有一些瑕疵和小问题,但从已经能做到的事情来看,方向是没错的。

可以预见的是,这类工具会越来越多,也会越来越卷。底层模型的能力大家都在拉齐,接下来比的就是谁的场景吃得更透、谁的交互体验更舒服、谁能让非技术背景的人真正用起来。这跟当年移动互联网的逻辑也差不多,基础设施和流量(token)铺完之后,拼的就是产品了。目前在国内,暂时还没有强有力的对手。

就说到这,希望能帮到你。