乐于分享
好东西不私藏

当我把键盘放下,对着AI说了一天话来解决我的日常工作

当我把键盘放下,对着AI说了一天话来解决我的日常工作

大家好,我是安仔。

我是一个创业者,白天一整天都在处理公司的事,同时也是个独立开发者,业余时间也会写写文章做一下直播分享。

这意味着我只能靠中午休息和晚上下班后的碎片时间,去写文章、做直播分享、回答社群问题、维护一些代码项目。

时间本来就紧,所有这些事还全靠键盘一个字一个字敲。

最累的不是干活本身,而是“把脑子里的想法翻译成文字喂给 AI”这个过程——明明脑子里已经想好了,手指头就是跟不上。

直到我用上了 TRAE SOLO + Insta360 Mic Air 这套组合。

说句实话,我现在回不去了。

不是矫情,是真的回不去了。动嘴比动手快,而且快的不是一点半点。

语音输入为什么一直“不好使”

其实我很早就想用语音跟 AI 协作了。但之前的体验,怎么说呢,一言难尽。

你试过对着手机语音输入写文章吗?

出来一堆“然后那个就是嘛”,还得花时间删改,比直接打字还慢。

你试过在咖啡厅用语音吗?

背景音乐和隔壁大哥的电话全混进去了,AI 识别出来一堆乱码。

但这些都不是最核心的问题。最核心的问题是:

你脑子里想的是“帮我基于这篇论文写个技术解读”,但嘴里说出来的是“就是那个……你帮我看看那个论文……写个……就是那种解读的文章吧”。

AI 收到的是一坨口水话,执行结果自然偏到姥姥家去了。

所以我觉得问题从来就不是“语音不行”,而是我们中间缺了一层翻译官——能把你的口水话实时变成 AI 能精准执行的指令。

这俩东西是什么

先说 Insta360 Mic Air.

一句话解释它跟普通麦克风的区别:

普通麦克风只管“听到你说了什么”,Mic Air 结合 TRAE SOLO 多做了一步——它会自动帮你把废话删掉、把改口修正、把口语变成书面指令。

相当于你和 AI 之间多了个实时速记秘书。

硬件层面不多说,就记住三点:

  • 7.9克硬币大小,夹衣领上就忘了它存在;

  • 收音是录音棚级别的,你小声嘀咕它都能听清,旁边再吵也只收你的声音;

  • 续航10小时,够你从早说到晚。

再说 TRAE SOLO.

字节跳动做的 AI 工作助手。

能帮你写代码(Code 模式),也能帮你做写文章、搜资料、整理文件这些办公任务(MTC 模式,More Than Coding)。

你可以理解为一个随时待命的 AI 员工,而且是那种理解力很强、执行力也很强的员工。

而且最新版本已经支持手机端了。这意味着什么?

你在手机上下达的任务,可以无缝流转到云端或者你绑定的个人电脑上执行。

你人不在电脑前,AI 照样帮你干活。

这对我这种白天被创业的事占满、只能碎片时间处理一些非核心事情的人来说,简直是解放。

为什么这俩要搭配着用?道理很简单:

语音输入的质量直接决定 AI 干活的准确率。

麦克风收音不行或者不做口语清洗,后面 AI 再强也是在理解一坨废话。

Mic Air 负责把你的人话翻译成精准指令,SOLO 负责接到指令后执行到位。

一个管“听懂你”,一个管“帮你干”。

碎片时间里的真实用法

白天工作的事已经占满了整块时间,自媒体只能见缝插针。

所以对我来说,这套组合最大的价值就是:

让碎片时间的产出密度翻倍

说再多不如直接看我怎么用吧。

中午休息:写公众号

工作日午饭后我一般会有大概一个小时的空档,以前我会打开电脑赶一篇文章。

但从想选题、搜资料、组织大纲到一个字一个字敲出来,一小时根本写不完,经常拖到晚上继续。

现在的做法:吃完饭散步的时候,对着衣领上的 Mic Air 开始说——

已关注

关注

重播 分享

“帮我搜一下最近关于 GPT 5.5 的热点讨论,然后基于搜到的信息帮我列个文章大纲,风格轻松一点,面向技术爱好者,重点讲它的架构创新和实际性能提升。”

我实际说的时候中间夹了好几个“嗯”、“那个”、“就是”,还改了一次口(“不是技术细节……是架构创新”)。

但 TRAE SOLO 全部自动处理了——语气词删掉,改口只保留最终结论,输出给 SOLO 的是一条干净利落的指令。

SOLO 收到后直接开始搜索、整理、出大纲。我还没走回工位,框架已经有了。

然后继续口述要点和观点,让 SOLO 填充内容、生成配图,它居然能识别到我的具体工具需求,然后帮我调用我本地合适的 skills 进来实现需求:

已关注

关注

重播 分享

以前一篇文章要拆成两三个时间段才能写完,现在午休散个步第一版初稿就搞定了。

而且因为 SOLO 支持手机端,我甚至不需要回到工位。

中午在公司楼下散步的时候,掏出手机对着手机端说完需求,任务直接流转到我家里的电脑上跑着。

等我晚上回到家,打开电脑一看,初稿已经躺在那了。

这种“人在外面走,活在家里干”的感觉,真的让我从“必须坐在电脑前才能工作”的困境里彻底解放出来了。

晚上:改开源项目 + 处理社群

下班后是我集中处理自媒体和自己一些个人代码项目的时间。

以前这段时间要做的事太多:改代码、回社群问题、整理直播素材,全靠打字一件件来,经常忙到半夜。

现在我会先处理代码。对着 Mic Air 说——

已关注

关注

重播 分享

“把图片生成的接口加个批量处理的功能,参数支持传一个数组进来,每张图可以单独设置尺寸和风格,然后帮我写好之后提交到 GitHub,commit message 写清楚改了什么。”

我说的时候其实磕磕巴巴的,中间还停顿了几次想措辞。但 Mic Air 清洗完之后,SOLO 收到的就是一条结构清晰的需求,而且它甚至还会基于要引用的 skill 来翻译我们的需求为英文等,来更好地让大模型结合 skill 来理解。

然后它自动拆解:修改接口参数定义 → 写批量处理逻辑 → 跑测试 → 调用 GitHub CLI 提交。一句话触发多步操作,而且它能模糊匹配——我说“提交到 GitHub”,它自动知道要调用 Git 技能。

代码的事交给 SOLO 跑着,我同时处理社群。

直接新开一个任务,对着 TRAE SOLO 说“帮我基于这个问题写个200字的回复,语气友好专业一点”,或者“把今天收集的这些素材按主题分类整理一下,直播的时候要用”。…

以前晚上忙到12点的活,现在10点前基本能收工。省下来的时间,我可以看看书,或者想想明天工作那边的事。

Voice Working 到底改变了什么

体验了一段时间,让我兴奋的不是“快了多少”,而是一个更本质的变化:

Voice Working 降低的不是输入速度,而是表达门槛

以前跟 AI 协作,你得先在脑子里把需求组织成结构化的文字——想清楚怎么描述、用什么关键词、分几个步骤说。

这个“翻译”过程本身就消耗大量精力。

现在你只需要像跟同事吹水一样说出来,说错了改口也没关系,TRAE SOLO 帮你兜底。

对我这种白天有正职工作、晚上做自媒体和开发个人项目的人来说,这意味着我可以把更多精力放在“想清楚要做什么”上,而不是“怎么把想法准确传达给 AI”上。

碎片时间的产出密度,直接翻了一倍不止。

再加上 SOLO 的手机端跨设备能力,我现在的工作模式变成了:

白天开会间隙想到什么,掏出手机对着 TRAE SOLO 说一句,任务就派出去了;

下午开了几个会议,有些会议的纪要整理太麻烦,在开完会回工位这个间隙,掏出手机,直接都把相关资料丢给 TRAE SOLO,让它帮我总结好放在我公司电脑桌面,等我查阅,甚至是直接飞书发给同事;

晚上回家打开电脑,代码已经写好、文章初稿已经生成、素材已经整理完毕;

我不再需要“坐在电脑前”才能启动工作,任何时间任何地点,一张嘴就够了。

从命令行到 IDE,到 Copilot,到现在用嘴说。

每一步都在缩短“脑子里的想法”到“它变成现实”之间的距离。

–“配一张相关的优化后工作流的场景图”–

我觉得 Voice Working 会是接下来一两年最值得关注的人机交互变化之一。

写代码只是开始,写文档、做调研、整理文件、安排日程,所有跟 AI 协作的场景都会被语音重构一遍。

谁适合这套组合

三类人会特别有感:

一是经常跟 AI 协作但觉得打字表达需求太慢的人。

二是像我一样白天有主业、只能用碎片时间做副业的创业者或独立开发者。

三是喜欢边走边想、不想被钉在电脑前的人——SOLO 手机端,让你在地铁上、散步时、甚至开会间隙都能把任务派出去,回到电脑前直接验收成果。

说真的,用了一段时间之后,再回去纯键盘操作,会有一种“怎么这么笨重”的感觉。

就像用惯了触屏再回去按键手机一样。

你会习惯用嘴工作吗?来评论区聊聊。