当我把键盘放下,对着AI说了一天话来解决我的日常工作-夜雨聆风

当我把键盘放下,对着AI说了一天话来解决我的日常工作

大家好，我是安仔。

我是一个创业者，白天一整天都在处理公司的事，同时也是个独立开发者，业余时间也会写写文章做一下直播分享。

这意味着我只能靠中午休息和晚上下班后的碎片时间，去写文章、做直播分享、回答社群问题、维护一些代码项目。

时间本来就紧，所有这些事还全靠键盘一个字一个字敲。

最累的不是干活本身，而是“把脑子里的想法翻译成文字喂给 AI”这个过程——明明脑子里已经想好了，手指头就是跟不上。

直到我用上了 TRAE SOLO + Insta360 Mic Air 这套组合。

说句实话，我现在回不去了。

不是矫情，是真的回不去了。动嘴比动手快，而且快的不是一点半点。

语音输入为什么一直“不好使”

其实我很早就想用语音跟 AI 协作了。但之前的体验，怎么说呢，一言难尽。

你试过对着手机语音输入写文章吗？

出来一堆“然后那个就是嘛”，还得花时间删改，比直接打字还慢。

你试过在咖啡厅用语音吗？

背景音乐和隔壁大哥的电话全混进去了，AI 识别出来一堆乱码。

但这些都不是最核心的问题。最核心的问题是：

你脑子里想的是“帮我基于这篇论文写个技术解读”，但嘴里说出来的是“就是那个……你帮我看看那个论文……写个……就是那种解读的文章吧”。

AI 收到的是一坨口水话，执行结果自然偏到姥姥家去了。

所以我觉得问题从来就不是“语音不行”，而是我们中间缺了一层翻译官——能把你的口水话实时变成 AI 能精准执行的指令。

这俩东西是什么

先说 Insta360 Mic Air.

一句话解释它跟普通麦克风的区别：

普通麦克风只管“听到你说了什么”，Mic Air 结合 TRAE SOLO 多做了一步——它会自动帮你把废话删掉、把改口修正、把口语变成书面指令。

相当于你和 AI 之间多了个实时速记秘书。

硬件层面不多说，就记住三点：

7.9克硬币大小，夹衣领上就忘了它存在；
收音是录音棚级别的，你小声嘀咕它都能听清，旁边再吵也只收你的声音；
续航10小时，够你从早说到晚。

再说 TRAE SOLO.

字节跳动做的 AI 工作助手。

能帮你写代码（Code 模式），也能帮你做写文章、搜资料、整理文件这些办公任务（MTC 模式，More Than Coding）。

你可以理解为一个随时待命的 AI 员工，而且是那种理解力很强、执行力也很强的员工。

而且最新版本已经支持手机端了。这意味着什么？

你在手机上下达的任务，可以无缝流转到云端或者你绑定的个人电脑上执行。

你人不在电脑前，AI 照样帮你干活。

这对我这种白天被创业的事占满、只能碎片时间处理一些非核心事情的人来说，简直是解放。

为什么这俩要搭配着用？道理很简单：

语音输入的质量直接决定 AI 干活的准确率。

麦克风收音不行或者不做口语清洗，后面 AI 再强也是在理解一坨废话。

Mic Air 负责把你的人话翻译成精准指令，SOLO 负责接到指令后执行到位。

一个管“听懂你”，一个管“帮你干”。

碎片时间里的真实用法

白天工作的事已经占满了整块时间，自媒体只能见缝插针。

所以对我来说，这套组合最大的价值就是：

让碎片时间的产出密度翻倍。

说再多不如直接看我怎么用吧。

中午休息：写公众号

工作日午饭后我一般会有大概一个小时的空档，以前我会打开电脑赶一篇文章。

但从想选题、搜资料、组织大纲到一个字一个字敲出来，一小时根本写不完，经常拖到晚上继续。

现在的做法：吃完饭散步的时候，对着衣领上的 Mic Air 开始说——

已关注

关注

重播分享赞

视频详情

“帮我搜一下最近关于 GPT 5.5 的热点讨论，然后基于搜到的信息帮我列个文章大纲，风格轻松一点，面向技术爱好者，重点讲它的架构创新和实际性能提升。”

我实际说的时候中间夹了好几个“嗯”、“那个”、“就是”，还改了一次口（“不是技术细节……是架构创新”）。

但 TRAE SOLO 全部自动处理了——语气词删掉，改口只保留最终结论，输出给 SOLO 的是一条干净利落的指令。

SOLO 收到后直接开始搜索、整理、出大纲。我还没走回工位，框架已经有了。

然后继续口述要点和观点，让 SOLO 填充内容、生成配图，它居然能识别到我的具体工具需求，然后帮我调用我本地合适的 skills 进来实现需求：

已关注

关注

重播分享赞

视频详情

以前一篇文章要拆成两三个时间段才能写完，现在午休散个步第一版初稿就搞定了。

而且因为 SOLO 支持手机端，我甚至不需要回到工位。

中午在公司楼下散步的时候，掏出手机对着手机端说完需求，任务直接流转到我家里的电脑上跑着。

等我晚上回到家，打开电脑一看，初稿已经躺在那了。

这种“人在外面走，活在家里干”的感觉，真的让我从“必须坐在电脑前才能工作”的困境里彻底解放出来了。

晚上：改开源项目 + 处理社群

下班后是我集中处理自媒体和自己一些个人代码项目的时间。

以前这段时间要做的事太多：改代码、回社群问题、整理直播素材，全靠打字一件件来，经常忙到半夜。

现在我会先处理代码。对着 Mic Air 说——

已关注

关注

重播分享赞

视频详情

“把图片生成的接口加个批量处理的功能，参数支持传一个数组进来，每张图可以单独设置尺寸和风格，然后帮我写好之后提交到 GitHub，commit message 写清楚改了什么。”

我说的时候其实磕磕巴巴的，中间还停顿了几次想措辞。但 Mic Air 清洗完之后，SOLO 收到的就是一条结构清晰的需求，而且它甚至还会基于要引用的 skill 来翻译我们的需求为英文等，来更好地让大模型结合 skill 来理解。

然后它自动拆解：修改接口参数定义 → 写批量处理逻辑 → 跑测试 → 调用 GitHub CLI 提交。一句话触发多步操作，而且它能模糊匹配——我说“提交到 GitHub”，它自动知道要调用 Git 技能。

代码的事交给 SOLO 跑着，我同时处理社群。

直接新开一个任务，对着 TRAE SOLO 说“帮我基于这个问题写个200字的回复，语气友好专业一点”，或者“把今天收集的这些素材按主题分类整理一下，直播的时候要用”。…

以前晚上忙到12点的活，现在10点前基本能收工。省下来的时间，我可以看看书，或者想想明天工作那边的事。

Voice Working 到底改变了什么

体验了一段时间，让我兴奋的不是“快了多少”，而是一个更本质的变化：

Voice Working 降低的不是输入速度，而是表达门槛。

以前跟 AI 协作，你得先在脑子里把需求组织成结构化的文字——想清楚怎么描述、用什么关键词、分几个步骤说。

这个“翻译”过程本身就消耗大量精力。

现在你只需要像跟同事吹水一样说出来，说错了改口也没关系，TRAE SOLO 帮你兜底。

对我这种白天有正职工作、晚上做自媒体和开发个人项目的人来说，这意味着我可以把更多精力放在“想清楚要做什么”上，而不是“怎么把想法准确传达给 AI”上。

碎片时间的产出密度，直接翻了一倍不止。

再加上 SOLO 的手机端跨设备能力，我现在的工作模式变成了：

白天开会间隙想到什么，掏出手机对着 TRAE SOLO 说一句，任务就派出去了；

下午开了几个会议，有些会议的纪要整理太麻烦，在开完会回工位这个间隙，掏出手机，直接都把相关资料丢给 TRAE SOLO，让它帮我总结好放在我公司电脑桌面，等我查阅，甚至是直接飞书发给同事；

晚上回家打开电脑，代码已经写好、文章初稿已经生成、素材已经整理完毕；

我不再需要“坐在电脑前”才能启动工作，任何时间任何地点，一张嘴就够了。

从命令行到 IDE，到 Copilot，到现在用嘴说。

每一步都在缩短“脑子里的想法”到“它变成现实”之间的距离。

–“配一张相关的优化后工作流的场景图”–

我觉得 Voice Working 会是接下来一两年最值得关注的人机交互变化之一。

写代码只是开始，写文档、做调研、整理文件、安排日程，所有跟 AI 协作的场景都会被语音重构一遍。

谁适合这套组合

三类人会特别有感：

一是经常跟 AI 协作但觉得打字表达需求太慢的人。

二是像我一样白天有主业、只能用碎片时间做副业的创业者或独立开发者。

三是喜欢边走边想、不想被钉在电脑前的人——SOLO 手机端，让你在地铁上、散步时、甚至开会间隙都能把任务派出去，回到电脑前直接验收成果。

说真的，用了一段时间之后，再回去纯键盘操作，会有一种“怎么这么笨重”的感觉。

就像用惯了触屏再回去按键手机一样。

你会习惯用嘴工作吗？来评论区聊聊。