超过 2.2k+ Star 的小工具,把终端语音转文字这件事做得太顺手了-夜雨聆风

超过 2.2k+ Star 的小工具,把终端语音转文字这件事做得太顺手了

有多少次明明只想把一段语音快速记下来，结果却被各种庞大的应用、复杂的界面和联网依赖劝退。

尤其是程序员、写作者、研究人员，很多灵感都发生在命令行和编辑器旁边。

要是语音转文字这件事，能像敲一条命令那样自然，效率真的会高很多。

textream

textream 本质上是一个面向终端的实时语音转文字工具，可以把它理解成一把装在命令行里的听写小刀：启动后，它一边听你说话，一边把识别结果持续吐到终端、管道或者你自己的脚本里。

整个过程感觉非常轻，像 Unix 世界里那种做好一件事的小工具。

很多语音识别产品的问题，要码就是识别不准，而且总想把你困在自己的界面里。

但textream思路完全相反：我只负责把声音稳定地变成文本，剩下的流向哪里，交给你的终端生态。

这就意味着它天然适合和 tmux、shell 脚本、编辑器插件、剪贴板工具配合。

比如最直接的用法，就是启动后让它持续监听麦克风：

textream

如果把命令串起来的人，它的味道就更对了。识别出的文本可以继续被其他命令消费，你完全可以按自己的习惯拼接工作流：

textream | tee notes.txt

或者把结果直接交给别的程序处理，做成自动摘要、翻译、归档，甚至转成待办事项。

这种设计最迷人的地方在于，它不是一个封闭应用，而是一个可组合的能力模块。你不需要迁移到它的世界里，它反过来适配你的世界。

另一个很妙的点是它把实时感做出来了。很多人对语音识别的理解，还停留在录音上传、等待结果、再复制粘贴，这个过程其实很打断思路。

textream 的价值恰恰在于，它更接近你边说边写的节奏。你说一句，终端里就出来一句，像是在跟电脑直接对话。

对写草稿、做会议速记、记临时灵感来说，这种即时反馈非常重要，因为它会显著降低记录的心理门槛。

textream坚持轻量、可脚本化、可嵌入。这一点非常像很多经典命令行工具的哲学：简单，但不简陋；小巧，但很能打。

也正因为这个方向选得很准，它在 GitHub 上收获了相当高的关注度，已经积累了2.2k+的 Star 数。

现在很多 AI 或语音项目，一上来就想做平台、做入口、做全家桶，最后往往是功能很多，真正高频使用的却很少。

textream 反过来，它把目标压得很准：用最贴近终端用户习惯的方式，解决实时语音转文字这件事。

开源地址：https://github.com/f/textream

如果你也对这类前沿开源项目感兴趣，想第一时间看到真正有潜力的 GitHub 热门项目解析，关注本公众号。

后面我还会继续挖更多值得收藏、值得实操、值得思考的开源好东西。