AI工具人的普通一天:踩坑与白嫖-夜雨聆风

AI工具人的普通一天:踩坑与白嫖

早上打开电脑，看到Hermes Agent更新到了0.1版本，寻思着赶紧跟上。配置飞书和微信通道，扫码、设置，一路顺畅——结果死活连不上。

排查了半天才发现，漏了一步：扫码之后，你得先给飞书或微信发一条消息，它会回你一串配对码，然后你再到Hermes Agent里把这串码输进去，才能通。

就这一步，文档里写得跟藏在彩蛋里似的。

本地和云端分别配了一遍，折腾完一上午就这么过去了。不过好歹通了，后面所有的交互都走飞书消息，倒也算是一种补偿——至少不用再切来切去。

免费API的代价：智谱限速，英伟达排队

下午用着用着，智谱的模型突然不给力了。到某个时间点，模型直接调不通。我估计是限制了并发，或者说在这个时段干脆不给免费用了。

没办法，切到英伟达的免费API。免费倒是免费，但首Token出来那个慢啊，等得我差点以为挂了。说白了，免费的午餐你得排队吃。

更让人焦虑的是Claude Code上那套工作流。精彩片段提取的agent，出结果的速度太慢了，渲染也要等，整个流程的效率还是堪忧。效果倒是有，但这个速度，想把它跑成日常流水线，还差得远。

晚上的事倒是让人兴奋。

小米昨天新出了MiMo 2.5的TTS，里面三个模型：一个是声音设计模型，你可以通过文本描述想要的音色，它直接给你生成出来；一个是TTS模型，还能切到音乐模式，生成唱歌那种；还有一个是声音克隆模型。

三个我都试了。克隆的话，我拿之前录过的几段短文字喂进去，生成的效果还可以。说实话，挺不错的。今天的播客我就准备用这个声音了。

关键是——现在还限免。小米的2.0版本从上个月出来后一直免费到现在，2.5继续限免。当然，等它收费了，我可能就不用了，再找别的吧。

但在它免费的这段时间里，确实是捡到便宜了。

今天还有个大新闻，DeepSeek出了新版本。

没有之前R1那么惊艳，国际上的反响没那么炸裂。但对国内来说，这是一次震动。智谱和MiniMax，股票都跌了百分之十以上。真的很夸张。

智谱现在在国内的排名已经掉到后面了——阿里在前面，Kimi在前面，DeepSeek也在前面。智谱其实就写代码的模型强一点，其他的真的一般。

MiniMax多模态做得比智谱好，TTS模型、视频生成模型都比智谱强。但排名还是在智谱后面。

再看GPT那边，5.5出来了，性能又是世界第一。但价格比上一版贵了一倍。我算了一下自己的用量：5.3的时候，一个Plus套餐高强度用大概能撑两天；5.4就只剩一天半了；5.5估计也就一天。

这么算下来，GLM的套餐反而显得不那么贵了——七百块，模型能力也够强。但问题是什么？它额度给得多，可限速卡得死，你根本用不完。

额度多但用不完，这个尴尬真的很讽刺。

今天还差点发生了一件事——差点，是因为我还没来得及细用，但光是看到就傻了。

剪映出了一个自动剪辑模式。你上传一个视频，它自动给你成片——音乐、字幕，全都配好。还有agent剪辑模式，你跟它对话，它帮你剪视频。

之前YouTube的Creator工具里也有类似的功能，但剪映这一下把它推到了普通人面前。

看到这个的时候，我脑子里就一个念头：

以后真的只能拼内容了。

你要去拼工具的熟练度？废了。你对剪辑软件的操作技巧？不值钱了。这些东西，AI正在快得离谱地把它抹平。

说白了，工具门槛正在归零。以后拼的是你对内容的理解，拼的是你脑子里有没有东西。

至于什么东西才算”好内容”——

这个问题，我还没想清楚。