AI工具人的普通一天:踩坑与白嫖
早上打开电脑,看到Hermes Agent更新到了0.1版本,寻思着赶紧跟上。配置飞书和微信通道,扫码、设置,一路顺畅——结果死活连不上。
排查了半天才发现,漏了一步:扫码之后,你得先给飞书或微信发一条消息,它会回你一串配对码,然后你再到Hermes Agent里把这串码输进去,才能通。
就这一步,文档里写得跟藏在彩蛋里似的。
本地和云端分别配了一遍,折腾完一上午就这么过去了。不过好歹通了,后面所有的交互都走飞书消息,倒也算是一种补偿——至少不用再切来切去。
免费API的代价:智谱限速,英伟达排队
下午用着用着,智谱的模型突然不给力了。到某个时间点,模型直接调不通。我估计是限制了并发,或者说在这个时段干脆不给免费用了。
没办法,切到英伟达的免费API。免费倒是免费,但首Token出来那个慢啊,等得我差点以为挂了。说白了,免费的午餐你得排队吃。
更让人焦虑的是Claude Code上那套工作流。精彩片段提取的agent,出结果的速度太慢了,渲染也要等,整个流程的效率还是堪忧。效果倒是有,但这个速度,想把它跑成日常流水线,还差得远。
小米MiMo 2.5:白嫖到的三件套
晚上的事倒是让人兴奋。
小米昨天新出了MiMo 2.5的TTS,里面三个模型:一个是声音设计模型,你可以通过文本描述想要的音色,它直接给你生成出来;一个是TTS模型,还能切到音乐模式,生成唱歌那种;还有一个是声音克隆模型。
三个我都试了。克隆的话,我拿之前录过的几段短文字喂进去,生成的效果还可以。说实话,挺不错的。今天的播客我就准备用这个声音了。
关键是——现在还限免。小米的2.0版本从上个月出来后一直免费到现在,2.5继续限免。当然,等它收费了,我可能就不用了,再找别的吧。
但在它免费的这段时间里,确实是捡到便宜了。
国产AI格局:一天之内的震动
今天还有个大新闻,DeepSeek出了新版本。
没有之前R1那么惊艳,国际上的反响没那么炸裂。但对国内来说,这是一次震动。智谱和MiniMax,股票都跌了百分之十以上。真的很夸张。
智谱现在在国内的排名已经掉到后面了——阿里在前面,Kimi在前面,DeepSeek也在前面。智谱其实就写代码的模型强一点,其他的真的一般。
MiniMax多模态做得比智谱好,TTS模型、视频生成模型都比智谱强。但排名还是在智谱后面。
再看GPT那边,5.5出来了,性能又是世界第一。但价格比上一版贵了一倍。我算了一下自己的用量:5.3的时候,一个Plus套餐高强度用大概能撑两天;5.4就只剩一天半了;5.5估计也就一天。
这么算下来,GLM的套餐反而显得不那么贵了——七百块,模型能力也够强。但问题是什么?它额度给得多,可限速卡得死,你根本用不完。
额度多但用不完,这个尴尬真的很讽刺。
剪映的AI剪辑:工具门槛正在归零
今天还差点发生了一件事——差点,是因为我还没来得及细用,但光是看到就傻了。
剪映出了一个自动剪辑模式。你上传一个视频,它自动给你成片——音乐、字幕,全都配好。还有agent剪辑模式,你跟它对话,它帮你剪视频。
之前YouTube的Creator工具里也有类似的功能,但剪映这一下把它推到了普通人面前。
看到这个的时候,我脑子里就一个念头:
以后真的只能拼内容了。
你要去拼工具的熟练度?废了。你对剪辑软件的操作技巧?不值钱了。这些东西,AI正在快得离谱地把它抹平。
说白了,工具门槛正在归零。以后拼的是你对内容的理解,拼的是你脑子里有没有东西。
至于什么东西才算”好内容”——
这个问题,我还没想清楚。
夜雨聆风