$0.07 干掉 $1.30,AI 行业的黑色星期五来了
今天看到一组数据,给我看愣了。
有人拿同一段代码、同一个提示词、同样 17 个预先植入的 bug,分别让 MiniMax M3 和 Claude Opus 4.8 做代码审计。结果呢,M3 抓到 13 个,Opus 也抓到 13 个。打了个平手。
但价格就不一样了。
M3 花了 $0.07。Opus 花了 $1.30。
差了将近 20 倍。
你品品这个数字。$0.07,人民币大概五毛钱。五毛钱审了一个代码库,还审出了 13 个 bug。而另一边,一个以"最聪明"著称的模型,干了同样的活,收了你 9 块钱。
MiniMax 官方转发这个测试的时候说了一句话,「this is really interesting, absolutely worth a read」。坦率的讲,这已经不是有趣了,这是恐怖。
因为这不是一个孤立事件。今天 AI 圈发生的事情,几乎都在指向同一个方向。
从 vibe coding 到 spec coding
先说说开源这块。
GitHub 今天发布了 Spec Kit,一个开源工具包。这玩意解决了一个我一直觉得特别痛的问题,就是 AI 写代码的时候,你给它一个模糊的指令,它就直接开干了。干出来的结果,怎么说呢,能跑,但不是你想要的。
Spec Kit 的思路完全反过来了。它说,你别急着写代码,先把产品规范写清楚。功能是什么、边界在哪、技术方案怎么做、任务怎么拆,全部定义好了,再让 AI 根据规范去实现。
这个转变看起来很小,但我觉得它代表了 AI 编程的一个根本性转向。从「vibe coding」到「spec coding」,从「差不多就行」到「规范先行」。
而且 Spec Kit 已经支持 30 多个 agent 了,Copilot、Claude Code、Codex、Gemini、Cursor、Qwen 全在列。GitHub 上 109K 星。这说明什么?说明大家都有这个痛点,都在等一个解决方案。
顺便提一嘴,今天还有一篇论文获了 CVPR 2026 的时间检验奖。ResNet。对,就是 2015 年那个 ResNet。阶跃首席科学家张祥雨是共同第一作者。十一年前的论文,今天还在被认可,这就是真正的影响力。
好的研究不怕等。
OpenCV 终于长大了
OpenCV 5 今天正式发布了。
如果你做过计算机视觉,你一定被 OpenCV 4.x 的 DNN 模块折磨过。ONNX 算子覆盖率不到 23%,跑个 Transformer 直接报错,很多模型根本加载不进去。
OpenCV 5 把这个问题彻底解决了。全新的基于图的 DNN 引擎,ONNX 算子覆盖率从不到 23% 拉到 80% 以上。原生支持 Transformer、视觉语言模型、大语言模型。还加了 FP16/BF16、更好的 Python 集成、现代化文档。
GitHub 86K 星,每天安装量超过一百万次。这是基础设施级别的东西。
你看,今天发布的这几个东西,Spec Kit、OpenCV 5,加上 Hugging Face 上的 Persona Atlas 和 Job Searcher,全部是开源的。不是 demo,不是论文,是可以直接拿来用的工具。
开源这件事吧,有时候慢,有时候笨,但它一直在积累。积到一定程度,量变就成质变了。
美国的另一条路
说完开源,聊聊政策。
美国众议院的议员们今天发了一个法案草案,核心内容就一句话,禁止各州自己制定 AI 法规,把监管权全部收到联邦层面。
你想想这意味着什么。欧盟搞了一套 AI Act,层层分级,严格得要命。美国这边呢,联邦层面的 AI 法案一直难产,各州倒是各自为政。现在联邦直接说,各州你们别搞了,我来。
这个思路跟欧盟完全相反。欧盟是「我先管起来」,美国是「我先放开」。到底谁对谁错,说实话我也不确定。但有一点我觉得挺清楚的,AI 这个东西,管太早可能会扼杀创新,管太晚又可能出大问题。
这是一场全球性的赌局。
说到赌局,谷歌今天干了一件更疯的事。他们跟 SpaceX 达成协议,每个月支付 9.2 亿美元,获取 xAI 数据中心的算力。
9.2 亿美元。每个月。换算成人民币,大概 66 亿。一个月。
你品品这个数字,再品品前面 M3 的 $0.07。一边是成本在急速下降,一边是投入在疯狂飙升。这两件事同时发生,才是今天 AI 行业最诡异的地方。
小模型的逆袭
Hugging Face 上今天出了两个很有意思的项目,都跟小模型有关。
一个叫 Thousand Token Wood v2,用四个不同实验室的小模型搭了一个金融模拟游戏。gpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B,还有一个微调过的 Qwen 0.5B。0.5B 啊,连手机都能跑的那种。
结果呢?微调后的 0.5B 模型,自成交率 0%,有效报价率 100%。
这个结论挺颠覆的。我们总觉得模型越大越聪明,但这个实验告诉我们,小模型不是不行,是你得给它足够的结构和约束。格式化输入、提示词工程、LoRA 微调,三板斧下去,0.5B 也能干正经事。
另一个项目叫 Job Searcher,也是 Hugging Face 出的。用户上传简历,系统用 DeepSeek V4 Pro 生成搜索词,然后用 LoRA 微调过的 Qwen3-8B 对每个职位从五个维度打分。训练在单张 A100 上完成,部署用的 llama.cpp,完全开源。
单张 A100。开源。可复现。这就是今天 AI 开源社区的状态。不是在发论文,是在造工具。
当 AI 走进电影节
最后聊一个轻松点的。
MiniMax 的海螺 AI 跟上海国际电影节搞了个联名。第 28 届上影节,海螺 AI 是独家 AI 影像战略合作伙伴。6 月 14 到 15 号办开放日,设了专属展位,展出四对「影视从业者 + AI 创作者」的合作作品。
这个事情有意思在哪呢?它不是 AI 公司自己在那自嗨,而是真的跟传统影视行业的人坐下来一起创作。1+1 的组合,一边是懂镜头语言、叙事节奏的影视老兵,一边是懂 AI 工具、生成流程的新玩家。
还有创作体验区,观众可以直接上手试试 AI 创作。
怎么说呢,我一直觉得 AI 真正落地不是在实验室里,而是在这些具体的场景里。电影节、设计周、音乐节,当 AI 工具出现在这些地方的时候,它才真正开始变成「所有人的工具」,而不只是程序员的玩具。
黑色星期五
Gary Marcus 今天写了一篇文章,标题就叫「AI 的黑色星期五」。我还没来得及细看全文,但光这个标题就挺值得琢磨的。
黑色星期五在西方是疯狂打折的日子。所有人冲进商店,用最低的价格买到东西。
AI 行业现在不就是这样吗?
$0.07 的模型能干 $1.30 的活。0.5B 的小模型在金融场景里跑出了 100% 有效报价。开源工具一个接一个往外蹦,功能直追甚至超越商业产品。门槛在急速下降,成本在急速下降,但能力在急速上升。
对那些靠「模型够聪明所以卖得贵」吃饭的公司来说,这确实是个黑色星期五。
但对所有人来说,这可能是最好的时代。
五毛钱审一个代码库。单张 A100 训一个求职 AI。86K 星的计算机视觉库原生支持大模型。109K 星的工具包让 AI 先写规范再写代码。ResNet 十一年后拿了时间检验奖。电影节开始跟 AI 创作者合作。
这些事情放在一起看,你就会发现一个特别清晰的趋势,AI 正在从「少数公司的特权」变成「所有人的基础设施」。
大时代啊,朋友们。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以点点关注哦~ 小子会每日定时更新 AI 热点
谢谢你看我的文章,我们,下次再见。
夜雨聆风