


30秒速览

开源加速,模型竞赛白热化,AI工具全面渗透
MiniMax 开源了 M2.7 模型,最有意思的是它能「自己研究怎么训练自己」,AI进化速度可能会越来越快。
OpenAI 的 GPT 5.4 Pro 跑分出来了,跟 Anthropic 的 Mythos 不相上下,那么Spud(下一代GPT模型)和Mythos(下一代Claude模型)到底谁会更强呢?
Anthropic 的企业客户增长曲线涨得吓人,大概率一个月内就会在企业采用率上超过 OpenAI。
昨日 Top 3 事件
① M2.7 开源

MiniMax 开源了他们最新的AI模型 M2.7。
模型本身跑分不错,但这不是最大的看点。
什么意思呢?
有意思的是他们提到的「模型的自我进化」。
简单说就是:他们造了一个AI助手,专门帮研究团队做实验。这个助手能自己查资料、跑测试、分析结果,然后提出改进方案。
说白了,就是让AI自己研究怎么训练自己。目前这个AI助手能处理30%-50%的研发工作。
为什么这个事情比较重要呢?
因为一旦AI能自己优化自己,模型迭代速度会指数级加快。
不光是MiniMax在做,大概率所有顶尖AI实验室都在内部,搞类似的事。
用AI训练AI,左脚踩右脚,螺旋升天。
② AI改变法律业

Box公司CEO Aaron Levie 提了一个反直觉的判断:
AI时代,律师会更多,不是更少。
逻辑其实很简单:
AI让更多普通人能提法律问题了,但验证和执行还是得靠真人律师。同时AI本身又制造了一堆新的法律问题,比如版权、隐私、监管合规。
他还给了一个数据:
美国律师数量从1975年的40万涨到2025年的137.5万。
PC和互联网都没减少律师,反而让需求暴增。
大概率很多行业都会出现类似规律:AI降低了入门门槛,但提高了专业需求。
需要负责「判断」和「承担决策责任」的人类专家,市场需求会越来越大。
③ GPT 5.4 Pro

最近大家都在聊 Anthropic 的 Mythos 模型有多强。但有人发现了一个被忽略的细节:
OpenAI 的 GPT 5.4 Pro 在重叠的测试项目上,跟 Mythos 基本打平。
具体来说:
GPQA(一个很难的学术问答测试)94.4 vs 94.5,几乎没有差距。
BrowseComp(网页浏览能力测试)GPT 5.4 Pro 甚至比Mythos还强,89.3 vs 86.9。
说白了,OpenAI 并没有掉队。现在海外大模型御三家的格局是 Anthropic、OpenAI、Google 在不同方向上轮流领先,谁也没有拉开绝对差距。
昨日精选 10 条推文
① AI时代的写作

沃顿商学院教授 Ethan Mollick 说了句很到位的话:
过去写作教育教的是逻辑和论证,但AI会逼我们重新重视「风格」和「审美」。
为什么呢?
因为现在互联网上的文字读起来都像AI写的,千篇一律。
当内容可以被批量生产,独特的表达方式反而成了稀缺品。
② Meta AI 排名继续上升

Meta AI 在苹果 App Store 冲到了第二名,成了下载量最高的AI应用。
感觉这个路子,跟豆包很像。
虽然模型一般般,但是人家手里,有一大堆日活用户很高的App,硬是靠着用户基数,把自己的AI应用热度推上去了。
字节有抖音、红果、飞书,Meta有Facebook、Telegram和Instagram。
③ Stanford AI课

Stanford 的一堂2小时AI系统构建课,「比你刷过的所有 Claude 教程都实用10倍」。
因为讲的不是提示词技巧,是怎么从零搭一个靠谱的AI系统。
系统思维永远比简单的提示词技巧值钱,真正的Harness教学。
我把它的原文都给扒下来翻译成中文了,并且做了详细的课程笔记和Nano Banana的画图解释。
后台回复【斯坦福】即可获取。
④ 工具与记忆

硅谷顶级孵化器 YC 的掌门人 Garry Tan 说了一段很有意思的话:
「如果你的工具崩溃时记忆也跟着消失,说明你把工具做得太重了。」
他的理念是:
记忆应该存成简单的md文本文件,工具只是读取它们的导体,不应该「拥有」它们。
而且你作为人类,大脑里应该存储着,关于这些记忆和工具的信息,不应该完全交给AI。
⑤ GBrain 发布

Garry Tan自己做的AI助手框架 GBrain 0.9.0 更新了。
有意思的地方在于:
他把自己的配置开放出来了,其他用户可以直接继承,再根据自己需求调整。
说白了就是把自己的个性化设置,共享到互联网上了,包括前两天,生化危机的女主演员,也开源了自己的记忆系统到Github上。
名人开源自己的AI工具,大概率会成为一种新的,扩大自己影响力的流行方式。
⑥ Anthropic 增长

知名科技博主 Chubby 分享了一张 Anthropic 的企业采用率增长图,那条曲线陡得超出所有人预期。
根据 Ramp 的数据(一家帮企业管钱的公司),Anthropic 大概率会在一个月内,在企业采用率上超过 OpenAI,成为企业用得最多的AI产品。
⑦ 算力补贴

国内做AI开发的朋友可以关注一下:
真格基金和十字路口的算力补贴,填个表、聊一次就搞定,五万块算力很快到账。协议也就几百字,没啥奇怪条款。
WaytoAGI 和观猹也有类似计划。对独立开发者,尤其是AI领域的OPC开发者来说,是实打实的支持。
⑧ OSAP 跨应用
开发者 Maaz 做了个工具叫 OSAP,解决一个很多人头疼的问题:
在 Slack、GitHub、Notion 之间来回切换。
它用AI做推理,帮你跨应用处理多步任务,还能记住你的工作习惯。
AI Agent 正在从「单个应用内」走向「跨应用协作」。
去年豆包手机出来的时候,各家都在封杀,高筑墙、缓称王,生怕给字节做了嫁衣。
但是到了今年,各家都在开放自己的API接口,把自己变成CLI,主动拆掉自己的城墙,生怕被AI时代甩在身后。
😅还是挺讽刺的
⑨ AI自动求职

有人用 Claude Code 搭了一套自动求职系统:AI帮你找职位、写简历、投递,全程自动化。
说白了就是把找工作这件事也交给AI了。
但是你别说,这个思路真的牛逼🐮
想要找AI相关的工作?
你先展示一下,自己使用AI的能力。
怎么展示呢?
直接用AI来帮你找工作。
闭环了卧槽😭
⑩ Claude Code争议

Chubby 转发了一个关于 Claude Code 输出质量下降 的讨论,还附了一份AMD的分析报告。
Claude官方回应,说我们的模型从来不会降智,只是你的设置不对,没有提高它的推理额度。
我直接一个托马斯螺旋巴掌,那不是你自己把ClaudeCode里的默认设置改了吗?
普通用户,谁知道你改了推理参数?谁知道要把推理参数改回来?
我愿称之为AI界的绿茶🍵
但是说实话,最近因为算力不足,各家大模型都开始降智了。。无论是Claude、GPT、Gemini,还是国产模型。
干活老是干不明白😅
我的观点
说实话,2026年,底层模型已经不是AI领域关注的唯一重心了。
尽管大家依旧关心,谁谁新出的大模型,又变得更牛逼了。
但越来越多人开始关心,到底AI能在我的生活和工作里,有啥用?
Aaron Levie 说AI时代,大家对律师的需求反而会变得更多。
Ethan Mollick 说写作不重要了,找到自己的风格变得更重要。
Garry Tan 说,不要把工具和记忆搞得太复杂,至少你的人脑应该能够记住,你做了哪些Agent设计。
还有人用Claude Code帮自己找工作。
你会发现,大家讨论的已经不是「AI能做什么」了,是「AI进化之后,这个行业会变成什么样」。
对普通人来说,现在最该做的事就是找一个你熟悉的场景,把AI用起来。
不要做等等党,一直观望,一直等「完美的工具」出现,因为工具每周都在进化。
用起来的人和观望的人之间的差距,不开玩笑,真是越来越大了……
文/曲率
图/曲率
排版/曲率
审校/曲率
曲率出逃
Curvature
Escape
夜雨聆风