> 2026.05.10 — 05.12 精选速览
01🔬 学术突破
菲尔兹奖得主亲测 ChatGPT 5.5 Pro:17分钟出博士级成果
Timothy Gowers 让 AI 独立解决加法数论公开难题。全程无需数学指导,仅简单提示。
陶哲轩指出:人类数学家的未来在于"消化"证明,而非生产证明。
IT之家
《科学》发文:旧版o1模型急诊诊断率67%,碾压人类医生的50-55%
o1在信息有限的早期分诊阶段优势最明显——这正是临床最容易出错的环节。
按AI标准o1已算"旧版",当前模型可能更强。
X:Kim
7B小模型指挥GPT-5/Claude Sonnet 4/Gemini 2.5 Pro,全面超越单个前沿模型
通过RL训练的7B模型编写子任务分配给大模型执行,平均每个问题仅需调用3次。
结论:智能差距不在模型规模,而在协调与指挥能力。
X:Berry Xia
02💼 商业动态
OpenAI成立DeployCo,40亿美元专攻企业AI落地
整合19家投资机构与咨询公司,启动团队含150名部署工程师。
Greg Brockman:让企业真正用起来AI,比发布模型更重要。
X:Greg Brockman
Anthropic正式在AWS推出Claude平台 + 开源金融AI全栈模板
全套Claude API引入AWS生态,由Anthropic直接运营。
同时开源:10个端到端智能体、7个行业插件、11家金融数据商MCP连接器。
Claude Blog | X:小北
Cerebras IPO获20+倍超额认购,发行价上调近三成
AI芯片企业最多筹资48亿美元。晶圆级芯片因SRAM缓存适合AI推理,已获亚马逊和OpenAI大单。
IT之家
Cognition AI 18个月年化营收4.45亿美元
AI软件工程师Devin客户含美国陆军、高盛、梅赛德斯-奔驰,估值约250亿美元。
X:swyx
03🤖 模型与工具
AntLingAGI发布万亿参数Ring-2.6-1T,限时免费开放
256K上下文,可调节思考强度,专为智能体优化。5月15日前免费。
X:OpenRouter
腾讯混元Hy3预览版发布:不刷榜,专注实用
256K上下文,MoE混合快慢思维。两周成绩:总令牌使用量#1、代码生成#1、工具调用#1。
X:腾讯混元
SenseNova U1图像生成模型登陆ComfyUI
8步快速推理,支持人像、超现实艺术、文字标志和生物设计。
X:商汤SenseTime
Runway开源confingy:告别YAML配置ML系统
纯Python替代YAML,支持懒加载、类型检查、序列化,无需重构现有代码。
Runway News
04📡 行业动态
Codex自主完成安全审计,22小时赚16.88美元
用户给Codex简单指令"去赚5美元" → Codex自主找赏金项目、提交PR、与维护者沟通 → 首笔付款到账。
这是Sam Altman说的"AI主动为人赚钱"愿景首次落地。
X:Sam Altman
教育科技门槛一夜归零:48小时、10美元开发3D教学应用
GPT Images 2 + Gemini 3.1 Pro 让一个懂生物的普通人,无需编程和3D建模技能,独立完成过去需多人团队数月的工作。
X:阿易 AI Notes
Anthropic无补贴登顶OpenRouter令牌份额榜首
即使没有任何补贴,Anthropic在令牌份额排行榜上位列第一。
X:OpenRouter
05💡 观点与趋势
Karpathy:人机交互正从Markdown向交互式神经视频演进
AI输出从Markdown→HTML→扩散模型生成的交互式神经视频。建议让LLM以HTML格式回复。
X:Andrej Karpathy
普通人用AI构建月入7万的一人公司:七个月路线图
Anthropic联合创始人预测首个十亿美元一人公司即将出现。更务实的路径:选可重复付费任务→写提示词→MCP工具链自动化→持续迭代。
X:阿易 AI Notes
中国移动上线MoMA模型中转平台,国家队入场AI基础设施
已接入DeepSeek、通义千问等300+模型。被视为AI时代的"智能电网"。
X:阿易 AI Notes
📌 数据来源:AI HOT (aihot.virxact.com) | 覆盖时段:2026-05-10 ~ 2026-05-12
夜雨聆风