过去三天,AI圈几乎没有冷场。DeepSeek从“永久降价”走向“扩容提速”,最后以一个18分钟宕机收尾;Anthropic公布了惊人数字——AI在关键软件中发现了超过一万个高危漏洞;国内智谱和阿里双双刷新模型速度与性价比。
1 DeepSeek三天三部曲:永久降价 → 提速扩容 → 18分钟故障恢复
5月23日,DeepSeek宣布将V4-Pro模型的API 2.5折优惠转为永久定价,每百万tokens输入仅3元、输出6元,原定5月31日结束的优惠将不再恢复原价。第二天,官方再次宣布完成输出提速与服务扩容,默认支持500并发在线。然而到了5月24日下午,API和网页对话服务突发完全不可用,经紧急修复后恢复,官方记录故障总时长约18分钟。三天三变,也从侧面反映出DeepSeek当前用户规模和服务压力。



2 Anthropic公布Glasswing计划:AI发现逾10,000个高危漏洞
Anthropic公布了AI安全项目Project Glasswing的阶段性成果:未公开模型Claude Mythos Preview在过去一个月与约50家合作伙伴的测试中,在关键软件中发现超一万个高危或严重级别漏洞,在超一千个开源项目中估计发现六千余个此类漏洞,经独立机构评估确认真实漏洞比例达90.6%。Anthropic表示,由于目前尚无足够防护措施防止此类模型被滥用,Mythos级模型暂不公开发布,但已面向企业推出Claude Security公开测试版。

3 Claude Code auto mode向Pro开放,Mythos 1模型浮出水面
Claude Code的auto mode——让AI自主完成多步骤编程任务的功能——现已面向Pro订阅用户开放,并新增对Sonnet 4.6和Opus 4.7的支持,通过Shift+Tab即可启动。与此同时,有用户发现Claude界面曾短暂出现代号Mythos 1的模型选项,代码中也已增加相关字符串。外界普遍认为,这与此前Glasswing计划中提到的Mythos级模型密切相关。


4 Codex修复额度异常,负责人探讨slow mode批量计算
5月24日凌晨,Codex官方确认并修复了由系统优化引发的额度消耗过快问题,已回滚优化并为所有账户重置了用量限制。负责人Tibo透露,Codex约5%流量在Pi上运行,另有5%在OpenCode上运行,提醒用户可使用ChatGPT账户接入更多第三方工具。此外,Tibo还向社区发起了是否引入/slow mode批量计算功能的讨论,目前处于前期意见征集阶段。


5 智谱GLM-5.1-HighSpeed:400 tokens/s刷新全球速度纪录
智谱发布了旗舰模型GLM-5.1的高速版本,完整保留原模型综合能力与编程能力,官方称输出速度达到400 tokens/s,刷新当前全球大模型API的速度上限。技术上由智谱GLM团队与TileRT团队联合打造,采用常驻Engine Kernel与异构Worker等系统级优化。目前仅面向部分企业客户定向开放。
6 阿里Qwen3.7-Max上线全端,百炼平台限时五折
阿里新一代千问旗舰模型Qwen3.7-Max已接入千问APP(需更新至6.9.7版本)、PC端及网页端供免费体验。阿里云百炼平台同步上线该模型,正进行限时5折优惠活动。结合DeepSeek的永久降价,国产模型API的价格战正在从“促销”走向“常态”。

7 国产大模型加速适配国产芯片,1.2万亿科技再贷款支持
有关部门在近期发布会上表示,将推动人工智能与各行业深度融合,指导国产大模型加大力度适配国产算力芯片以确保自主可控。目前已出台制造、医疗等十多个行业的“人工智能+”政策,正谋划进一步落地配套文件,并将持续推动央国企开放高价值应用场景。资金方面,科技再贷款额度扩大至1.2万亿元,同时启动集成电路企业税收优惠清单制定。
8 快讯速览
AlphaProof Nexus:Google DeepMind推出数学证明框架,自主解决9个Erdős开放问题,证明了44个OEIS猜想。vLLM封禁刷简历PR:一名贡献者为丰富简历提交无意义PR被社区封禁,vLLM称AI工具使低质量PR成本极低,给开源项目带来巨大审查负担。Opus 4.8疑现身:有用户称Google Vertex平台出现了claude-opus-4.8标识,另有传闻称Anthropic预计6月中下旬发布Sonnet 4.8,均为非官方信息。


夜雨聆风