今日摘要
• DeepSeek V4-Pro 2.5折今日23:59转正价——输出6元/百万Token永久生效(✧∀✧)
• 软银750亿欧元押法国3.1GW算力,2031年前再扩2GW——欧洲最大AI基建之一
• Anthropic H轮650亿美元、估值9650亿超OpenAI 8520亿,年化营收470亿美元
• 戴尔Q1 AI服务器收入161亿、同比+757%,全年指引上调至约600亿美元
• Cisco测15款闭源旗舰:多轮攻击成功率7.89%–88.30%,单轮基准不可信
产品与功能更新
1. DeepSeek V4-Pro API 永久降价生效(DeepSeek 官方文档 / 财联社 5/31)
DeepSeek 文档写明 V4-Pro 限时 2.5 折 将于北京时间 5/31 23:59 结束,此后永久维持原定价 1/4:输入(缓存命中)0.025 元、未命中 3 元、输出 6 元/百万 Token(1M 上下文、默认 500 并发)。社区称相对 GPT-5.5 输出价约 1/34——「促销变正价」直接锁定国产旗舰推理成本地板。
2. OpenAI Codex 登陆 Windows 电脑操控(The Verge 5/29)
OpenAI 将 Codex 的 Computer Use 从 Mac 扩至 Windows:应用可「看见」屏幕并在本机执行任务;用户亦可通过 ChatGPT 移动端远程下发与审阅 Codex 作业。与 Claude Code / Chrome 浏览器自动化形成「终端 + 桌面 GUI」三端编码 Agent 对垒。
3. Microsoft Copilot Health 预览上线(The Verge / Microsoft 5/29)
Microsoft 365 订阅用户可试用 Copilot Health(3 月 首发预告):连接医疗记录、可穿戴与 Apple Health 等数据源,辅助找医生并解读健康指标——路线与 OpenAI、Anthropic 医疗 AI 产品同频,但绑定 M365 生态与合规链路。
4. Google Gemini Spark 实测:云端 24/7 个人 Agent(TechCrunch 5/30)
TechCrunch 实测 I/O 2026 发布的 Gemini Spark:在 Gmail/Docs/Sheets 等云端 VM 上跑周期性任务(邮件摘要、周末活动检索、价格追踪),无需像 OpenClaw 那样保持本机唤醒;早期痛点包括不支持 Google Keep、促销码偶发失效、与 Gemini 聊天界面分轨导致品牌混淆——目前主要面向 Google AI Ultra 重度用户。
5. Meta 研发 AI 吊坠可穿戴(TechCrunch / The Information 5/30)
Meta 内部备忘录显示正开发 AI 吊坠,计划 2027 年前后测试——承接 2025 年底 收购的 Limitless 录音吊坠技术;同步规划扩展 AI 眼镜 与 Wearables for Work 企业订阅,以扭转 Reality Labs Q1 40 亿美元亏损。
前沿研究
1. Psych-201:「有用助手」削弱人类行为模拟(THE DECODER 5/30 / arXiv)
国际团队基于 Psych-201(约 20.8 万 被试、2600 万+ 试次)比较 Qwen3、Llama3、OLMo 3 基座与后训练版本:基座模型预测人类决策 consistently 优于指令/推理/视觉微调版;Qwen2→Qwen3 代际提升中,助手版与人类的鸿沟反而扩大——「加角色人设」几乎无效,专用 Centaur 微调可部分挽回。
2. Cisco:15 款闭源旗舰无一免疫多轮攻击(Cisco Blogs 5/27–28)
Cisco AI Threat Research 对 OpenAI、Anthropic、Google、Amazon、xAI 共 15 款旗舰做配对评测:30,090 条单轮 + 6,986 条多轮攻击(1,456 对话)。多轮攻击成功率 7.89%–88.30%(单轮 2.19%–64.91%),排名与风险图谱不一致——GPT-5.4 单轮 2.74% 升至多轮 24.68%(约 9×),Gemini 3 Pro 18.10%→73.35%;Grok 4.1 Fast 非推理模式最高 88.30%,开推理可降至 43.47%。
3. AXPO:多模态 Agent 的「思考-行动」鸿沟(arXiv 2605.28774,5/27)
团队提出 Agent eXplorative Policy Optimization:在 GRPO 训练中对失败工具调用步做前缀固定 + 重采样,缓解工具尝试仅约 30% rollout、且组内全错约 40% 的信用分配问题。在 9 个多模态基准、Qwen3-VL-Thinking 8B/32B 上 Pass@1/Pass@4 平均 +1.8pp;8B+AXPO 的 Pass@4 可超 32B 基线——小模型 + 更好工具 RL 或成 Agent 落地捷径。
4. Helpful RLHF 与行为校准的结构性冲突(AI Evaluation Digest 5 月)
延续 Nature Centaur(2025) 脉络,Psych-201 作者 Marcel Binz 等指出:标准 RLHF/指令微调 优化「规范、 helpful 答案」,系统性覆盖预训练中学到的人类启发式与偏差——对政策仿真、临床训练、教育实验等「数字被试」场景,应优先基座模型或行为专用微调,而非直接拿聊天助手顶岗。
行业展望与社会影响
1. 软银 750 亿欧元法国 mega 算力(财联社 5/31)
知情人士称 孙正义 将在法国投 750 亿欧元(约 5918 亿元人民币):2031 年前于上法兰西大区先建 3.1GW,后续再扩 2GW(合计约 5GW,耗电堪比 5 座核电站或纽约峰值负荷);450 亿欧元 首期由软银牵头,并与 施耐德电气 在敦刻尔克共建 AI+机器人 产业中心——项目源于 4 月 马克龙 与孙正义东京晚宴,将成下周「选择法国」峰会重磅标的。
2. Anthropic 650 亿美元 H 轮、估值 9650 亿美元(财新 / AI Magazine 5/28–29)
Anthropic 5/28 宣布 650 亿美元 Series H,投后 9650 亿美元,超越 OpenAI 3 月 8520 亿美元 纪录;年化营收 run rate 约 470 亿美元(年初 300 亿、去约 100 亿)。Ramp 数据称 4 月 企业采用率 Anthropic 34.4% vs OpenAI 32.3%;公司与 Amazon、Google、Broadcom、SpaceX 签算力协议(报道合计可达 10GW 级),2028 年或实现盈利(OpenAI 同期或仍亏损 740 亿美元量级)。
3. 戴尔 AI 服务器收入单季 +757%(华尔街见闻 5/31)
戴尔 2027 财年 Q1(截至 5/1)营收 438 亿美元(+88%),AI 优化服务器收入 161 亿美元(同比 +757%),新订单 244 亿美元;公司把全年 AI 服务器指引从约 500 亿 上调至 600 亿美元(+144%),全年营收中值 1670 亿(原 1380–1420 亿)——Jeff Clarke 称「AI 机遇没有任何放缓迹象」,盘后股价一度涨约 30%。
4. 马斯克宣布 Terafab AI 芯片厂 7 天后启动(X / 多家媒体 5/31)
马斯克 5/31 在 X 称 Terafab(专用 AI 芯片 制造)将于 7 天后启动,细节待公布;特斯拉正设计 2027 量产目标 AI5(算力约为 AI4 的 10×、内存 9×),并规划 AI6–AI9 覆盖 Optimus、数据中心、太空级 场景——垂直整合意在缓解外部代工瓶颈,或与 Intel/台积电 许可合作模式并行。
5. AI wearable 与训练数据「家务经济学」(The Verge 5/29–30)
Shift 等初创提出免费上门清洁换居家场景训练数据,Meta 吊坠、OpenAI 可穿戴试验与 Reality Labs 巨额亏损同框——消费者 AI 硬件第三次浪潮的核心矛盾仍是:隐私/录音合规 vs 真实世界多模态数据稀缺;企业端则转向 Wearables for Work 订阅摊薄硬件风险。
开源TOP项目
(⭐ 数为 GitHub API 查询所得,实时以仓库首页为准;查询日 2026‑05‑31)
1. affaan-m/ECC
链接:https://github.com/affaan-m/ECC
(⭐ 199 245)面向 Claude Code、Codex、Cursor、OpenCode 等的 Agent Harness 性能优化栈:整合 Skills、Instincts、Memory、Security 与「研究优先」开发流;5/28 仍高频合并,代表 2026 年「比换更大模型更先优化运行时」的开源路线。
2. Leonxlnx/Taste-Skill
链接:https://github.com/Leonxlnx/Taste-Skill
(⭐ 29 087)5/30 前后登上 Trending 的「反 slop」Agent Skill:在生成链路中过滤平庸、模板化输出,强调审美与信息密度——社区将其视为对抗 AI 内容洪水 的轻量策展层,而非再堆一个更大模型。
3. harry0703/MoneyPrinterTurbo
链接:https://github.com/harry0703/MoneyPrinterTurbo
(⭐ 71 880)一键 LLM 驱动短视频流水线(脚本、素材、配音编排);5/30 仍活跃更新,与 Seedance/HappyHorse 等闭源视频 Agent 对位,适合评估「内容工厂」自动化 ROI 而非单点文生视频。
4. InsForge/InsForge
链接:https://github.com/InsForge/InsForge
(⭐ 10 776)面向 Agentic Coding 的开源全栈后端:数据库、Auth、存储、算力、托管、AI Gateway 一体,让编码 Agent 可端到端交付全栈应用;5/30 推送,常被与 Vercel v0、Replit Agent 对照,主打可自托管与供应商锁定规避。
社媒分享
1. DeepSeek「斩杀线」与 6 月账单(开发者社区 5/22–31)
5/22 官宣 2.5 折变永久 后,社媒热议 5/31 23:59 节点:输出 6 元/百万 Token 相对 Claude Opus 4.7 输入 108 元 量级形成 10×+ 价差;Artificial Analysis 称同等智能指数评测成本约 268 美元 vs 海外旗舰 数千美元——中小团队正把 Agent 默认路由切到 V4-Pro 做成本压力测试。
2. Gemini Spark vs OpenClaw:关笔记本能否关焦虑(TechCrunch 评论 5/30)
博主复读 Pichai「yes, you can close your laptop」梗:云端 Spark 适合不想维护 Mac mini 7W 常开 的普通用户,但 Keep 缺失、iPhone 无法一键唤起 Spark 暴露 Google 产品碎片化;实用结论——个人 Agent 仍分「云端省心派」与「本地主权派」,尚无单一赢家。
3. Claude Code 生产 Agent:Hooks 管硬约束、Prompt 管软偏好(DEV Community 5 月)
工程师分享 14 周 上线 9 个生产 Agent 的经验:月基础设施 <180 美元;禁止 force push、CI 期间禁部署 等必须写 Shell Hooks 而非写进 CLAUDE.md——「模型概率性、钩子确定性」成 2026 编码 Agent 社媒高频口诀。
4. Cisco 多轮 ASR 与企业采购清单(安全圈 5/28 起)
红队从业者整理 Cisco 报告 actionable 项:要求模型卡公布分策略族多轮 ASR、对单轮/多轮差距 >15pp 的模型人工复核、部署 运行时护栏(而非只看单轮排行榜);Grok 推理模式开关 可让 ASR 88.3%→43.5% 的案例被反复转发——「同一模型名、不同配置 = 不同安全产品」。
5. Psych-201 震感:别用 Chatbot 做被试(学术 Twitter/X 5/
夜雨聆风