AI资讯日报 2026/05/31

今日摘要

• DeepSeek V4-Pro 2.5折今日23:59转正价——输出6元/百万Token永久生效(✧∀✧)

• 软银750亿欧元押法国3.1GW算力，2031年前再扩2GW——欧洲最大AI基建之一

• Anthropic H轮650亿美元、估值9650亿超OpenAI 8520亿，年化营收470亿美元

• 戴尔Q1 AI服务器收入161亿、同比+757%，全年指引上调至约600亿美元

• Cisco测15款闭源旗舰：多轮攻击成功率7.89%–88.30%，单轮基准不可信

产品与功能更新

1. DeepSeek V4-Pro API 永久降价生效（DeepSeek 官方文档 / 财联社 5/31）
DeepSeek 文档写明 V4-Pro 限时 2.5 折 将于北京时间 5/31 23:59 结束，此后永久维持原定价 1/4：输入（缓存命中）0.025 元、未命中 3 元、输出 6 元/百万 Token（1M 上下文、默认 500 并发）。社区称相对 GPT-5.5 输出价约 1/34——「促销变正价」直接锁定国产旗舰推理成本地板。

2. OpenAI Codex 登陆 Windows 电脑操控（The Verge 5/29）
OpenAI 将 Codex 的 Computer Use 从 Mac 扩至 Windows：应用可「看见」屏幕并在本机执行任务；用户亦可通过 ChatGPT 移动端远程下发与审阅 Codex 作业。与 Claude Code / Chrome 浏览器自动化形成「终端 + 桌面 GUI」三端编码 Agent 对垒。

3. Microsoft Copilot Health 预览上线（The Verge / Microsoft 5/29）
Microsoft 365 订阅用户可试用 Copilot Health（3 月 首发预告）：连接医疗记录、可穿戴与 Apple Health 等数据源，辅助找医生并解读健康指标——路线与 OpenAI、Anthropic 医疗 AI 产品同频，但绑定 M365 生态与合规链路。

4. Google Gemini Spark 实测：云端 24/7 个人 Agent（TechCrunch 5/30）
TechCrunch 实测 I/O 2026 发布的 Gemini Spark：在 Gmail/Docs/Sheets 等云端 VM 上跑周期性任务（邮件摘要、周末活动检索、价格追踪），无需像 OpenClaw 那样保持本机唤醒；早期痛点包括不支持 Google Keep、促销码偶发失效、与 Gemini 聊天界面分轨导致品牌混淆——目前主要面向 Google AI Ultra 重度用户。

5. Meta 研发 AI 吊坠可穿戴（TechCrunch / The Information 5/30）
Meta 内部备忘录显示正开发 AI 吊坠，计划 2027 年前后测试——承接 2025 年底 收购的 Limitless 录音吊坠技术；同步规划扩展 AI 眼镜 与 Wearables for Work 企业订阅，以扭转 Reality Labs Q1 40 亿美元亏损。

前沿研究

1. Psych-201：「有用助手」削弱人类行为模拟（THE DECODER 5/30 / arXiv）
国际团队基于 Psych-201（约 20.8 万 被试、2600 万+ 试次）比较 Qwen3、Llama3、OLMo 3 基座与后训练版本：基座模型预测人类决策 consistently 优于指令/推理/视觉微调版；Qwen2→Qwen3 代际提升中，助手版与人类的鸿沟反而扩大——「加角色人设」几乎无效，专用 Centaur 微调可部分挽回。

2. Cisco：15 款闭源旗舰无一免疫多轮攻击（Cisco Blogs 5/27–28）
Cisco AI Threat Research 对 OpenAI、Anthropic、Google、Amazon、xAI 共 15 款旗舰做配对评测：30,090 条单轮 + 6,986 条多轮攻击（1,456 对话）。多轮攻击成功率 7.89%–88.30%（单轮 2.19%–64.91%），排名与风险图谱不一致——GPT-5.4 单轮 2.74% 升至多轮 24.68%（约 9×），Gemini 3 Pro 18.10%→73.35%；Grok 4.1 Fast 非推理模式最高 88.30%，开推理可降至 43.47%。

3. AXPO：多模态 Agent 的「思考-行动」鸿沟（arXiv 2605.28774，5/27）
团队提出 Agent eXplorative Policy Optimization：在 GRPO 训练中对失败工具调用步做前缀固定 + 重采样，缓解工具尝试仅约 30% rollout、且组内全错约 40% 的信用分配问题。在 9 个多模态基准、Qwen3-VL-Thinking 8B/32B 上 Pass@1/Pass@4 平均 +1.8pp；8B+AXPO 的 Pass@4 可超 32B 基线——小模型 + 更好工具 RL 或成 Agent 落地捷径。

4. Helpful RLHF 与行为校准的结构性冲突（AI Evaluation Digest 5 月）
延续 Nature Centaur（2025） 脉络，Psych-201 作者 Marcel Binz 等指出：标准 RLHF/指令微调 优化「规范、 helpful 答案」，系统性覆盖预训练中学到的人类启发式与偏差——对政策仿真、临床训练、教育实验等「数字被试」场景，应优先基座模型或行为专用微调，而非直接拿聊天助手顶岗。

行业展望与社会影响

1. 软银 750 亿欧元法国 mega 算力（财联社 5/31）
知情人士称 孙正义 将在法国投 750 亿欧元（约 5918 亿元人民币）：2031 年前于上法兰西大区先建 3.1GW，后续再扩 2GW（合计约 5GW，耗电堪比 5 座核电站或纽约峰值负荷）；450 亿欧元 首期由软银牵头，并与 施耐德电气 在敦刻尔克共建 AI+机器人 产业中心——项目源于 4 月 马克龙 与孙正义东京晚宴，将成下周「选择法国」峰会重磅标的。

2. Anthropic 650 亿美元 H 轮、估值 9650 亿美元（财新 / AI Magazine 5/28–29）
Anthropic 5/28 宣布 650 亿美元 Series H，投后 9650 亿美元，超越 OpenAI 3 月 8520 亿美元 纪录；年化营收 run rate 约 470 亿美元（年初 300 亿、去约 100 亿）。Ramp 数据称 4 月 企业采用率 Anthropic 34.4% vs OpenAI 32.3%；公司与 Amazon、Google、Broadcom、SpaceX 签算力协议（报道合计可达 10GW 级），2028 年或实现盈利（OpenAI 同期或仍亏损 740 亿美元量级）。

3. 戴尔 AI 服务器收入单季 +757%（华尔街见闻 5/31）
戴尔 2027 财年 Q1（截至 5/1）营收 438 亿美元（+88%），AI 优化服务器收入 161 亿美元（同比 +757%），新订单 244 亿美元；公司把全年 AI 服务器指引从约 500 亿 上调至 600 亿美元（+144%），全年营收中值 1670 亿（原 1380–1420 亿）——Jeff Clarke 称「AI 机遇没有任何放缓迹象」，盘后股价一度涨约 30%。

4. 马斯克宣布 Terafab AI 芯片厂 7 天后启动（X / 多家媒体 5/31）
马斯克 5/31 在 X 称 Terafab（专用 AI 芯片 制造）将于 7 天后启动，细节待公布；特斯拉正设计 2027 量产目标 AI5（算力约为 AI4 的 10×、内存 9×），并规划 AI6–AI9 覆盖 Optimus、数据中心、太空级 场景——垂直整合意在缓解外部代工瓶颈，或与 Intel/台积电 许可合作模式并行。

5. AI wearable 与训练数据「家务经济学」（The Verge 5/29–30）
Shift 等初创提出免费上门清洁换居家场景训练数据，Meta 吊坠、OpenAI 可穿戴试验与 Reality Labs 巨额亏损同框——消费者 AI 硬件第三次浪潮的核心矛盾仍是：隐私/录音合规 vs 真实世界多模态数据稀缺；企业端则转向 Wearables for Work 订阅摊薄硬件风险。

开源TOP项目

（⭐ 数为 GitHub API 查询所得，实时以仓库首页为准；查询日 2026‑05‑31）

1. affaan-m/ECC
链接：https://github.com/affaan-m/ECC
（⭐ 199 245）面向 Claude Code、Codex、Cursor、OpenCode 等的 Agent Harness 性能优化栈：整合 Skills、Instincts、Memory、Security 与「研究优先」开发流；5/28 仍高频合并，代表 2026 年「比换更大模型更先优化运行时」的开源路线。

2. Leonxlnx/Taste-Skill
链接：https://github.com/Leonxlnx/Taste-Skill
（⭐ 29 087）5/30 前后登上 Trending 的「反 slop」Agent Skill：在生成链路中过滤平庸、模板化输出，强调审美与信息密度——社区将其视为对抗 AI 内容洪水 的轻量策展层，而非再堆一个更大模型。

3. harry0703/MoneyPrinterTurbo
链接：https://github.com/harry0703/MoneyPrinterTurbo
（⭐ 71 880）一键 LLM 驱动短视频流水线（脚本、素材、配音编排）；5/30 仍活跃更新，与 Seedance/HappyHorse 等闭源视频 Agent 对位，适合评估「内容工厂」自动化 ROI 而非单点文生视频。

4. InsForge/InsForge
链接：https://github.com/InsForge/InsForge
（⭐ 10 776）面向 Agentic Coding 的开源全栈后端：数据库、Auth、存储、算力、托管、AI Gateway 一体，让编码 Agent 可端到端交付全栈应用；5/30 推送，常被与 Vercel v0、Replit Agent 对照，主打可自托管与供应商锁定规避。

社媒分享

1. DeepSeek「斩杀线」与 6 月账单（开发者社区 5/22–31）
5/22 官宣 2.5 折变永久 后，社媒热议 5/31 23:59 节点：输出 6 元/百万 Token 相对 Claude Opus 4.7 输入 108 元 量级形成 10×+ 价差；Artificial Analysis 称同等智能指数评测成本约 268 美元 vs 海外旗舰 数千美元——中小团队正把 Agent 默认路由切到 V4-Pro 做成本压力测试。

2. Gemini Spark vs OpenClaw：关笔记本能否关焦虑（TechCrunch 评论 5/30）
博主复读 Pichai「yes, you can close your laptop」梗：云端 Spark 适合不想维护 Mac mini 7W 常开 的普通用户，但 Keep 缺失、iPhone 无法一键唤起 Spark 暴露 Google 产品碎片化；实用结论——个人 Agent 仍分「云端省心派」与「本地主权派」，尚无单一赢家。

3. Claude Code 生产 Agent：Hooks 管硬约束、Prompt 管软偏好（DEV Community 5 月）
工程师分享 14 周 上线 9 个生产 Agent 的经验：月基础设施 <180 美元；禁止 force push、CI 期间禁部署 等必须写 Shell Hooks 而非写进 CLAUDE.md——「模型概率性、钩子确定性」成 2026 编码 Agent 社媒高频口诀。

4. Cisco 多轮 ASR 与企业采购清单（安全圈 5/28 起）
红队从业者整理 Cisco 报告 actionable 项：要求模型卡公布分策略族多轮 ASR、对单轮/多轮差距 >15pp 的模型人工复核、部署 运行时护栏（而非只看单轮排行榜）；Grok 推理模式开关 可让 ASR 88.3%→43.5% 的案例被反复转发——「同一模型名、不同配置 = 不同安全产品」。

5. Psych-201 震感：别用 Chatbot 做被试（学术 Twitter/X 5/