5 月 3 日 AI 日报
🚀 核心模型与科研巅峰
-
AI 系统 RAVEN 确证 100+ 颗新行星:华威大学天文学家今日宣布,利用名为 RAVEN 的 AI 工具在 NASA 的 TESS 任务数据中确认了 118 颗新行星,并筛选出近 1000 个高潜力候选者。RAVEN 的优势在于能从 220 万颗恒星的微弱光变中,精准识别出那些轨道周期极短(甚至不足 1 天)的罕见行星。
-
Mythos 模型引发金融系统关注:美联储理事 Michelle Bowman 在今日发布的一份文件中,将 Anthropic 的 Mythos 模型列为金融系统安全评估的重点。她指出,Mythos 识别网络漏洞的能力虽能增强防御,但也对金融基座的鲁棒性提出了更高要求。
🤖 智能体(Agent)工业实战
-
DARPA 启动“分布式 Agent”DICE 项目:美国国防部高级研究计划局(DARPA)发布 DICE 计划 预告。该项目旨在开发能自主执行长周期任务、且在“对抗环境”下仍能保持去中心化协作的智能体集群,目标是让成百上千个 Agent 像狼群一样协作且受人类控制。
-
SAS 发布供应链 AI 智能体:SAS 今日开启 Supply Chain Agent 私测。该 Agent 专门解决 S&OP(供应与运营规划)这一世界性难题,能自主预测物料缺口并生成调度建议,旨在将数天的规划周期缩短至小时级。
🛒 消费级 AI 与社会观察
-
“代购智能体”引发法律与伦理讨论:随着 Shopping Muse、Rufus 等 Agent 的转化率比传统搜索高出 20%,法律学者今日发出警告。研究指出,AI Agent 的核心能力正在从“协助购买”转向“影响决策”,甚至可能引导用户进行超额消费。
-
2026 全球 AI 实验室实力榜发布:最新的 9 维度评分显示,Google 与 OpenAI 以 74 分并列第一。报告指出,Google 的优势在于数据中心主权,而 OpenAI 的优势在于模型迭代的势能。Anthropic 虽然以 70 分位居第三,但其 Claude Mythos 被视为下半年的最大变量。
👀 官方预告与爆料(本周看点)
-
DeepSeek V4-Pro/Flash 适配赛开启:在开源一周后,DeepSeek V4 已成为 GitHub 本周最热项目。目前多个开源 Agent 框架(如 OpenClaw)已完成“原生驱动”适配。
-
微软“Agent 马拉松”明日开赛:北京时间 5 月 4 日(周一),微软将启动全球 Agent 开发者大赛,预计将涌现一大批基于 Copilot Studio 的垂直行业智能体。
夜雨聆风