乐于分享
好东西不私藏

5 月 2 日 AI 日报

5 月 2 日 AI 日报

🚀 核心模型与重大动向

  • 五角大楼官宣:八大 AI 巨头进驻分类网络:美国国防部(DoD)今日宣布与 OpenAI、Google、NVIDIA、SpaceX、Reflection、Microsoft、AWS 和 Oracle 达成关键协议。

    • AI 优先战略:这些公司将把先进的 AI 能力部署到五角大楼的分类网络中。

    • 海战突破:美国海军同步签署了近 1 亿美元的合同,利用 AI 软件大幅提升在关键海域(如霍尔木兹海峡)对新型水雷的自主检测速度。

  • Google Gemini 正式上车:Google 宣布将 Gemini 引入所有搭载“Google built-in”系统的汽车(覆盖通用汽车旗下的凯迪拉克、雪佛兰等百万辆车型)。

    • 告别机械指令:Gemini 将替代传统的 Google Assistant,支持自然对话、总结长短信回复、基于“氛围”点歌,并能直接查阅数字车主手册来回答“如何限制后备箱开启高度”等专业问题。

🛡️ 官方动态与法庭爆料(重磅必看)

  • 马斯克状告 OpenAI 案首周细节流出:在奥克兰联邦法院的审理中,案件爆出了尴尬细节。

    • 尴尬承认:法庭质证中爆出,马斯克的 xAI 实际上也在使用 OpenAI 的模型进行训练

    • 诉求升级:马斯克寻求超过 1300 亿美元 的赔偿,并要求撤销 OpenAI 的营利性转型。法官预计将在 5 月中旬做出初步裁决。

  • Claude Mythos 引发全球安全外交互动:Anthropic 的顶级安全模型 Mythos 持续引发争议。印度正积极向美国寻求该模型的访问权限,而美国政府正考虑将 Mythos 的访问权限限制在极少数核心盟友手中,以防止其强大的“零日漏洞探测能力”外泄。

📊 行业评估与调研

  • NIST 评估 DeepSeek V4-Pro:美国国家标准与技术研究院(NIST)下属的 CAISI 机构发布了对 DeepSeek V4-Pro 的评测报告。

    • 能力断代:报告认为 DeepSeek V4 是目前中国最强的 AI 模型,在网络安全、数学和软件工程领域表现出色。

    • 性价比优势:尽管在绝对性能上落后美国顶尖模型约 8 个月(相当于 GPT-5.0 水平),但在 7 项基准测试中,有 5 项的成本效率远高于 GPT-5.4 mini。

🛠️ 开发者与社会观察

  • FDA 启动“AI 临床试验”试点:美国 FDA 今日发起征询,计划通过 AI 优化早期临床试验的决策质量,重点在于利用 AI 缩短药物研发中“Proceed/No-go”的决策周期。