乐于分享
好东西不私藏

奥斯卡新规:禁止 AI 生成演员与剧本参评|哈佛:AI 在急诊室诊断准确率超医生|五角大楼与 7 家 巨头签军事合同,Anthropic 被排除

奥斯卡新规:禁止 AI 生成演员与剧本参评|哈佛:AI 在急诊室诊断准确率超医生|五角大楼与 7 家 巨头签军事合同,Anthropic 被排除

🔥 大模型与 AI 公司动态

1. 哈佛研究:AI 在急诊室诊断准确率超越人类医生

时间:5月3日 | 来源:Harvard Medical School、TechCrunch 事件:哈佛大学发布迄今最大规模之一的人机诊断对比研究,评估 LLM 在 76 个真实急诊病例中的表现。研究发现 OpenAI o1 推理模型的诊断准确率显著高于急诊室医生,研究团队建议进入临床试验阶段。 值得关注:这是 AI 在高风险医疗决策场景中最有力的实证之一,直接推动 AI 医疗工具从”辅助”走向”独立诊断”的讨论。


2. 五角大楼与 7 家 AI 巨头签军事合同,Anthropic 被排除

时间:5月1日~2日持续发酵 | 来源:CNN、Military Times 事件:美国国防部宣布与 OpenAI、Google、微软、亚马逊、英伟达、SpaceX、Reflection 七家公司达成协议,将其 AI 技术部署至最高机密军事网络。值得注意的是,Anthropic 被明确排除在外。 值得关注:AI 军事化应用加速落地,七家公司的 AI 将直接服务于作战和情报分析。Anthropic 被排除与其”AI 安全优先”的公开立场直接相关,政治与商业的张力凸显。


3. “This is Fine” 迷因创作者指控 AI 公司 Artisan 侵权

时间:5月3日 | 来源:TechCrunch 事件:全球知名”This is Fine”漫画原作者 KC Green 公开指控 AI 初创公司 Artisan 未经授权使用其作品投放线下广告。Artisan 此前因”停止招聘人类”广告牌引发争议,此次侵权指控再次点燃 AI 与创作者的版权冲突。 值得关注:AI 公司”先用后谈”的版权态度正在遭遇越来越强的法律和舆论反弹,创作者维权将成为 AI 行业版权合规的持续催化剂。


4. 奥斯卡更新规则:禁止 AI 生成演员与剧本参评

时间:5月1日~3日持续报道 | 来源:Vanity Fair、Consequence 事件:美国电影艺术与科学学院更新评奖资格规则,明确要求剧本必须”由人类撰写”才能参评,表演类提名必须”由人类亲自完成并获得本人同意”。这是奥斯卡首次对 AI 生成内容做出正式限制。 值得关注:”AI 内容能否参评”将从影视行业向音乐、文学、新闻等各行业奖项体系蔓延,”人类创作”的法律边界正在被逐个划定。


💻 编程工具与开发者生态

5. VS Code 强制插入 Copilot 署名引爆开发者社区抗议

时间:5月3日 | 来源:Hacker News(1349 points)、腾讯新闻 事件:微软 VS Code 团队提交 PR #310226,计划默认在所有 Git 提交中插入”Co-authored-by: GitHub Copilot”——即使用户从未启用 Copilot。该行为被开发者称为”暗箱操作”和”AI 署名造假”,引发开源社区强烈抗议。微软已回应将在下版本修复。 值得关注:这是科技巨头”追求 AI 使用量指标”与开发者权益之间的标志性冲突。代码署名涉及知识产权归属,一旦误标将影响开源协议合规性,企业需警惕此类默认行为带来的法律风险。


6. Kimi K2.6 编程实测碾压 GPT-5.5 和 Claude,开源模型创历史

时间:5月3日持续热议 | 来源:Hacker News(329 points)、腾讯新闻 事件:月之暗面 4月20日发布并开源的 Kimi K2.6 在编程挑战中击败 Claude Opus、GPT-5.5 和 Gemini Pro,5月3日在 Hacker News 引发讨论。SWE-Bench Pro 得分 58.6%,超越 GPT-5.4(57.7%)和 Claude Opus 4.6。支持连续编码 13 小时、300 个 Agent 并行工作。 值得关注:国产开源模型首次在编程核心能力上全面超越闭源旗舰,”开源 vs 闭源”的力量格局正在被改写。对开发者而言,这意味着高性能编程 AI 可以零成本获取。


7. DeepClaude:用 DeepSeek V4 Pro 替换 Claude Code 底层模型,成本降 17 倍

时间:5月3日~4日 | 来源:Hacker News、AIToolly 事件:开发者 aattaran 在 GitHub 发布 DeepClaude 开源项目,将 Claude Code 的自主 Agent 循环接入 DeepSeek V4 Pro。Token 成本从 Anthropic 的 15 美元/百万降至 0.87 美元/百万,降幅 17 倍,完整保留文件编辑、Bash 执行等功能。 值得关注:Claude Code 每月 200 美元的订阅门槛直接被绕过,模型 API 价格战正在向开发者工具层传导。也暴露出 Claude 的核心价值在于 Agent 框架而非底层模型。


8. jcode:首个代码智能体专业测试框架登 GitHub Trending

时间:5月4日 | 来源:GitHub Trending 事件:开发者 1jehuang 发布 jcode 开源项目,专门为代码 AI Agent 提供结构化测试环境,填补了”如何评估自主编程 Agent 可靠性”的行业空白,当日即登上 GitHub Trending。 值得关注:AI Agent 从”代码补全”进化到”自主编程”后,测试和质量保障成为新基建。jcode 的出现标志着 Agent 开发生态正从”能跑就行”走向”可度量、可验证”。


9. Browserbase Skills:为 Claude Code 赋予网页浏览能力

时间:5月4日 | 来源:GitHub Trending 事件:Browserbase 发布 Skills SDK,使 Claude Code 可直接对接 Browserbase 基础设施进行实时网页导航、信息提取和页面交互,将 Claude Code 的能力边界从”本地代码”扩展到”动态网页操作”。 值得关注:AI 编程助手正在突破 IDE 边界,向”全能 Agent”演进。对网页测试、RPA、数据采集等场景将产生直接冲击。


10. Ruflo:企业级 Claude 多智能体编排平台登 GitHub Trending

时间:5月4日 | 来源:GitHub Trending 事件:开发者 ruvnet 发布 Ruflo,支持部署智能多 Agent 集群、分布式编排、原生 RAG 集成和 Claude Code/Codex 支持,面向企业级自主工作流场景。 值得关注:AI Agent 的”编排层”成为新战场——当企业同时运行数十个专用 Agent 时,谁能高效调度协同,谁就掌握了 AI 落地的关键能力。


11. Warp 终端进化为 Agent 原生开发环境

时间:5月3日 | 来源:GitHub Trending、Text Matrix 事件:warpdotdev 宣布 Warp 从智能终端正式升级为”Agentic Development Environment”,内置自研 WarpUI 框架,支持 GPT 驱动的 Oz agent 直接处理真实 GitHub issue/PR,将 Agent 工作流原生集成到命令行。 值得关注:终端正从”执行命令的工具”变为”管理 Agent 的平台”,CLI + AI Agent 的融合将成为开发者基础设施的新常态。


12. Superpowers:面向高级代码 Agent 的新方法论框架

时间:5月3日 | 来源:GitHub Trending 事件:个人开发者 obra 发布 Superpowers,提供可组合、模块化的能力单元,专为构建灵活可扩展的 AI 驱动代码智能体设计。 值得关注:Agent 开发正在从”单个大模型搞定一切”走向”多个专项能力组合”,方法论层面的标准化将加速 Agent 生态的成熟。


🤖 具身智能与机器人

13. 具身智能六大关键趋势:从”造产品”到”抢落地”

时间:5月2日 | 来源:机器人大讲堂、腾讯新闻 事件:基于 2026 具身智能与人形机器人大会(34家核心展商),发布系统性行业分析:①灵巧手万台量产能力成分水岭(灵心巧手市占率超80%)②触觉感知进入”感算一体”新纪元 ③大脑(世界模型 vs 端侧推理)与小脑(运动控制平台化)齐头并进 ④数据工业化生产体系成型(采集-处理-供给三层架构)⑤核心硬件进入产品力对决 ⑥金融保险与算力成为”新水电”。 值得关注:这是当前最系统、最接地气的具身智能产业研判。核心结论——中国企业在灵巧手、触觉传感器、数据基础设施等关键环节已具备定义全球标准的能力


14. Meta 收购 ARI 人形机器人公司,正式入局具身智能硬件

时间:5月2日~3日 | 来源:金融界、新浪科技 事件:Meta 确认完成对人形机器人公司 Assured Robot Intelligence(ARI)的收购。此前 Meta 收购 Manus(AI Agent 公司)被中国否决,呈现”一进一阻”的复杂地缘格局。 值得关注:科技巨头正形成”大模型 + 机器人本体”的全栈布局(Google/DeepMind、特斯拉、Meta),具身智能已成大厂必争之地。


15. 智元机器人(AGIBOT)合作伙伴大会:4款新品 + XYZ产业曲线

时间:4月17日~5月持续报道 | 来源:新华社、CSDN 事件:智元机器人在 2026 合作伙伴大会发布 4 款新机器人平台、多个 AI 基础模型和 7 个行业解决方案,首次提出”具身智能产业发展 XYZ 曲线”三阶段跃迁理论,宣布人形机器人”上下料”成本已低于人工,2026 营收目标 5 亿元。 值得关注:智元作为国内唯一实现全产品线覆盖的具身智能企业,其”部署态元年”的产业定位和成本突破信号值得密切关注。


16. 亿欧智库:具身智能商业化前沿洞察——轮式优先、RaaS 为长期趋势

时间:4月30日发布、5月初持续传播 | 来源:亿欧智库 事件:报告指出行业处于技术验证末期、商业化转型拐点,核心判断:轮式机器人优先落地、混合技术架构更务实、RaaS(机器人即服务)为长期商业模式,预判 2026-2027 年垂类场景纵深发展。 值得关注:与六大趋势报告形成互补——”造得出”的问题基本解决,”卖得出、用得好”才是接下来的真正考验。


📊 行业趋势与政策

17. Google I/O 2026 前瞻:AI 全面升级 + AndroidXR 智能眼镜

时间:5月3日~4日 | 来源:Android Gadget Hacks、澎湃新闻 事件:Google I/O 2026 将于 5 月 19-20 日在山景城举行。预计发布:Gemini AI 功能全面升级、Android 17 新特性、AndroidXR 智能眼镜、AluminumOS 新操作系统,以及更多 Project Astra 和 Gemini Agent 生态更新。 值得关注:谷歌能否在”AI 硬件”上给出超出市场预期的答案,将是本次大会最大看点。


18. Anubis 反爬盾开源:用工作量证明防御 AI 数据抓取

时间:5月3日 | 来源:GitHub Trending 事件:开源安全工具 Anubis(由 Videolan 托管)采用 Hashcash 工作量证明机制,普通用户验证成本可忽略,大规模自动化爬虫成本极高,专门防御 AI 公司的数据抓取行为。 值得关注:AI 训练数据的”争夺战”正在从法庭(版权诉讼)转向技术层(反爬工具),AI 数据供应链的摩擦成本将持续上升。


19. 中国 2025 年 Token 调用量达 21100 万亿次,日均从万亿飙至百万亿

时间:5月2日~3日持续传播 | 来源:央视新闻、第九届数字中国建设峰会 事件:《全国数据资源调查报告(2025年)》在数字中国建设峰会发布:2025 年全国日均 Token 调用量从年初超万亿增长到年末 100 万亿,全年累计约 21100 万亿次,呈指数级增长。Token 正成为 AI 时代的新度量衡。 值得关注:百倍级的年度增长意味着 AI 应用正在从”尝鲜”进入”日常”,背后是 Agent、推理、搜索等场景的大规模渗透。对算力基础设施和数据资源的需求将呈指数级攀升。


信息来源:TechCrunch、Harvard Medical School、Hacker News、GitHub Trending、CNN、腾讯新闻、机器人大讲堂、央视新闻、亿欧智库等