
🤖 AI 资讯日报
每日精选 · 投融资 · 政策 · 技术 · 产品 · 大厂 · 活动 · Paper
2026年4月17日 · 星期五
📌 今日重点摘要
Claude Opus 4.7 发布 — 编程能力暴涨,CursorBench 58%→70%,定价不变
通义千问 Qwen3.6-35B-A3B 开源 — 本地可跑,SVG 生成能力超越 Claude Opus 4.7
OpenAI Codex 最大更新 — 记忆功能、图像生成、自动化跨天执行
英伟达黄仁勋警示 — 出口管制难以遏制中国 AI,呼吁中美合作
Cloudflare 全面进军 AI — 统一推理平台 + Agent 原生邮件服务
投融资
🔥 Darkbloom 发布:去中心化 AI 推理网络,利用闲置 Mac 跑模型
Eigen Labs Research 发布 Darkbloom,一个基于闲置 Apple Silicon 设备的去中心化 AI 推理网络。该平台利用全球超过 1 亿台闲置的 Mac 设备提供推理服务,API 兼容 OpenAI,端到端加密,运营者保留 100% 收入。实测显示推理成本比集中式方案低 50%-70%,支持 Gemma 4 26B、Qwen3.5 122B MoE、MiniMax M2.5 239B 等多款主流模型。这是"AI 版 Airbnb"理念的一次大胆实践。
🔗 来源:Darkbloom | HN 468▲
Anthropic 估值已达 800 亿美元,年营收从 90 亿增长至 300 亿美元
据 AIbase 报道,随着 Claude Opus 4.7 及一系列新产品的推出,Anthropic 估值已攀升至 800 亿美元,年营收实现了从 90 亿到 300 亿美元的飞跃式增长,成为 AI 行业增长最快的公司之一。此前有投资者表示 Anthropic 的增长势头已超过 OpenAI。
🔗 来源:AIbase
政策与监管
🔥 美国参议员桑德斯联合工会领袖推动 AI 劳工保护立法
美国参议员伯尼·桑德斯与多个行业工会领袖联合举行集会,呼吁在 AI 快速发展的背景下加强劳动者权益保护。桑德斯此前已提出"AI 数据中心暂停法案",并警告称如不加以管控,十年内"制造业岗位的概念将不复存在"。他在集会上向寡头们喊话:"去死吧!"
🔗 来源:The Verge
谷歌正与美国国防部谈判,拟允许在机密环境中使用 Gemini
据 The Information 报道,谷歌正在与五角大楼讨论让军方在机密(classified)环境中使用 Gemini AI 的合同条款,这标志着谷歌在军事合作立场上的重大转变。此前谷歌仅允许国防部在非机密环境中使用 Gemini,新合同语言据悉将与 OpenAI 此前获得的五角大楼合同条款相似。
🔗 来源:The Verge
超 20 万台 AI 服务器暴露在攻击风险下,MCP 协议被曝严重设计缺陷
安全报告揭示 Anthropic 的 MCP(Model Context Protocol)协议存在严重架构缺陷,STDIO 接口允许任意操作系统命令无验证执行,影响覆盖 11 种编程语言。Anthropic 仅更新了安全文档,未进行架构级修复,引发开发者担忧。
🔗 来源:AIbase
技术动态
🔥 阿里通义千问发布 Qwen3.6-35B-A3B:开源 MoE 模型刷新编程能力纪录
阿里巴巴通义千问团队发布 Qwen3.6-35B-A3B,这是一个 35B 参数、3B 活跃参数的 MoE(混合专家)架构开源模型,主打智能体编程场景。该模型可在笔记本上本地运行(仅需 ~21GB 量化版),在 HN 上热度高达 865 分。Simon Willison 实测发现,该模型在 SVG 图像生成测试中甚至击败了 Claude Opus 4.7,展示了开源模型在特定任务上的惊人潜力。

🔗 来源:Qwen.ai / Simon Willison | HN 865▲
OpenAI 发布 GPT-Rosalind:生命科学专用推理模型
OpenAI 推出其首个领域专用前沿推理模型 GPT-Rosalind,专为生物学、药物发现和转化医学研究优化。在 BixBench 生物信息学基准测试中取得领先成绩,在 Dyno Therapeutics 的 RNA 序列预测任务中超过 95% 的人类专家。模型以 DNA 双螺旋结构发现者罗莎琳德·富兰克林命名,并配套开源 Codex 生命科学研究插件,连接 50+ 科学数据库。Amgen、Moderna、Allen 研究所等已加入合作。

🔗 来源:OpenAI | HN 41▲
Firebase 浏览器密钥泄漏导致 Gemini API 产生 5.4 万欧元账单
一位开发者报告,由于未限制 Firebase 浏览器密钥的 API 访问权限,13 小时内被恶意调用 Gemini API 产生了 54,000 欧元(约 42 万人民币)的天价账单。该事件在 HN 上获得 375 分热度,引发了关于 API 密钥安全管理和 Google 计费保护机制的热烈讨论。
🔗 来源:HN 375▲
产品发布
🔥 Anthropic 发布 Claude Opus 4.7:高难度编程能力大幅跃升
Anthropic 正式发布 Claude Opus 4.7,这是 Opus 4.6 的直接升级版本,距上次更新仅两个月。新模型在高级软件工程领域表现显著提升——CursorBench 从 58% 跃升至 70%,Rakuten-SWE-Bench 任务解决率为 Opus 4.6 的 3 倍。新版本支持更高分辨率视觉、多会话记忆、自动验证输出机制,同时引入了网络安全自动检测保护机制。Claude Code 同步推出自动模式和全新 /ultrareview 代码审核指令。定价保持不变:$5/百万输入 token,$25/百万输出 token。

🔗 来源:Anthropic | HN 1381▲ 🔥
🔥 OpenAI Codex 重大更新:电脑操控、图像生成、记忆功能全面上线
OpenAI 发布 Codex 近一年来最大规模更新。新版 Codex 可直接操控 Mac 应用程序(后台多 Agent 并行),新增应用内浏览器、gpt-image-1.5 图像生成、90+ 新插件(含 Jira/GitLab/CircleCI 等)、PR 评审和远程 SSH 连接。最引人注目的是"记忆"功能预览——Codex 可记住用户偏好和历史上下文,以及自动化任务可跨天/周持续执行。每周活跃开发者已突破 300 万。
🔗 来源:OpenAI | HN 628▲
DeepL 推出 Voice-to-Voice 实时语音翻译套件
翻译巨头 DeepL 正式发布 Voice-to-Voice 实时语音翻译产品,包括会议实时翻译、跨平台对话翻译、群组多语言对话等功能。在 Slator 独立盲测中,96% 的语言学家更青睐 DeepL Voice 而非谷歌、微软、Zoom 的原生翻译方案。CEO Jarek Kutylowski 称这是"攻克翻译领域最难的一道关卡"。
🔗 来源:IT之家
大厂动态
Cloudflare 发布 AI 平台 + Agent 邮件服务,进军 AI 基础设施
Cloudflare 在"Agents Week"集中推出两大重磅产品:(1) AI Platform——统一推理层,一个 API 接入 12+ 供应商的 70+ 模型(含 OpenAI/Anthropic/阿里云/字节跳动/MiniMax 等),支持自动故障转移和成本监控;(2) Email Service 公测——为 AI Agent 提供原生邮件收发能力,Agent SDK 内置 onEmail 钩子,支持 MCP 服务器。该举措将 Cloudflare 从 CDN 厂商进一步转型为 AI Agent 基础设施平台。
🔗 来源:Cloudflare Blog | HN 223▲ + 397▲
谷歌发布 Android CLI + AI 技能库,让 Agent 3 倍速开发安卓应用
谷歌推出升级版 Android CLI 和全新 Android Skills GitHub 仓库 + 知识库,专为 AI 编程 Agent 设计。官方宣称可让 Agent 编写安卓应用的速度提升 3 倍,支持 Claude Code、Cursor 等主流编程 Agent 直接调用。
🔗 来源:Google Blog | HN 89▲
Codex 自主入侵三星电视获取 Root 权限:AI 网络安全能力引关注
安全团队 Calif.io 与 OpenAI 合作发布研究报告:Codex 从浏览器应用的初始 shell 出发,自主完成了枚举目标、审计驱动源码、验证内存原语、适配执行限制等全流程,最终在真实三星电视上获得 root 权限。整个过程无需人工提供漏洞或利用方案,展示了 AI Agent 在硬件安全研究中的惊人自主能力。
🔗 来源:Calif.io Blog | HN 201▲
活动与行业
白宫据报正准备获取 Anthropic Mythos 模型访问权限
据 The Verge 报道,白宫正在准备获取 Anthropic 最强模型 Mythos Preview 的访问权限。此前 Mythos 仅对 NVIDIA、Apple、JPMorgan Chase 等少数大企业开放,主要用于发现高风险网络安全漏洞。政府的介入标志着 AI 最先进能力正从商业领域向国家安全领域加速扩散。
🔗 来源:The Verge
数据中心提案追踪器上线:已覆盖全美 18 个州
一个免费的众包追踪网站 trackdatacenters.com 上线,提供全美最全面的数据中心建设提案追踪服务,目前覆盖 18 个州,数据来自公开来源。同时,美国能源信息署(EIA)计划对数据中心启动"强制性"能源使用调查,从德州、华盛顿州等数据中心密集区域开始。
🔗 来源:The Verge / Track Data Centers
大佬言论
英伟达 CEO 黄仁勋
"训练 Anthropic Mythos 模型所需算力'相当普通'且'在中国大量可得',美国出口管制难以真正限制中国 AI 发展。我们必须达成一致,明确哪些用途是不能用 AI 去做的。"
黄仁勋指出,Mythos仅用“相当普通且规模有限”的算力训练而成,训练这种模型所需的算力规模与类型在中国都极为充足。他认为,中国是全球第二大算力计算市场,即便面临美国出口管制,也可凭借丰富能源供应与成熟制程芯片堆叠,达到训练此类模型的算力门槛。
🔗 来源:IT之家 / 彭博社
aphyr(知名分布式系统专家 Kyle Kingsbury)
"一切的未来都是谎言"——AI 时代的信任危机。长文探讨 AI 生成内容泛滥对信息真实性的冲击,文章在 HN 上获得 478 分和 510 条评论,引发技术社区关于"后真相 AI 时代"信任体系崩塌的广泛讨论。
🔗 来源:aphyr.com | HN 478▲
antirez(Redis 之父)
AI 网络安全不是工作量证明,不应将 AI 安全能力等同于"工作量证明",需要更审慎地思考 AI 自动化安全工具的治理框架。
🔗 来源:antirez.com | HN 192▲
GitHub 热门项目
用胶带、旧摄像头和 CNC 机床搭建的 AI 驱动硬件黑客机械臂,"赛博朋克"风格项目让 AI Agent 能够自主操作物理硬件进行安全测试
在 HN 上引发热烈讨论,展示了 AI 与物理世界交互的全新可能性
🔗 来源:GitHub | HN
一款轻量级 Markdown 查看器,专为 AI 编程 Agent 设计。支持实时预览 Agent 生成的 Markdown 输出,填补了 Agent 工作流中文档预览的空白
🔗 来源:GitHub | HN
Cloudflare 开源的 Artifacts 系统,为 AI Agent 提供原生 Git 协议的版本化存储方案
Agent 可以像使用 Git 一样管理和追踪文件变更,是构建有状态 Agent 的关键基础设施
🔗 来源:Cloudflare Blog | HN
每日 Paper 精选
🧠 TREX: 用 Agent 驱动的树搜索自动化 LLM 微调全流程
🔗 论文链接:arXiv:2604.14116🔬 核心创新
提出双 Agent 协作架构:Researcher 负责调研和策略制定,Executor 负责数据准备和训练执行
将多轮实验过程建模为搜索树,高效复用历史结果并提炼高层洞察
构建 FT-Bench 基准(10 个真实场景任务),从基础能力优化到领域专用任务
🌈 通俗解读
想象你有一个 AI 实习生,你只需说"帮我微调一个擅长金融分析的模型",它就会自己去读论文、找数据、设计训练方案、跑实验、对比结果,然后把最优模型交给你——TREX 就是这样一个系统。
❓ 为什么值得关注
LLM 微调目前仍是一项高度依赖专家经验的工作。TREX 将搜索树与多 Agent 协作结合,展示了"AI 训练 AI"的可行路径。如果这一范式成熟,将极大降低定制化 AI 模型的门槛。
👆 觉得有用?点赞 + 在看 支持一下 👆
每天 更新,陪你追踪 AI 最前沿 🚀
想看更多精彩内容?
扫描下方二维码加入群聊

@本文为AI洞察局原创内容
未经授权, 禁止转载
进群、转载或商务合作联系后台
— 完 —


夜雨聆风