AI Daily Brief
2026年4月21日 · 周二
Kimi K2.6开源1T参数MoE模型支持300个子Agent协同;GitHub因AI代理算力成本失控暂停Copilot新注册;Recursive Superintelligence成立四个月获5亿美元融资估值40亿
Today’s Highlights
| 1 |
Moonshot AI开源Kimi K2.6,支持300个子Agent协同与1万亿参数MoE架构 |
| 2 |
阿里发布Qwen3.6-Max-Preview,六项编程基准均登顶 |
| 3 |
GitHub暂停Copilot新用户注册,AI代理工作流致算力成本失控 |
| 4 |
Recursive Superintelligence获5亿美元融资估值40亿,押注AI递归自我改进 |
| 5 |
英伟达发布Nemotron 3 Super,1200亿参数AI代理专用开放MoE模型 |
| 6 |
Vercel因员工授权第三方AI工具遭入侵,黑客索价200万美元 |
| 7 |
英伟达因显存短缺取消2026全年消费级显卡发布,RTX 50系延期至Q3 |
| 8 |
OpenAI推出Codex Chronicle功能,通过屏幕截图构建开发上下文记忆 |
| 9 |
月之暗面与清华提出PrfaaS跨数据中心推理架构,吞吐量提升54% |
| 1 |
Moonshot AI开源Kimi K2.6,支持300个子Agent协同与1万亿参数MoE架构 |
| 开源模型智能体 |
| 月之暗面发布并开源Kimi K2.6多模态模型,采用1万亿参数MoE架构(激活32B),支持256K上下文,原生支持图片和视频输入。核心亮点为智能体集群能力,可协调最多300个子Agent执行4000步复杂任务,支持13小时不间断编程。在SWE-Bench Verified上达80.2%,MCPMark从K2.5的29.5提升至55.9。API输入价格约0.95美元/百万token,采用Modified MIT许可证开源,支持vLLM、SGLang等多种部署方式,消费级RTX 4090亦可运行。多个应用已集成该模型,日均调用量达数十亿token。 |
|
| 2 |
阿里发布Qwen3.6-Max-Preview,六项编程基准均登顶 |
| 大模型编程 |
| 阿里通义千问发布旗舰模型预览版Qwen3.6-Max-Preview,在智能体编程、世界知识和指令遵循方面较前代Qwen3.6-Plus显著提升。在SWE-bench Pro、Terminal-Bench 2.0、SkillsBench等六项编程基准中均取得最高分,其中SkillsBench提升9.9、SciCode提升10.8。世界知识方面SuperGPQA提升2.3,QwenChineseBench提升5.3。据ArtificialAnalysis评测,综合表现优于GLM5.1和MiniMax-M2.7,成为当前最强国产大模型。已在Qwen Studio开放使用,即将通过阿里云百炼API提供,兼容OpenAI和Anthropic协议。 |
|
| 3 |
GitHub暂停Copilot新用户注册,AI代理工作流致算力成本失控 |
| 开发工具商业模式 |
| GitHub于4月20日宣布暂停Copilot Pro、Pro+和学生计划的新用户注册,原因是AI代理驱动的长时间并行化任务导致单次请求计算成本超过用户月费。同时收紧使用限制:Pro计划移除Opus模型访问权限,仅Pro+可使用Opus 4.7;Pro+限额为Pro的5倍以上;Opus 4.5和4.6也将从Pro+中移除。GitHub将在VS Code和CLI中加入用量可视化提示,受影响用户可在5月20日前申请退款。此次调整反映出AI编程助手从辅助补全向自主代理演进过程中,行业普遍面临的算力成本与订阅收入失衡问题。 |
|
| 4 |
Recursive Superintelligence获5亿美元融资估值40亿,押注AI递归自我改进 |
| 融资AGI |
| Recursive Superintelligence完成5亿美元融资,由谷歌风投GV和英伟达联合领投,估值达40亿美元。公司由前Google DeepMind和OpenAI工程师创立,致力于构建可自主设计、测试和优化自身代码与架构的AI系统,目标将模型迭代周期从数月缩短至数小时。资金将用于招募顶尖人才及建设大规模计算集群,计划年内启动首次”Level 1″自主训练运行。值得注意的是,公司成立仅四个月、尚未推出任何产品即获得高额估值,引发外界对AI领域资本泡沫的担忧。 |
|
| 5 |
英伟达发布Nemotron 3 Super,1200亿参数AI代理专用开放MoE模型 |
| 开源模型AI代理 |
| 英伟达发布Nemotron 3 Super,一款专为AI代理工作负载设计的1200亿参数开放混合专家模型。该模型采用MoE架构,每次前向传播仅激活127亿参数,可在大幅降低计算成本的同时提供高达7.5倍的性能提升。其开放特性允许开发者在多种场景中部署,包括智能合约安全审计和去中心化预测市场等。此次发布标志着英伟达在AI模型层面进一步布局,从硬件供应商向软硬件一体化生态扩展。 |
|
| 6 |
Vercel因员工授权第三方AI工具遭入侵,黑客索价200万美元 |
| 安全事件供应链安全 |
| AI云平台Vercel确认发生安全事件,起因是一名员工使用的第三方AI工具Context.ai遭到攻击,黑客通过接管该员工Google Workspace账户获取了对Vercel有限内部系统的访问权限,暴露了部分非敏感环境变量。威胁组织ShinyHunters声称对此负责,正以200万美元价格兜售窃取的数据,包括内部数据库、员工账户和令牌。Vercel已联系执法部门,并建议客户轮换凭证、审查集成配置。此事件凸显了企业环境中不当配置AI工具访问权限带来的供应链安全风险。 |
|
| 7 |
英伟达因显存短缺取消2026全年消费级显卡发布,RTX 50系延期至Q3 |
| 芯片供应链 |
| 受全球存储芯片供应紧张影响,英伟达宣布取消2026全年消费级显卡发布计划,为公司创立以来首次全年无新品。RTX 50 Super系列虽已完成设计,但因显存资源优先供给AI加速器,生产优先级自2025年12月被下调,游戏显卡传统显存供应整体产能或削减最高40%。发布时间推迟至2026年Q3,但能否如期上市仍存变数。旗舰RTX 5090D v2中国建议零售价16499元起,海外部分型号售价超3000美元。若新卡未能年内上市,玩家将面临长达两年的新品空档期。 |
|
| 8 |
OpenAI推出Codex Chronicle功能,通过屏幕截图构建开发上下文记忆 |
| 开发工具产品发布 |
| OpenAI为Mac版Codex桌面应用推出Chronicle功能,通过后台代理捕获屏幕截图构建本地化记忆,使Codex能理解用户所指的具体内容,如屏幕上的错误信息、正在编辑的文档或过去处理过的项目。数据临时存储于设备本地,用户可随时查看和编辑。该功能目前仅面向Mac Pro订阅用户开放,作为研究预览版提供,需授予屏幕录制与辅助功能权限。OpenAI提醒该功能会快速消耗API调用额度,且其他应用程序可能访问临时存储的截图文件,存在隐私考量。 |
|
| 9 |
月之暗面与清华提出PrfaaS跨数据中心推理架构,吞吐量提升54% |
| 基础设施研究 |
| 月之暗面与清华大学联合提出Prefill-as-a-Service(PrfaaS)架构,将LLM推理中计算密集的预填充阶段卸载至专用高算力集群,通过普通以太网将KVCache传输至本地解码集群,突破传统RDMA网络限制。得益于混合注意力模型的KVCache压缩(最高36倍),跨数据中心传输成为可行。在使用内部1T参数模型的实测中,PrfaaS较同构基线实现54%吞吐量提升,P90首token延迟降低64%,仅消耗13%可用带宽。该架构结合请求长度路由、分层调度和多连接TCP传输,为大规模LLM服务提供新的基础设施思路。 |
AI Daily Brief
最新、最快、最有价值的 AI 资讯每天只需几分钟,紧跟全球智能浪潮
AIDailyBrief.cn
点击下方查看原文,获取更多 AI 资讯