乐于分享
好东西不私藏

AI日报 | DeepSeek V4开源逆袭,Anthropic年营收突破300亿,Coding Agent全面接管开发流程

AI日报 | DeepSeek V4开源逆袭,Anthropic年营收突破300亿,Coding Agent全面接管开发流程

DeepSeek开源了1.6万亿参数的V4模型,Anthropic年营收突破300亿,Google掏出第八代TPU——今天的AI世界,三条赛道同时加速。

DeepSeek在4月正式发布了V4系列开源模型,包含旗舰版V4-Pro(1.6万亿总参数/490亿激活参数)和轻量版V4-Flash(2840亿总参数/130亿激活参数),均支持100万token上下文窗口。

技术亮点在于其混合注意力机制——结合压缩稀疏注意力(CSA)和重度压缩注意力(HCA),将KV cache内存需求相比上一代降低了90%。在推理、编码和Agent任务的基准测试中,V4-Pro已逼近GPT-5.2和Gemini 3.0 Pro的水平。

这对开发者意味着什么?开源社区终于有了一个在Agent场景下真正能打的大模型。V4-Flash的极低API定价更是直接把推理成本打到了地板价。模型权重已上线Hugging Face,想玩的可以直接下载。

Anthropic营收飙至300亿美元,Claude Design正式亮相

Anthropic的年化营收已突破300亿美元,相比2025年底的约90亿实现了3倍多增长。驱动力来自企业、开发者和消费者三端对Claude的强劲需求。

产品层面有两个重要动作:一是发布了Claude Opus 4.7,在编码、Agent、视觉和多步骤任务上全面提升;二是推出Claude Design——一个面向视觉创作的新产品,支持设计稿、原型和幻灯片的协作制作。

值得一提的是,Anthropic本月还经历了一次”小风波”:曾短暂取消Pro订阅用户对Claude Code的访问权限,24小时内紧急恢复并向用户道歉。公司后来澄清,此前用户感知到的”模型变笨”问题并非模型权重退化,而是缓存逻辑bug和系统提示词限制导致的——已通过内部dogfooding和增强评估套件修复。

Google发布第八代TPU,企业级Agent平台亮相

在Google Cloud Next 2026上,Google一口气放出了几个大招:

第八代TPU分为训练版TPU 8t和推理版TPU 8i,后者专门针对推理和强化学习优化,性能较上代有显著提升。这意味着大模型训练和部署的基础设施成本将进一步下降。

Gemini Enterprise Agent Platform是一个覆盖构建、扩展、治理、优化全链条的企业Agent平台,配套7.5亿美元合作伙伴基金,联合德勤、埃森哲等咨询巨头推广。Google还预告了Gemini Nano 4,分Fast和Full两个版本,速度提升3倍,瞄准Android端侧AI。

另外,Workspace Intelligence系统会利用用户的整个Workspace历史(Docs、Sheets、Gmail、Drive等),在用户授权下自动完成跨应用任务。这可能是Google今年最有实用价值的AI功能。

AI Coding Agent格局剧变:从辅助到接管

2026年的AI编程工具生态已经发生了质变——90%的开发者日常使用至少一种AI编程工具。几个关键变化:

Cursor 3在4月发布了”Agents Window”功能,支持同时运行多个AI Agent并行处理不同环境的任务,理念是”开发者做架构师,Agent做建筑工”。

GitHub Copilot在2月引入Claude和Codex作为后端,变成了多模型平台,市场份额稳居42%。

Claude Code凭借Opus 4.7的100万token上下文,已能理解整个代码库、管理Git工作流、跨文件重构——真正意义上的”全栈AI工程师”。

趋势非常明确:开发者的角色正从”写代码”转向”编排Agent”。多Agent并行协作、CLI异步后台Agent、MCP(Model Context Protocol)开放标准——这些不再是概念,而是日常工作流。预计到2026年底,高AI采纳率组织中超过50%的代码将由AI生成。

OpenAI备战IPO,月营收突破20亿美元

OpenAI正在为IPO做准备,目前月营收已达20亿美元。战略上有明显收缩:关停了视频生成应用Sora和情色聊天机器人等高成本项目,全力聚焦ChatGPT的生产力工具和企业集成。

产品方面,GPT-5.5正式发布并驱动Codex(其Agent编程平台),在NVIDIA基础设施上运行。OpenAI称每周有超过400万开发者使用Codex,调试周期从天级缩短到小时级。此外还发布了Privacy Filter——一个开源的PII检测和脱敏模型,在数据安全领域开辟了新方向。

122亿美元的新一轮融资也已完成,投资者信心充足。但能否在IPO前讲好”不只是聊天机器人”的故事,是OpenAI接下来的核心挑战。

英国AI能耗预测内部”打架”,差了10倍

英国政府内部出现了一个有意思的分歧:科技部(DSIT)预测AI数据中心到2030年将消耗6GW电力,而能源部(DESNZ)的预测仅为0.6GW——差了整整10倍。

这个分歧不是小事。6GW意味着AI数据中心的电力消耗将占英国总发电量的相当比例,直接冲击净零排放目标。如果科技部的预测更准确,那英国(以及全球)的能源规划都需要大幅调整。

对开发者的启示:AI推理的能效优化不只是学术问题,而是关乎整个行业可持续发展的底线。DeepSeek V4那个”KV cache降90%”的数字,放在这个背景下就更有价值了。

首届世界AI电影节在戛纳举办

首届世界AI电影节(WAIFF)在戛纳举行,展映了一批AI生成的电影作品。与此同时,传统戛纳电影节已明确禁止AI技术参与金棕榈奖竞赛。

两件事放在一起看很有意思:一边是新技术在建立自己的评价体系,一边是传统行业在划定边界。AI内容创作的”合法性”之争,2026年还远未结束。


以上就是今天的AI日报。一句话总结:开源模型在追赶闭源,Agent在接管编程,算力军备竞赛让能源规划都跟不上节奏。这个行业,依然在指数级加速关注。

「子辰的笔记」,每日速递AI前沿动态。