元以AI早报-2026年04月26日
1.翻完DeepSeek V4技术报告,我们发现了中国AI的惊人默契 2.谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了 3.与DeepSeek同日“上新”:美团万亿级参数大模型开放测试
元以AI早报
翻完DeepSeek V4技术报告,我们发现了中国AI的惊人默契
近期全球顶级大模型密集更新,国内AI圈也迎来热闹一周,Qwen、Kimi、小米、腾讯接连发布新模型,千呼万唤的DeepSeek V4双版本发布更是引发行业震动。目前国内已有DeepSeek和Kimi两家迈入万亿参数开源俱乐部,小米也预告将开源最新万亿模型。梳理技术路线不难发现,两家头部AI企业多次同期发布技术成果,形成了奇妙的行业默契:Kimi采用DeepSeek首创的MLA注意力机制,DeepSeek V4则引入Kimi大规模验证的Muon优化器,DeepSeek V4的mHC残差连接还将训练效率提升了约30%。两家双双开源,直接将企业私有化部署万亿参数模型的成本砍至原来的1/10,让中小企业也能在自有服务器运行大模型。国产芯片适配方面,DeepSeek V4首次深度适配华为昇腾,Kimi的跨异构硬件推理方案让吞吐量提升54%,首token延迟降低64%,这股来自中国的开源AI力量已经获得全球行业认可,不同于业内恶性竞争,两家技术互通共生,共同推动中国大模型产业快速进入新阶段。

信息来源:https://mp.weixin.qq.com/s/C9XNQIS1agIE77YJf1m1jA
谷歌Jeff Dean重磅论文:弹性大规模分布式预训练终于可行了
谷歌推出全新分布式训练技术Decoupled DiLoCo,Google DeepMind首席科学家Jeff Dean是作者之一,这项技术解决了超大规模AI预训练中长期存在的硬件容错难题,让14年前Jeff Dean提出的异步弹性训练理念终于落地为可行的工程方案。传统大规模训练采用同步SPMD方案,要求所有芯片步调一致,在百万级芯片规模下,硬件故障成为常态,即使搭配弹性机制,传统方案的有效计算利用率也仅为40%。Decoupled DiLoCo放弃全局强同步要求,将集群拆分为独立运行的学习器和轻量同步器,仅需满足最小法定数即可完成参数更新,还针对异构硬件设计了动态权重等优化机制。实验数据显示,在模拟240万块芯片、单芯片年均故障一次的场景下,Decoupled DiLoCo有效吞吐率可达88%,远高于传统方案的58%;带宽需求仅为传统方案的六十分之一,int4压缩后更是减少了两个数量级,同时模型质量几乎没有损失,还能高效整合跨地域零散异构算力,被认为将重新定义下一代超大规模模型训练的基础设施。

信息来源:https://mp.weixin.qq.com/s/VCtSLapQKucVpqlvJp-48g
与DeepSeek同日“上新”:美团万亿级参数大模型开放测试
4月24日,DeepSeek宣布全新V4大模型预览版上线开源,当日美团新一代基础大模型LongCat-2.0-Preview也同步开放测试,引发行业广泛关注。这款新模型总参数规模突破万亿,参数量与DeepSeek-V4基本一致,量级已经跻身全球顶尖大模型行列。该模型支持1M上下文窗口,可单次处理数百万字输入,处理量级等同于新发布的GPT-5.5,同时还面向Agent应用场景深度优化,能有效适配代码生成、复杂任务规划、企业自动化等各类生产场景。这款大模型训练推理全程依托国产算力集群完成,训练阶段共动用5万至6万张算力卡,是迄今为止国产算力上完成的规模最大的大模型训练任务,有效验证了国产算力生态的成熟度,标志着国产自主算力发展迈出关键一步。作为国内不含云业务的企业中AI投入规模最大的企业,美团一直坚持AI进攻策略,目前用户可通过官网longcat.ai申请测试,测试期每天提供1000万免费Token额度。
在OpenAI把Chronicle做成订阅功能48小时后,一群00后把它开源了
近日OpenAI推出了新功能Chronicle,核心能力是让AI可以直接查看用户屏幕,持续记住操作上下文,彻底改变了传统AI交互逻辑——用户写代码改文档时不用再反复向AI解释“这个”“上一步操作”,对话和协作效率得到大幅提升。但这项能力目前仅对每月付费100美元的ChatGPT Pro订阅用户开放,核心功能被挡在了付费墙之后。没想到仅过了48小时,由00后开发者组成的团队Vida就推出了同名开源项目OpenChronicle,项目上线后迅速引爆AI圈,9小时内相关讨论帖就超过了2000条。OpenChronicle不仅实现了Chronicle的看屏幕+持续记忆核心能力,还做出了突破性改进:支持完全本地运行、可对接任意AI模型包括本地模型、可被不同AI Agent共享调用,还实现了指代精准理解、跨会话记忆连续、适配用户行为习惯等实用能力,它的存储完全透明可控,数据都留在用户本地设备,将AI记忆拆解成了可复用的公共基础设施,也引发了行业对AI记忆控制权归属的新一轮讨论。

信息来源:https://mp.weixin.qq.com/s/yqmDsRCeZbBWMqM7oDa5qQ
谷歌豪掷400亿投死敌Anthropic!AI御三家格局终结,旧秩序洗牌
近期谷歌宣布向AI公司Anthropic投入最高400亿美元投资,其中100亿美元立即按Anthropic 3800亿美元的最新估值到账入股,剩余300亿美元绑定业绩里程碑达标后解锁,同时谷歌云还承诺未来五年向Anthropic交付5GW计算能力,支撑Anthropic的TPU使用规模指数级扩张。加上4天前亚马逊刚刚宣布对Anthropic追加50亿美元投资,总投资上限达250亿美元,Anthropic目前已经集齐硅谷四大顶级玩家成为股东,累计锁定超过11GW的算力,相当于10个核电站的发电量,这一规模和OpenAI计划多年落地的Stargate项目目标相当,但Anthropic短短一周就完成锁定。数据显示Anthropic年化收入仅用一年就从10亿美元暴涨至300亿美元,二级市场隐含估值已经超过1万亿美元,甚至压过OpenAI的AI业务估值。原本OpenAI、谷歌、Anthropic三足鼎立的AI第一格局已经变成Anthropic与OpenAI的两强对垒,AI竞赛已经从单点模型性能比拼转向现金、算力、生态的三线博弈,OpenAI的Stargate项目落地缓慢且存在资金缺口,目前正多方寻找新的资金与合作伙伴,处境越发微妙。

信息来源:https://mp.weixin.qq.com/s/mUDP1t3yVSwaPZg9SzdgGg
奇瑞汽车与火山引擎达成战略合作 豆包大模型全面赋能汽车智能化升级
4月24日,奇瑞汽车与字节跳动旗下云与AI服务平台火山引擎在北京签署战略合作协议,双方将围绕AI大模型、公有云开展专项合作,推动全域AI战略在车端体验、产业协同层面系统性落地。根据协议,火山引擎豆包大模型将全面融入奇瑞超级AI智能体“小奇同学”,提升语义理解、长时记忆与情感交互能力,适配奇瑞现有及未来全系车型;同时双方将在奇瑞“灵犀智舱”打通抖音、今日头条等字节系内容生态,实现千人千面的个性化体验。智能驾驶领域,火山引擎将助力奇瑞“猎鹰智驾”的智能辅助驾驶大模型研发,依托数据合规、成本控制等优势加速技术落地,双方还前瞻布局具身智能,探索车载机器人等未来人机交互新场景。产业端双方将探索AI硬件创新,挖掘售后增值价值,整合资源助力奇瑞智能化产品出海,同时火山引擎还将助力奇瑞提升研发、生产到运营的全链路效率。本次合作是汽车与互联网产业深度融合的典型范例,将推动中国汽车产业智能化、全球化发展。

信息来源:https://mp.weixin.qq.com/s/lQwltG7r1bvlZd3rC4gtQw
燃油车智能化新突破!全新奥迪Q5L全球首款搭载华为乾崑智驾
今年北京车展热度空前,两百余场新车发布会中,全球首款搭载华为乾崑智驾技术的豪华燃油SUV全新奥迪Q5L,意外成为新能源展馆里的关注度焦点。华为与一汽奥迪合作已经超过6年,为了适配奥迪家族式设计,双方打造了独具优势的双激光雷达方案,为实现无死角全天候稳定探测,整体试验标准超行业2倍;还专门为奥迪深度调校了VMM车辆运动管理系统,打通华为智能算法与奥迪原厂驾控质感,最终实现无高精地图也能支持城区、高速全场景领航辅助,覆盖通勤避让、自动泊车、高速巡航等各类日常出行痛点场景,选装方式简单便捷,全新奥迪Q5L全系车型都可选择加装华为乾崑智驾。这次合作更实现了颠覆性突破:支持燃油车辅助驾驶OTA升级,让燃油车也能实现能力持续进化、常用常新。目前全新奥迪Q5L已经开放华为乾崑智驾选装包的体验与预订,5月即可到店试驾,为燃油车智能化探索出了全新路径。

信息来源:https://mp.weixin.qq.com/s/Z1ydZoj2DYHNIdejTzB4-w
华为 Pura X Max 深度体验:比起「阔折」,「小艺伴随式AI」更惊艳
上一代华为Pura X凭借√2:1比例的舒适内屏大获成功,年销量达150万台,但也留下了核心痛点:内屏体验太优秀,让不少用户干脆把手机锁在展开状态,外屏几乎成了摆设。Pura X Max正是为解决这个问题而来,它重新定义了折叠屏的双形态:合盖后是5.4英寸的单手握手机,日常通勤刷内容、读长文都舒适,实测日常外屏使用占比超过80%;展开后是7.7英寸√2:1比例的内屏,尺寸接近iPad mini,足以胜任小平板的生产力需求,分屏操作、剪视频都能流畅完成,真正让内外屏各有独立价值,不再互相替代。除此之外,Pura X Max还是业内首款不需要“召唤”AI的折叠屏,小艺伴随式AI常驻右侧侧边栏,不用唤醒就能随时辅助查资料、整理信息,彻底改变了手机AI的交互逻辑。影像方面它也拉满配置,第二代红枫影像搭载5000万像素十档可变光圈主摄,还有5000万像素3.5倍潜望长焦,成像素质远超同类型折叠屏。本文也客观提到产品不足,比如外屏偏宽手小用户操作不便、相机模组凸起明显、续航没有富余,整体是折叠屏新品类的成功探索。

信息来源:https://mp.weixin.qq.com/s/o876HXNhHNjiT7JD2lFBBw
全国首个“环境-糖尿病大模型”在榕发布 开启代谢慢病智能防控新纪元
4月25日,由福州大学附属省立医院、北京大学医学部、中国科学院软件研究所联合研发的我国首个“环境-糖尿病大模型(EMI)”在福州正式发布,该项目受国家科技重大专项资助,是国内首个将多维环境暴露数据与临床诊疗信息整合、覆盖医院-社区-公众全链条的糖尿病智能防控体系,推动代谢慢病管理向“生态·生命·智能”融合转型。当前全球糖尿病负担持续加重,据国际糖尿病联盟数据,2024年全球成年糖尿病患者已达5.89亿,预计2050年将增至8.53亿,我国是全球糖尿病患者人数最多的国家之一,传统以临床诊疗为中心的模式已无法满足早识别、早干预的防控需求。该模型分为三大核心板块,医院端临床分级准确率达92.15%,性能较国内外同类模型提升15%以上;社区端发病风险判别能力达0.851,响应时间小于30秒,可明确风险来源给出干预方案;公众端可提供专业通俗的健康科普问答,真正实现从单一治病到全链条健康管理的跨越。

信息来源:https://mp.weixin.qq.com/s/krf-4DnV7e8EbTQYjXVs5w
七款大模型防骗实测:年化40%的骗局面前,AI比人类更清醒
近年来大模型“谄媚迎合”的问题引发全行业担忧,不少人担心AI会顺着用户的错误观点说话,哪怕用户即将掉进投资诈骗的陷阱。南洋理工大学行为科学家专门开展了一项严格的预注册对照实验,测试7款主流大模型和1201名人类在投资诈骗识别中的表现,实验覆盖从合法低风险投资到明确欺诈的12个不同风险场景,还模拟了用户热情推荐、朋友背书、已走流程等真实施压情境。实验得出的核心数据出人意料:七款大模型对各类欺诈投资的认可率为实打实的0%,哪怕用户持续施压,AI的预警强度不仅没有下降,还略有上升;而人类顾问首次咨询就有13%-14%的概率认可欺诈项目,用户表现出强烈投资意愿时,人类压制欺诈警告的概率是AI的2-4倍,还有近三成人类会干脆摆烂给出无效回复。即便不同模型抗压力存在差异,AI彻底放弃警告转为推荐诈骗的概率也不到千分之三。专家指出,投资诈骗有明确的客观判断标准,AI的安全对齐规则把“不骗人”放在“顺用户心意”前面,反而比受人情压力影响的人类更敢说不,做投资风险咨询时不妨多问问AI。

信息来源:https://mp.weixin.qq.com/s/hC3ZfUkOjRnj6OWuWohlgA
早报内容及素材均来自网络公开渠道,版权归原作者所有,仅作信息分享使用。
—— END ——
夜雨聆风