乐于分享
好东西不私藏

【南楂AI早报】2026年4月28日

【南楂AI早报】2026年4月28日

【南楂AI早报】2026年4月28日

让AI不再高深,让生活更有温度

📰 头条速递

【DeepSeek V4 发布:百万上下文标配,价格暴降90%】

4月24日,DeepSeek V4 正式发布并开源,同日华为云全球首发适配。这是中国AI发展的一个重要节点。

技术层面,V4 支持百万级上下文窗口,在算法上采用 MoE 路线——每层384个专家,每次仅激活6个,通过极细粒度的专家分割和智能路由,让用户在无需为”沉睡”参数买单的情况下,获得万亿参数级别的能力。价格方面,V4-Flash 输入(缓存命中)打到 0.2 元/百万 tokens,V4-Pro 限时优惠低至 0.025 元/百万 tokens,较前代暴降90%。

更值得关注的是生态层面的深度整合。V4 在华为昇腾芯片上完成了从 CUDA 到 CANN 框架的完整迁移,从算子库到通信原语到内存管理全部重写。金山办公、360 等企业 Day 0 即完成接入。这标志着国产算力正式支撑起万亿级大模型的工程化落地。

DeepSeek V4 技术报告中还埋了一个彩蛋:训练方案引入了 Muon 优化器——这正是上个月 Kimi K2 率先在大模型训练中验证的技术。Kimi K2 的底层架构则采用了 DeepSeek-V3 提出的 MLA。梁文锋和杨植麟,两人技术底座早已互相嵌入,形成了中国AI圈独特的竞合生态。

👉 南楂: DeepSeek V4 + 华为云 = 中国算力、中国模型、中国节奏。这次不是对标,是领跑。

【马斯克对阵奥尔特曼:AI时代最重磅法律战开打】

这周最大的新闻,是一场即将在加利福尼亚州奥克兰市联邦法院正式开审的诉讼——马斯克诉 OpenAI,其核心是指控 OpenAI 背弃创始使命、违背创建协议。

马斯克要求法院作出严厉裁决:索赔金额 1500 亿美元;同时要求剥夺奥尔特曼与另一位联合创始人格雷格·布罗克曼的管理层职务,并强制 OpenAI 恢复完全非营利属性。

这场纠纷的背景值得细读:OpenAI 当年由非营利研究实验室起步,如今已是一家估值 7300 亿美元的行业巨头。而马斯克本人在离开 OpenAI 后,于 2023 年创立 xAI,其聊天机器人 Grok 已进入市场,并与 SpaceX、Starlink 等业务形成生态联动。这场诉讼的本质,是两个路线之争:AGI 是否应该开放,还是成为商业护城河。

👉 南楂: 这场官司的判决结果,将决定整个AI行业的游戏规则走向。无论谁赢,开放 vs 封闭的路线之争,已经没有退路可言。

🔬 技术前沿

Vision Banana:谷歌+何恺明,用”生成”统一所有视觉任务

谷歌联合 ResNet 作者何恺明等人发布了 Vision Banana(arxiv.org/abs/2604.20329),提出一个反直觉的发现:强大的生成能力,能反哺理解精度。传统观点认为,理解和生成是两种截然不同的能力,但 Vision Banana 证明了——像素级别的生成,就是视觉理解的最终形态。

它的逻辑很直接:不管问什么视觉问题,答案都是一张图。目标检测靠生成一张标注了框的图,语义分割靠生成一张涂了颜色的图,场景描述?还是生成图。这打破了”万能工具不如专用工具”的诅咒——Vision Banana 在生成和理解两个方向上同时达到了 SOTA。

背后的技术机制很克制:基于 Nano Banana Pro,仅通过极低比例的数据混入进行指令微调,既没有洗掉模型的”生成本性”,又成功将生成式表征对齐到真实物理世界。

👉 南楂: Generation Is All You Need继 Attention Is All You Need 之后,视觉领域的”哥白尼革命”来了。

HY-SOAR:腾讯混元让扩散模型学会自我纠偏

腾讯混元团队发布 HY-SOAR,一种面向扩散模型的数据驱动后训练方法。核心创新在于:SOAR 不依赖奖励模型、不用偏好标注、不靠负样本,直接从训练数据中挖掘轨迹级纠正信号,让模型在生成过程中学会自我反思和纠偏。

现有扩散模型后训练主流路线 SFT 只学”标准答案”,不学”改错”;RL 则是把信息”压缩丢了”——将轨迹级信息压缩成终端打分,大量可用于纠偏的中间步骤信号在转化中丢失。SOAR 的方案从同一份数据中同时提取”标准答案”和”纠偏信号”,实现更高的数据利用率。

初步测试显示,基于 SD3.5-Medium、286K 图文样本训练,不使用任何奖励标注,SOAR 在 GenEval、OCR、DrawBench 等所有报告指标上均优于 SFT,甚至优于用奖励模型做 RL 的 Flow-GRPO。

👉 南楂: 视觉生成模型的”o1时刻”来了——从被动执行指令,到主动审视和纠正自身行为。

Qwen3.6-27B 开源:27B 参数秒了自家 397B 旗舰

阿里发布 Qwen3.6-27B 开源模型,在智能体编程任务上实现了对自家更大旗舰模型的全面超越。27B 的参数规模,却能在实际任务中超越 397B 的旗舰级模型,MoE 架构的效率优势再次体现。

这与近期 Kimi K2.6、DeepSeek V4 形成了一个清晰的行业趋势:大参数不等于高性能,架构创新和激活效率才是关键。

👉 南楂: 阿里和 DeepSeek 的开源竞争,让”参数即正义”的时代彻底结束了。

🚀 产品动态

• Soul 推出 AI 语音创作平台”Audio Factory”:Soul 上线 Audio Factory,支持用户通过 AI 技术进行语音创作和编辑,降低播客、有声内容生产的门槛。

• 哈啰切入 AI 面试赛道,推出”HiOffers AI”:哈啰在出行主业之外延伸至 AI 招聘赛道,HiOffers AI 主要面向蓝领和灵活用工场景,提供 AI 模拟面试、简历优化等服务。

• 三星 Galaxy Glasses 外观曝光:搭载骁龙 AR1 处理器,无屏设计,主要功能集中在音频和语音交互上,智能眼镜产品线进一步清晰。

• 小米全新具身机器人亮相投资日:小米在投资者日活动上展示新款具身机器人,手部分发纸袋动作流畅,整体延续了 2022 年 CyberOne”铁大”的设计语言。官方尚未公布具体技术细节。

• 墨甲机器人完成 110 台交付、1030 台签约:墨甲机器人(尹同跃/奇瑞系)完成规模化交付里程碑,具身智能商业化落地持续推进。

💰 融资快讯

无界动力 | 天使 | 完成天使++轮融资,天使轮累计融资超 2 | 完成天使++轮融资,天使轮累计融资超 2 亿美元,由远景科技集团、北京市人工智能产业投资基金联合投资,老股东红杉中国、线性资本、高瓴创投等跟投。同时与远景科技签署超 5 亿元全球市场订单,覆盖欧洲、亚洲多个国家,涉及风光储及 AIDC 场景智能化升级。这是具身智能赛道迄今规模最大的单笔海外商业合同。

沐听 Mooting | 面向全球职场听障人群的 AI 字幕眼镜团 | 面向全球职场听障人群的 AI 字幕眼镜团队,完成产业方种子轮融资。5 人团队,2026 年 1 月正式启动。创始人兼具李泽湘体系(硬科技源头创新)和追觅体系(供应链快速落地)双重背景,产品端侧运行,延迟控制在 600ms 以内,不依赖网络也不收订阅费。

⚡ 一句话快讯(共9条)

**腾讯混元 Hy3 preview 发布**:姚顺雨主导,295B 总参数/21B 激活参数,快慢思考融合 MoE 架构,编程基准 SWE-Bench Verified 得分 74.4%。

**谷歌第八代 TPU 双舰齐发**:主打终结 AI 推理延迟,让智能体真正实现随叫随到的大规模部署。

**OpenAI 发布 Privacy Filter**:1.5B 参数 PII 脱敏模型,Apache 2.0 开源。

**OpenAI 终止与微软独家合作**:为与亚马逊、谷歌达成协议铺平道路。

**清华丁宁成立”自然意志”**:通用物理智能公司,估值 40 亿。

**南非撤回首份国家 AI 政策草案**:因草案参考文献列表中含 AI 生成的虚构来源。

**强脑科技 CEO 韩璧丞**:希望把中国变成世界首个没有肢体残疾人的国家。

**YC 合伙人**:AI 时代一个人可以干掉一整支大型团队,Token 消耗量是新时代的核心指标。

**Meta 员工刷 token 冲榜**:内部”Claudeonomics”排行榜催生作弊机制,有员工一个月烧掉 200 万美元。

📚 每日一词

Agent Idle 率

这个词来自 Multica 创始人张佳圆。在他那间”4 个真人 + 十几个 AI Agent”的工作室里,他发现了一个反直觉的事实:Agent 大多数时候处于待机(Idle)状态——因为每个任务的最终决策权还在人手里,Agent 完成任务后必须等人来 review、给反馈,才能进入下一个循环。

张佳圆的判断是:在 AI Native 的组织形态里,”人”才是整个系统最慢的节点。Agent 可以 7×24 小时运行,可以并行处理数十个任务,但人类的注意力始终是瓶颈。

这让他得出了一个惊人的结论:衡量一个 AI Native 组织效率的核心指标,未来可能不是”有多少员工”,而是”Agent Idle 率”——Idle 率越低,说明这个组织把 Agent 的产能利用得越充分,也意味着它越”AI Native”。

这个概念的价值在于,它把组织效率从”人员规模”这个旧指标中解放出来。一个 5 人团队配合数十个高效运转的 Agent,可能比一个 50 人的传统团队产出更高。

反过来,它也暴露了当下 AI 应用的一个核心悖论:花大价钱买了 AI 工具,却没有改变工作流程——人还是用旧方式等待、判断、反馈,Agent 在一边空转。这不是 AI 的问题,是工作模式没有跟着变。

👉 南楂: Agent Idle 率,是 AI 时代第一个真正有意义的组织效率指标。如果你不知道自己团队的 Idle 率是多少,说明你还没有真正开始用 AI。


【信息来源】36氪 · 虎嗅 · 钛媒体 · 爱范儿 · 雷锋网【南楂AI早报】每日更新,用最接地气的方式解读AI资讯。