【南楂AI早报】2026年4月28日-夜雨聆风

【南楂AI早报】2026年4月28日

让AI不再高深，让生活更有温度

📰 头条速递

【DeepSeek V4 发布：百万上下文标配，价格暴降90%】

4月24日，DeepSeek V4 正式发布并开源，同日华为云全球首发适配。这是中国AI发展的一个重要节点。

技术层面，V4 支持百万级上下文窗口，在算法上采用 MoE 路线——每层384个专家，每次仅激活6个，通过极细粒度的专家分割和智能路由，让用户在无需为”沉睡”参数买单的情况下，获得万亿参数级别的能力。价格方面，V4-Flash 输入（缓存命中）打到 0.2 元/百万 tokens，V4-Pro 限时优惠低至 0.025 元/百万 tokens，较前代暴降90%。

更值得关注的是生态层面的深度整合。V4 在华为昇腾芯片上完成了从 CUDA 到 CANN 框架的完整迁移，从算子库到通信原语到内存管理全部重写。金山办公、360 等企业 Day 0 即完成接入。这标志着国产算力正式支撑起万亿级大模型的工程化落地。

DeepSeek V4 技术报告中还埋了一个彩蛋：训练方案引入了 Muon 优化器——这正是上个月 Kimi K2 率先在大模型训练中验证的技术。Kimi K2 的底层架构则采用了 DeepSeek-V3 提出的 MLA。梁文锋和杨植麟，两人技术底座早已互相嵌入，形成了中国AI圈独特的竞合生态。

👉 南楂： DeepSeek V4 + 华为云 = 中国算力、中国模型、中国节奏。这次不是对标，是领跑。

【马斯克对阵奥尔特曼：AI时代最重磅法律战开打】

这周最大的新闻，是一场即将在加利福尼亚州奥克兰市联邦法院正式开审的诉讼——马斯克诉 OpenAI，其核心是指控 OpenAI 背弃创始使命、违背创建协议。

马斯克要求法院作出严厉裁决：索赔金额 1500 亿美元；同时要求剥夺奥尔特曼与另一位联合创始人格雷格·布罗克曼的管理层职务，并强制 OpenAI 恢复完全非营利属性。

这场纠纷的背景值得细读：OpenAI 当年由非营利研究实验室起步，如今已是一家估值 7300 亿美元的行业巨头。而马斯克本人在离开 OpenAI 后，于 2023 年创立 xAI，其聊天机器人 Grok 已进入市场，并与 SpaceX、Starlink 等业务形成生态联动。这场诉讼的本质，是两个路线之争：AGI 是否应该开放，还是成为商业护城河。

👉 南楂： 这场官司的判决结果，将决定整个AI行业的游戏规则走向。无论谁赢，开放 vs 封闭的路线之争，已经没有退路可言。

🔬 技术前沿

Vision Banana：谷歌+何恺明，用”生成”统一所有视觉任务

谷歌联合 ResNet 作者何恺明等人发布了 Vision Banana（arxiv.org/abs/2604.20329），提出一个反直觉的发现：强大的生成能力，能反哺理解精度。传统观点认为，理解和生成是两种截然不同的能力，但 Vision Banana 证明了——像素级别的生成，就是视觉理解的最终形态。

它的逻辑很直接：不管问什么视觉问题，答案都是一张图。目标检测靠生成一张标注了框的图，语义分割靠生成一张涂了颜色的图，场景描述？还是生成图。这打破了”万能工具不如专用工具”的诅咒——Vision Banana 在生成和理解两个方向上同时达到了 SOTA。

背后的技术机制很克制：基于 Nano Banana Pro，仅通过极低比例的数据混入进行指令微调，既没有洗掉模型的”生成本性”，又成功将生成式表征对齐到真实物理世界。

👉 南楂： Generation Is All You Need继 Attention Is All You Need 之后，视觉领域的”哥白尼革命”来了。

HY-SOAR：腾讯混元让扩散模型学会自我纠偏

腾讯混元团队发布 HY-SOAR，一种面向扩散模型的数据驱动后训练方法。核心创新在于：SOAR 不依赖奖励模型、不用偏好标注、不靠负样本，直接从训练数据中挖掘轨迹级纠正信号，让模型在生成过程中学会自我反思和纠偏。

现有扩散模型后训练主流路线 SFT 只学”标准答案”，不学”改错”；RL 则是把信息”压缩丢了”——将轨迹级信息压缩成终端打分，大量可用于纠偏的中间步骤信号在转化中丢失。SOAR 的方案从同一份数据中同时提取”标准答案”和”纠偏信号”，实现更高的数据利用率。

初步测试显示，基于 SD3.5-Medium、286K 图文样本训练，不使用任何奖励标注，SOAR 在 GenEval、OCR、DrawBench 等所有报告指标上均优于 SFT，甚至优于用奖励模型做 RL 的 Flow-GRPO。

👉 南楂： 视觉生成模型的”o1时刻”来了——从被动执行指令，到主动审视和纠正自身行为。

Qwen3.6-27B 开源：27B 参数秒了自家 397B 旗舰

阿里发布 Qwen3.6-27B 开源模型，在智能体编程任务上实现了对自家更大旗舰模型的全面超越。27B 的参数规模，却能在实际任务中超越 397B 的旗舰级模型，MoE 架构的效率优势再次体现。

这与近期 Kimi K2.6、DeepSeek V4 形成了一个清晰的行业趋势：大参数不等于高性能，架构创新和激活效率才是关键。

👉 南楂： 阿里和 DeepSeek 的开源竞争，让”参数即正义”的时代彻底结束了。

🚀 产品动态

• Soul 推出 AI 语音创作平台”Audio Factory”：Soul 上线 Audio Factory，支持用户通过 AI 技术进行语音创作和编辑，降低播客、有声内容生产的门槛。

• 哈啰切入 AI 面试赛道，推出”HiOffers AI”：哈啰在出行主业之外延伸至 AI 招聘赛道，HiOffers AI 主要面向蓝领和灵活用工场景，提供 AI 模拟面试、简历优化等服务。

• 三星 Galaxy Glasses 外观曝光：搭载骁龙 AR1 处理器，无屏设计，主要功能集中在音频和语音交互上，智能眼镜产品线进一步清晰。

• 小米全新具身机器人亮相投资日：小米在投资者日活动上展示新款具身机器人，手部分发纸袋动作流畅，整体延续了 2022 年 CyberOne”铁大”的设计语言。官方尚未公布具体技术细节。

• 墨甲机器人完成 110 台交付、1030 台签约：墨甲机器人（尹同跃/奇瑞系）完成规模化交付里程碑，具身智能商业化落地持续推进。

💰 融资快讯

无界动力 | 天使 | 完成天使++轮融资，天使轮累计融资超 2 | 完成天使++轮融资，天使轮累计融资超 2 亿美元，由远景科技集团、北京市人工智能产业投资基金联合投资，老股东红杉中国、线性资本、高瓴创投等跟投。同时与远景科技签署超 5 亿元全球市场订单，覆盖欧洲、亚洲多个国家，涉及风光储及 AIDC 场景智能化升级。这是具身智能赛道迄今规模最大的单笔海外商业合同。

沐听 Mooting | 面向全球职场听障人群的 AI 字幕眼镜团 | 面向全球职场听障人群的 AI 字幕眼镜团队，完成产业方种子轮融资。5 人团队，2026 年 1 月正式启动。创始人兼具李泽湘体系（硬科技源头创新）和追觅体系（供应链快速落地）双重背景，产品端侧运行，延迟控制在 600ms 以内，不依赖网络也不收订阅费。

⚡ 一句话快讯（共9条）

**腾讯混元 Hy3 preview 发布**：姚顺雨主导，295B 总参数/21B 激活参数，快慢思考融合 MoE 架构，编程基准 SWE-Bench Verified 得分 74.4%。

**谷歌第八代 TPU 双舰齐发**：主打终结 AI 推理延迟，让智能体真正实现随叫随到的大规模部署。

**OpenAI 发布 Privacy Filter**：1.5B 参数 PII 脱敏模型，Apache 2.0 开源。

**OpenAI 终止与微软独家合作**：为与亚马逊、谷歌达成协议铺平道路。

**清华丁宁成立”自然意志”**：通用物理智能公司，估值 40 亿。

**南非撤回首份国家 AI 政策草案**：因草案参考文献列表中含 AI 生成的虚构来源。

**强脑科技 CEO 韩璧丞**：希望把中国变成世界首个没有肢体残疾人的国家。

**YC 合伙人**：AI 时代一个人可以干掉一整支大型团队，Token 消耗量是新时代的核心指标。

**Meta 员工刷 token 冲榜**：内部”Claudeonomics”排行榜催生作弊机制，有员工一个月烧掉 200 万美元。

📚 每日一词

Agent Idle 率

这个词来自 Multica 创始人张佳圆。在他那间”4 个真人 + 十几个 AI Agent”的工作室里，他发现了一个反直觉的事实：Agent 大多数时候处于待机（Idle）状态——因为每个任务的最终决策权还在人手里，Agent 完成任务后必须等人来 review、给反馈，才能进入下一个循环。

张佳圆的判断是：在 AI Native 的组织形态里，”人”才是整个系统最慢的节点。Agent 可以 7×24 小时运行，可以并行处理数十个任务，但人类的注意力始终是瓶颈。

这让他得出了一个惊人的结论：衡量一个 AI Native 组织效率的核心指标，未来可能不是”有多少员工”，而是”Agent Idle 率”——Idle 率越低，说明这个组织把 Agent 的产能利用得越充分，也意味着它越”AI Native”。

这个概念的价值在于，它把组织效率从”人员规模”这个旧指标中解放出来。一个 5 人团队配合数十个高效运转的 Agent，可能比一个 50 人的传统团队产出更高。

反过来，它也暴露了当下 AI 应用的一个核心悖论：花大价钱买了 AI 工具，却没有改变工作流程——人还是用旧方式等待、判断、反馈，Agent 在一边空转。这不是 AI 的问题，是工作模式没有跟着变。

👉 南楂： Agent Idle 率，是 AI 时代第一个真正有意义的组织效率指标。如果你不知道自己团队的 Idle 率是多少，说明你还没有真正开始用 AI。

【信息来源】36氪 · 虎嗅 · 钛媒体 · 爱范儿 · 雷锋网【南楂AI早报】每日更新，用最接地气的方式解读AI资讯。