乐于分享
好东西不私藏

【AI资讯日报 | 04月24日】DeepSeek V4 开源预览版上线,开源进入“1M 上下文 + MoE 推理成本优化”新阶段

【AI资讯日报 | 04月24日】DeepSeek V4 开源预览版上线,开源进入“1M 上下文 + MoE 推理成本优化”新阶段


【AI资讯日报 | 04月24日】DeepSeek V4 开源预览版上线,开源进入“1M 上下文 + MoE 推理成本优化”新阶段

  • • 🔥🔥🔥🔥🔥 2026‑04‑24|DeepSeek V4 预览版上线并同步开源:Pro(1.6T/激活49B)与 Flash(284B/激活13B)双版本,支持 1M token 上下文;模型卡披露“混合注意力(CSA+HCA)+ mHC + Muon 优化器”架构,提出三种推理投入模式(Non‑think/High/Max),Agent 与长文评测表现突出,MIT 许可证开源,可在本地/云端部署|Hugging Face 模型卡(官方)04‑24;IT之家 04‑24 报道;同花顺 7×24 快讯 04‑24
  • • 🔥🔥🔥🔥 2026‑04‑24|官方/媒体确认 API 同步更新:登录官网与 App 可直接体验;API 只需修改 model_name 为 deepseek‑v4‑pro 或 deepseek‑v4‑flash 即可调用;媒体通稿强调“百万字超长上下文、Agent 能力、世界知识与推理性能领先”|腾讯新闻/人民财讯 04‑24
  • • 🔥🔥🔥🔥 2026‑04‑24|OpenAI 发布 GPT‑5.5:面向“Agent 编程/知识工作/科研”,长文评测与 API 定价调整,被市场视为与 DeepSeek V4 预览版同期对标的重要更新|界面新闻 04‑24
  • • 🔥🔥🔥 2026‑04‑24|腾讯混元 Hy3 preview 发布并开源:约 295B MoE、256K 上下文,已在元宝/CodeBuddy/WorkBuddy/QQ 等首批上线|北京商报 04‑23 18:27;证券时报/东方财富网 04‑24 02:09
  • • 🔥🔥🔥 2026‑04‑24|豆包 App 上线“豆包帮你选”,打通抖音电商闭环交易;同日出现特斯拉中国车机语音将接入豆包与 DeepSeek Chat 的市场报道(4 月 22 日发布、24 日持续发酵)|IT之家 04‑24 08:27;澎湃新闻 04‑23 12:52
  • • 🔥🔥 2026‑04‑23|资本层面:市场消息称腾讯、阿里正洽谈投资 DeepSeek,目标估值或升至 200 亿美元(DeepSeek 方面尚未公开回应)|三易生活/网易号 04‑23 19:50;新浪财经/昆明信息港 04‑23

🧠大模型方面

  • • DeepSeek V4 预览版核心要点
    • • 模型矩阵与参数:V4 提供 Pro(1.6T 参数/激活 49B)与 Flash(284B 参数/激活 13B)两档;均为 MoE 架构,支持 1M token 上下文;量化方案采用 FP4(专家)+FP8(非专家)混合精度。
    • • 架构与工程优化:
      • • 引入“Hybrid Attention(CSA+HCA)”混合注意力,官方称在 1M 上下文下单 token 推理 FLOPs 与 KV‑cache 分别降至前代 27% 与 10%,改善长文效率。
      • • 使用“Manifold‑Constrained Hyper‑Connections(mHC)”稳定深网信号传播,以及“Muon 优化器”提升收敛与训练稳定性。
    • • 训练与后训练:在 >32T 高质量 token 上预训练;后训练采用“两阶段范式”,先独立培育领域专家(SFT+RL/GRPO),再通过 on‑policy distillation 统一整合能力。
    • • 推理投入与模式:官方明确三类模式——Non‑think(快速直觉)、Think High(有意识逻辑分析)、Think Max(探索推理边界);建议在 Max 模式下至少 384K 上下文以获得更好表现。
    • • 评测与对标(官方数据):
      • • Pro Max 在多项代码/数学与 Agent 指标上表现亮眼:LiveCodeBench Pass@1 93.5、Codeforces Rating 3206、SWE Verified 80.6、BrowseComp 83.4、MCPAtlas Public 73.6,与前沿闭源模型同台竞争。
      • • 长文能力:MRCR 1M(MMR)83.5、CorpusQA 1M(ACC)62.0。
    • • 使用与生态:
      • • 模型权重与代码已在 Hugging Face/ModelScope 同步开源(含 Base/Instruct 变体),许可证为 MIT。
      • • 模型卡提供“encoding”示例与推理说明,不采用 Jinja chat template,而是通过官方提供的 encode/parse 工具进行消息编码与输出解析。
      • • 本地部署采样参数建议:temperature=1.0、top_p=1.0;Think Max 建议上下文 ≥384K。
    • • 媒体口径与官方服务:多家媒体同步称“预览版正式上线并开源”“百万字超长上下文”“API 同步更新”;人民财讯/腾讯新闻称即日起可在官网或 App 与 V4 对话,API 通过 model_name 即可切换至 deepseek‑v4‑pro/deepseek‑v4‑flash;IT之家与同花顺 7×24 亦发布相同要点。
    • • 商业与资本侧(24h 内相关进展):4 月 23 日市场消息指腾讯、阿里正洽谈投资 DeepSeek,目标估值或逾 200 亿美元;DeepSeek 方面尚未公开确认。
  • • OpenAI GPT‑5.5 发布(对比参考)
    • • 官方聚焦“Agent/自然交互计算”,强调在编程、知识工作与科研场景的应用;同时更新 API 定价,与 V4 预览版形成同日“对标”|界面新闻 04‑24。
  • • 腾讯混元 Hy3 preview
    • • MoE 约 295B、256K 上下文;已在腾讯系多产品上线并开源,强化在“长文/代码/Agent”方向的布局|北京商报 04‑23;证券时报/东方财富网 04‑24。

🛠️AI应用侧方面

  • • 豆包:“帮你选”打通抖音电商闭环
    • • 功能上线与定位:豆包 App 内嵌“豆包帮你选”,支持“对话式选品 → 商品卡片 → 加购/支付/售后”,无需跳转主站,强化 AI 电商交易闭环|IT之家 04‑24。
    • • 行业竞争:同日稿件指出阿里千问接入淘宝/支付宝、京东推出“京东 AI 购”,AI 电商场景竞速持续|IT之家 04‑24。
    • • 跨界合作与传播:特斯拉中国车机语音服务将接入豆包大模型(语音控制)与 DeepSeek Chat(AI 互动问答)的报道在 22–24 日持续发酵,被视为国产模型在车载场景落地的信号|澎湃新闻 04‑23。
  • • DeepSeek V4 在应用侧的潜在影响(调研研判)
    • • 工具调用与 Agent:Pro/Flash 均支持多推理投入与工具调用相关评测(如 MCPAtlas、Toolathlon 等),Pro Max 在 MCPAtlas(73.6)与 Toolathlon(51.8)上表现靠前,提示其在“跨系统工具调度”场景的可用性。
    • • 长文处理:1M 上下文 + 低 FLOPs/KV cache 增强文档/代码/日志类应用落地的可行性。
    • • 成本与可控性:开源 MIT 与混合量化策略,配合推理投入分级,便于业务在“成本‑质量‑延迟”间做精细控制(例如日常场景用 Flash‑NonThink,复杂任务切 Pro‑High/Max)。

⚡短讯

  • • DeepSeek V4 预览版上线与开源(综合)
    • • 2026‑04‑24|DeepSeek 宣布 V4 系列预览版正式上线并开源,强调百万级上下文、Agent 能力与推理提升;权重同步在 Hugging Face/ModelScope 发布(MIT 协议);API 以 deepseek‑v4‑pro/deepseek‑v4‑flash 标识提供服务|Hugging Face 04‑24;IT之家 04‑24;同花顺 7×24 04‑24;人民财讯/腾讯新闻 04‑24。
  • • 特斯拉车机语音:豆包 + DeepSeek Chat(24h 传播)
    • • 2026‑04‑23 12:52(北京时间)|澎湃新闻报道特斯拉中国车机语音服务将接入豆包大模型与 DeepSeek Chat,通过火山引擎调用,分别承载“语音命令控制”与“AI 互动问答”,被视为国产模型在车载场景的重要合作|澎湃新闻 04‑23。
  • • 资本与市场:DeepSeek 融资传闻(24h 内)
    • • 2026‑04‑23 19:50|市场消息称腾讯、阿里正洽谈投资 DeepSeek,目标估值或由 100 亿美元级升至 200 亿美元;DeepSeek 及两家公司尚未公开回应|三易生活/网易号 04‑23;新浪财经/昆明信息港 04‑23。

📬 主题订阅服务

想要专属的资讯日报?支持订阅特定主题!

三步完成订阅

  1. 1. 👍 点赞 + ❤ 推荐 本篇日报
  2. 2. 💰 前往 订阅服务详情页 完成打赏
  3. 3. 📸 截图三连(点赞+喜欢+打赏)发至后台,告知你想订阅的主题关键词

订阅权益:连续 7 天收到该主题的精选日报推送

订阅日历:每日最多开放 2 个订阅席位,先到先得


🎁 后台回复「Chat」,可领取特供Plus优惠券或者kicode中转,调用codex额度,先到(优惠额度越高)先得。

ChatGPT Plus订阅优惠使用方法,参考:2026最新保姆级教程:国内如何低门槛升级ChatGPT Plus?

在kicode中转,调用codex的流程,参考:2026 保姆级教程:国内如何配置并使用codex(全流程图解)