乐于分享
好东西不私藏

AI日报【2026-04-25】DeepSeek V4开源震撼发布

AI日报【2026-04-25】DeepSeek V4开源震撼发布

 

   衍辉channel
   每日AI资讯精选
 

 

   

今日速览

   

模型发布1. DeepSeek V4开源:百万token上下文

融资动态2. 谷歌拟向Anthropic投资400亿美元

模型发布3. OpenAI发布GPT-5.5模型

模型发布4. DeepSeek V4一年后再度震动美国对手

开源项目5. 开源记忆层让AI代理拥有持久记忆

研究论文6. 深度学习将迎来科学理论

融资动态7. ComfyUI获5亿美元估值

实用工具8. Karpathy风格LLM Wiki让AI代理维护

开源项目9. DeepEP高效专家并行通信库

 

 

   

模型发布

1. DeepSeek V4开源:百万token上下文

中国AI公司DeepSeek正式发布V4预览版开源模型,标志着开源AI进入新纪元。该模型提供百万token上下文长度,包括DeepSeek-V4-Pro(1.6T总参数/49B激活参数)和DeepSeek-V4-Flash(284B总参数/13B激活参数)两个版本,性能已达到世界顶级闭源模型水平。

DeepSeek-V4-Pro在智能体编码基准测试中达到开源SOTA水平,拥有丰富的世界知识,并特别优化了代码能力,这对AI代理工具的发展具有重要意义。模型现已通过chat.deepseek.com的专家模式/即时模式提供,API也已更新并可用。

此次发布是中国芯片产业的重要里程碑,DeepSeek特别强调了与华为技术的兼容性。一年前DeepSeek曾震动美国竞争对手,此次V4的发布进一步巩固了中国在开源AI领域的领先地位,为全球开发者提供了更具成本效益的高性能AI解决方案。

编者按:DeepSeek V4的发布不仅是一场技术竞赛,更是开源与闭源AI力量对比的转折点。当中国科技企业能以开源形式提供媲美顶级闭源系统的性能,全球AI开发格局将面临重构。

来源:Hacker News
原文:https://api-docs.deepseek.com/news/news260424
融资动态

2. 谷歌拟向Anthropic投资400亿美元

谷歌计划向Anthropic投资高达400亿美元,这将重塑AI行业竞争格局。这笔巨额投资反映了谷歌在AI领域的战略转向,旨在通过Anthropic的技术实力对抗OpenAI等竞争对手。

这笔投资规模远超此前任何一笔AI领域投资,显示出谷歌对Anthropic技术的高度认可,也表明科技巨头正以前所未有的力度投入AI基础设施竞争。消息传出后,Anthropic估值有望突破千亿美元大关。

编者按:谷歌的400亿美元投资不仅是财务支持,更是对Anthropic技术路线的背书。当科技巨头以如此规模押注一家AI公司,传统云计算与AI模型的界限正在加速模糊。

来源:Hacker News
原文:https://www.bloomberg.com/news/articles/2026-04-24/google-plans-to-invest-up-to-40-billion-in-anthropic
模型发布

3. OpenAI发布GPT-5.5模型

OpenAI正式发布GPT-5.5模型,标志着其旗舰产品线的又一次重大升级。该模型在多个基准测试中超越前代产品,特别是在复杂推理和代码生成方面表现出色。

GPT-5.5采用了新的训练架构,能够处理更长的上下文窗口,并增强了多模态能力。OpenAI表示,新模型在保持与用户对话连贯性方面有显著改进,同时减少了幻觉现象的发生频率。该模型将通过ChatGPT和API服务逐步向用户开放。

编者按:GPT-5.5的发布不仅是技术迭代,更是OpenAI在AI安全与能力平衡上的又一次探索。当模型规模持续增长,如何确保输出可靠性成为行业共同面临的挑战。

来源:Hacker News
原文:https://openai.com/index/introducing-gpt-5-5/
模型发布

4. DeepSeek V4一年后再度震动美国对手

中国AI公司DeepSeek发布备受期待的下一代AI模型V4预览版,宣称该开源模型可与Anthropic、谷歌和OpenAI等美国竞争对手的领先闭源系统相抗衡。DeepSeek表示V4相比前代模型有重大改进,特别是在编码能力方面,这一能力已成为AI代理的核心,并推动了ChatGPT Codex和Claude Code等工具的成功。

此次发布也是中国芯片产业的重要里程碑,DeepSeek特别强调了与华为技术的兼容性。此次发布距离DeepSeek一年前震动美国竞争对手已过去一年,标志着中国AI技术实力的持续提升。

编者按:DeepSeek V4的发布再次证明,开源AI正在快速缩小与闭源系统的性能差距。当中国科技企业能以开源形式提供媲美顶级闭源系统的性能,全球AI开发格局将面临重构。

来源:The Verge AI
原文:https://www.theverge.com/ai-artificial-intelligence/918035/deepseek-preview-v4-ai-model
开源项目

5. 开源记忆层让AI代理拥有持久记忆

style=”max-width:100%;border-radius:4px;” alt=””>

开发者Alash3al推出名为Stash的开源项目,为任何AI代理提供持久记忆能力,解决AI每次对话都需要重新解释背景的问题。Stash作为一个持久的认知层,位于AI代理与世界之间,不替换模型而是使模型具有连续性。

该项目采用PostgreSQL和pgvector构建,支持MCP原生,能够将对话会话转化为事实,事实形成模式,模式最终形成智慧。Stash采用类似文件夹的命名空间系统,让AI能够将学习内容组织成干净、独立的存储桶,解决了AI记忆混乱的问题。开发者可通过GitHub获取项目源码。

编者按:Stash的发布解决了AI长期存在的记忆痛点,为个性化AI体验提供了技术基础。当AI不再需要重复解释背景,人机交互将更加自然高效。

来源:Hacker News
原文:https://alash3al.github.io/stash?_v01
研究论文

6. 深度学习将迎来科学理论

一篇新论文提出深度学习将迎来科学理论,该论文已提交至arXiv,共41页,包含6个图表。研究认为随着深度学习的发展,建立其科学理论基础将成为可能,这将帮助理解为什么深度学习如此有效以及如何改进它。

论文从统计学和机器学习角度探讨了深度学习的理论基础,为这一快速发展领域提供了理论框架。随着AI模型规模不断扩大,建立科学理论对于指导未来研究和应用开发具有重要意义。

编者按:深度学习科学理论的建立,标志着AI研究从经验驱动向理论驱动的转变。当算法黑箱逐渐打开,AI发展将更加稳健可控。

来源:Hacker News
原文:https://arxiv.org/abs/2604.21691
融资动态

7. ComfyUI获5亿美元估值

ComfyUI完成新一轮融资,估值达到5亿美元。该工具为创作者提供对AI生成图像、视频和音频的更多控制权,刚完成了3000万美元融资。ComfyUI的崛起反映了创作者对AI生成内容控制权需求的增长。

随着AI生成媒体内容的普及,创作者越来越需要能够精确控制生成过程的工具。ComfyUI提供的节点式工作流让创作者能够像编程一样精确控制AI生成过程,这满足了专业创作者对AI工具的高要求。

编者按:ComfyUI的估值飙升反映了创作者对AI生成内容控制权的迫切需求。当AI创作工具从自动生成转向精准控制,创作者与AI的关系正在重新定义。

来源:TechCrunch AI
原文:https://techcrunch.com/2026/04/24/comfyui-hits-500m-valuation-as-creators-seek-more-control-over-ai-generated-media/
实用工具

8. Karpathy风格LLM Wiki让AI代理维护

开发者推出名为Wuphf的开源项目,创建了一个类似Karpathy风格的LLM Wiki,由AI代理维护,支持Markdown和Git。该项目旨在让Claude、Codex和OpenClaw等AI代理能够协作工作,同时保持上下文不丢失。

Wuphf被描述为AI员工的Slack,具有共享大脑功能,使多个AI能够协作执行任务而不丢失上下文信息。

编者按:Wuphf代表了AI协作工具的新方向,当多个AI能够共享并维护知识库,团队AI将成为可能。这预示着未来工作流程的重大变革。

来源:Hacker News
原文:https://github.com/nex-crm/wuphf
开源项目

9. DeepEP高效专家并行通信库

GitHub热门项目DeepEP是一个高效专家并行通信库,使用Cuda开发,今日获得189个星标。该库旨在优化大规模AI模型训练中的通信效率,特别适用于专家并行架构。

来源:GitHub Trending
原文:https://github.com/deepseek-ai/DeepEP