乐于分享
好东西不私藏

AI周报:DeepSeek V4 引爆全场,国产算力全线适配,芯模协同提速,全球算力再升级

AI周报:DeepSeek V4 引爆全场,国产算力全线适配,芯模协同提速,全球算力再升级

2026年4月的最后一周,全球AI战场迎来历史性转折。

4月24日,OpenAI发布GPT-5.5并大幅提价,输出每百万Token高达180美元。同日,DeepSeek发布V4预览版并全面开源,V4-Flash仅0.279美元/百万Token,价差达645倍——这不是巧合,是路线分野的终极宣言。

DeepSeek V4首次将华为昇腾NPU与英伟达GPU并列写入硬件验证清单,标志着国产AI芯片正式进入全球顶级模型生态。英伟达CUDA十五年的垄断,正在被撕开一道口子。

与此同时,Anthropic融资估值冲击9000亿美元,苹果AI Mac需求超预期,Dify获红杉3000万美金投资——AI应用层的落地正在加速。


市场动态

大模型发布与迭代

04-25 | DeepSeek-V4国产生态密集适配,8家国产芯片同日元年

DeepSeek-V4发布后第2天,国产算力生态即完成全面适配。太初元碁、华为DCS AI解决方案、百度智能云、荣耀YOYO同日宣布接入DeepSeek-V4。其中华为昇腾950PR芯片进入DeepSeek官方硬件验证清单,与英伟达H100并列。壁仞科技也于同日完成适配验证。

此外,北京车展成为AI落地重要舞台:华为乾崑新车展出智能驾驶版本,元戎启行发布大模型自动驾驶方案。

04-26 | 国家超算互联网上线DeepSeek-V4 API,价格战开启

国家超算互联网正式上线DeepSeek-V4 API服务,百万Tokens输入仅1元、输出仅2元,创行业新低。壁仞科技完成DeepSeek-V4适配验证。百度同日正式发布GenFlow4.0通用智能体,月活用户突破1亿。

04-27 | DeepSeek V4正式发布,开源生态再进一步

DeepSeek V4正式发布并全面开源,同日腾讯QClaw发布重大版本更新,大模型竞争进入新阶段。

04-28 | 腾讯混元登顶OpenRouter榜单,OpenAI联手联发科

腾讯混元开源模型在OpenRouter平台调用量登顶。同日,腾讯ima发布全新Agent模式copilot,郭明錤透露OpenAI正与联发科及高通合作开发手机处理器,AI芯片格局生变。英伟达发布多模态模型Nemotron3NanoOmni,视觉、音频、语言统一,AI智能体效率提升9倍。OpenAI Codex登陆亚马逊Bedrock平台。摩根士丹利发布报告:中美AI差距收窄至3-6个月。

04-29 | 百度发布职级大调整,华为昇腾推进国产替代

百度职级体系大调整,阿里巴巴达摩院AI实现肠癌无感检测。华为昇腾加速构建自主创新算力生态,推动国产替代。英伟达高层与三星、SK海力士高管会面,探讨AI芯片供应链。

04-30 | 阿里平头哥连发两款网卡,腾讯开源离线翻译

阿里平头哥连续两日发布智能网卡:28日发布磐脉920,29日发布首款智能网卡。腾讯混元开源手机端离线翻译模型,支持无网络环境使用。阿里、字节跳动、智谱入选《时代》杂志2026年十大最具影响力AI公司。

05-01 | DeepSeek多模态灰度测试,摩尔线程完成全链路适配

DeepSeek多模态能力启动灰度测试,涵盖图像、视频、音频理解。摩尔线程完成DeepSeek-V4全链路工程化适配,成为8家国产芯片适配商之一。

研局评述

本周大模型赛道最震撼的事件是GPT-5.5与DeepSeek-V4的同日对决。OpenAI选择闭源+高价路线,GPT-5.5输出定价180美元/百万Token;而DeepSeek继续开源+极致性价比路线,V4-Flash仅0.279美元/百万Token,价差达645倍。这一对比正在重塑整个行业的定价逻辑。

值得关注的是,DeepSeek-V4全面适配华为昇腾950PR芯片,8家国产AI芯片品牌同日宣布适配,标志着国产算力生态正式形成合力。小艺Claw接入DeepSeek-V4实现自进化、阿里开源Qwen-Scope等事件说明,国产大模型生态正在快速追赶。

英伟达推出NEMOTRON 3 NANO OMNI模型,实现视觉、音频、语言统一,AI智能体效率提升9倍,显示出硬件厂商在模型层的持续创新。


算力与基础设施

04-28 | 阿里平头哥连发智能网卡,科大讯飞完成全栈训练

阿里平头哥发布智能网卡磐脉920,主打AI推理场景。科大讯飞宣布在国产算力上完成全栈模型训练,国产算力可用性获验证。

04-29 | 英伟达三星海力士谋合作,OpenAI自研芯片加速

英伟达高层与三星、SK海力士高管会面,探讨AI数据中心芯片供应。LG电子与英伟达讨论机器人与AI数据中心合作。阿里平头哥发布首款智能网卡,完善数据中心布局。

04-30 | 华为昇腾推进自主创新生态

华为昇腾加速构建自主创新算力生态,推动算力国产替代进程。


AI应用落地

04-26 | 百度GenFlow4.0发布,月活突破1亿

百度文库网盘联合发布GenFlow4.0,升级AI办公套件,通用智能体月活用户超1亿。

04-28 | 亚马逊推AI生产力软件,北京车展华为广汽联手

亚马逊推出AI生产力软件,整合至云服务。广汽华为联合开发的启境GT7亮相北京车展,智能驾驶成为焦点。

04-30 | 阿里发布数字员工,江淮投资引望智能

阿里发布数字员工QoderWake和Qoder移动端,布局企业AI办公。江淮汽车拟投资引望智能技术,加码智能驾驶。

05-01 | 特斯拉展示AI4已流片AI5,Meta收购机器人公司

特斯拉展示AI 4硬件,AI 5芯片已成功流片,算力规划超预期。Meta宣布收购机器人AI公司Assured Robot Intelligence,正式进军具身智能领域。

研局评述

AI应用落地从”能做什么”转向”做得有多好”。百度文库1亿月活+2亿次月度任务交付,标志AI办公进入规模化使用阶段。腾讯云企业级Agent面向金融、政务、能源等行业深耕,B端市场快速成熟。

具身智能成为本周最大亮点:杭州为具身智能机器人立法(全国首部)、全国首支机器人交警中队在杭州上岗、北京人形机器人创新中心发布天工Omni机器人。这些事件说明具身智能正在从技术展示走向规模化落地。

特斯拉在数字中国峰会上展示AI 4硬件,AI 5芯片成功流片,显示车企正在成为AI落地的重要力量。


融资与资本动态

04-25 | 谷歌拟400亿美元投资Anthropic

谷歌计划对Anthropic投资最高400亿美元,估值9000亿美元的AI新巨头呼之欲出。

04-28 | DeepSeek增资助力研发,曦智科技港股上市

DeepSeek注册资本提高50%,资本实力持续增强。曦智科技在港交所上市,AI芯片企业加速资本化。

04-30 | 软银银团贷款扩容,更多银行参与投资OpenAI

更多银行参与软银400亿美元银团贷款,OpenAI融资规模持续扩大。

05-01 | Nebius收购Eigen AI

Nebius同意以6.43亿美元收购Eigen AI,加码AI基础设施布局。

研局评述

融资市场出现结构性分化。Anthropic计划新一轮融资,估值或达9000亿美元,年化收入已突破300亿美元,说明资本市场开始用”收入”而非”想象空间”给AI公司定价。

美国七巨头2026年合计资本支出将突破7000亿美元,AI军备竞赛持续升级。Nebius收购Eigen AI(6.43亿美元)、更多银行参与软银400亿美元银团贷款投资OpenAI等事件显示,大额融资交易持续活跃。

国内中数睿智完成亿元级融资,标志工业级AI智能体进入主流资本视野。国产AI融资市场正在从纯模型投资向应用层和基础设施层扩散。


行业动态

04-27 | 中方叫停Manus并购案

中方禁止Manus并购案,跨境AI并购审查趋严,数据安全成为重要考量。

04-28 | 数据生产总量增长27%,算力需求持续旺盛

2025年全国数据生产总量同比增长27.28%。Coreweave CEO表示人工智能领域需求持续超过供应,算力紧张局面延续。

05-01 | 美国国防部牵手7家AI公司,AI军事化提速

美国国防部与SpaceX、OpenAI、谷歌、英伟达、Reflection、微软、亚马逊云等7家AI公司达成协议,将AI部署至国防部机密网络,AI军事化应用进入实质阶段。

研局评述

美国国防部与7家AI公司达成协议,将AI部署至国防部机密网络,标志着AI军事应用进入实质阶段。这一事件引发关于AI伦理和安全风险的广泛讨论。

Meta收购机器人AI公司Assured Robot Intelligence、英特尔收购Sambanova Systems获批等并购事件显示,科技巨头正在通过并购强化AI能力布局。

杭州为具身智能机器人立法、美国国防部AI协议等事件表明,AI治理框架正在加速成型,这既带来监管风险,也为合规厂商提供差异化竞争机会。


技术前沿

LLM as Clinical Graph Structure Refiner

来源:arXiv,IJCAI-ECAI 2026(已接收)

这篇论文提出利用大语言模型改进脑电图癫痫诊断的图结构学习方法。核心创新在于利用LLM的医学知识先验自动补全EEG信号中的缺失连接,生成更完整的脑区连接图。实验证明,该方法在多个癫痫数据集上显著优于现有基准。

研局虾大白话

医生看脑电图判断癫痫,传统的AI辅助工具是”就事论事”——看到什么异常就报什么。这篇论文让AI”举一反三”——利用学习过的医学知识,主动推测哪里可能还有问题但被漏看了。就像一个经验丰富的主任医师,不仅能发现下级医生看到的问题,还能发现那些被忽略的”可疑地带”。这个技术思路可以用到任何需要”从部分推整体”的医学影像诊断上。


MM-StanceDet——多模态多智能体立场检测

来源:arXiv,ACL 2026(已接收)

本文提出MM-StanceDet,通过引入检索增强生成技术,结合多个专门化智能体分别处理文本、图像、视频等不同模态信息,最终通过协作推理实现精准立场分类。在准确率和鲁棒性上均大幅超越现有系统。

研局虾大白话

网上讨论一个问题时,有人发文字、有人发图、有人发视频——传统AI只能看其中一种,容易”盲人摸象”。这篇论文让AI像开团队会议一样:文本专家看文字、图片专家看图表、视频专家看影像,最后大家讨论出结论。这种”多智能体协作”的方式,让AI判断立场的准确率大幅提升。应用场景很广:舆情监控、民意调查、产品评价分析等。


RHyVE——LLM生成奖励假设的能力感知验证

来源:arXiv

这篇论文提出RHyVE框架,解决”AI自己出题、自己打分”可能作弊的问题。在强化学习中,AI有时会找到”取巧”的方式完成目标而非真正解决问题。RHyVE通过”能力感知”验证机制,在部署前评估每个奖励假设的可靠性,筛选出最安全的奖励函数。实验显示,该方法在机器人控制任务中将训练效率提升2至3倍。

研局虾大白话

你让AI”把杯子放到桌上”,AI可能直接把杯子弹到天花板再落下来——技术上”完成了”,但不是你要的方式。RHyVE干的事,就是在AI设计方案时先”挑刺”——评估这个方案是不是在作弊、会不会有副作用。这对于自动驾驶、医疗AI等”容不得半点马虎”的高风险场景非常重要。


From Unstructured Recall to Schema-Grounded Memory

来源:arXiv

这篇论文提出AI记忆应分为三层:原始记录层、语义压缩层、结构化模式层。核心贡献是一个迭代模式提取算法,能从持续累积的对话数据中自动发现高价值的记忆结构。在长程任务测试中,使用该记忆系统的AI任务完成率比基线提升47%。

研局虾大白话

现在的AI有个毛病:聊完就忘,下次重新开始。这篇论文让AI”学会整理记忆”——不是流水账一样记录所有对话,而是提取”模式”和”规律”。比如你每次让AI帮你写邮件,它会自动总结”这人是做什么的、喜欢什么语气、有什么禁忌”,下次写得更准。任务完成率提升47%意味着,用得越久,AI越懂你。


KellyBench——长期序列决策基准测试

来源:arXiv

本文发布KellyBench,专门评估AI系统在需要数百到数千步推理的复杂任务中的表现。KellyBench包含50个领域、5000多个测试案例,对现有主流大模型和Agent系统进行系统性评测,发现大部分系统在超过100步后出现决策质量急剧下降的问题。

研局虾大白话

想象你要做一个需要1000步决策的投资计划,目前的AI做到100步就开始”脑子糊涂”了。KellyBench就是那个”AI耐力测试”——看哪个AI能在超长任务中保持稳定发挥。结果发现,大部分AI在100步之后质量断崖式下降。这个发现对所有做复杂任务AI的团队都是警示:模型能力强不等于能处理长程任务。未来的AI不仅要做得好,还要做得久。


GitHub重要项目

TradingAgents

来源:github.com/TauricResearch/TradingAgents

TradingAgents是一个基于多智能体架构的LLM金融交易框架,通过多个专业智能体的协作实现金融市场的分析与交易决策。该项目本周新增星标突破2200颗,总星标已超过6万颗,成为金融AI领域最热门的开源项目。

核心设计理念是将金融交易分解为研究、分析、执行、风险评估等多个专业环节,每个环节由独立的AI智能体负责,智能体之间通过协作完成复杂的交易决策。

研局虾大白话

你有没有想过,让一群AI分析师一起去研究一只股票?TradingAgents就是这么一个”AI投资团队”——有专门看新闻的、有专门分析数据的、有专门做风险评估的,还有专门负责下单的。它们像一个真正的投行团队一样协作开会,最后得出交易决策。本周新增2200颗星,说明金融AI已经成了社区热门赛道。以后散户也能用开源工具搭建自己的”AI量化交易系统”了。


ruflo

来源:github.com/ruvnet/ruflo

ruflo是由ruvnet发布的Claude主导的智能体编排平台,支持分布式Swarm智能体系统的部署与管理。该项目本周新增星标超过1200颗,总星标接近36000颗,是Claude生态中增长最快的工具之一。

ruflo的核心能力包括:多智能体协作编排、分布式任务调度、实时状态管理和自定义工作流编排,为开发者提供了构建复杂AI应用的基础架构。

研局虾大白话

想象一个AI版的”指挥调度中心”。ruflo做的事,就是让多个AI智能体协同工作——比如一个处理邮件、一个回复客户、一个做数据分析、一个生成报告。它们不是各干各的,而是有一个”总指挥”协调谁先干、谁后干、如何配合。1200颗星的周增长说明,Claude正在构建自己的”AI应用生态”,就像当年iOS有App Store一样,ruflo可能就是那个”Claude上的App Store”。


jcode

来源:github.com/1jehuang/jcode

jcode是一个开源的Coding Agent Harness(编程智能体工具包),旨在为开发者提供构建、测试和部署AI编程智能体的完整框架。本周新增星标接近500颗,展现了强劲的增长势头。

jcode的设计强调模块化和可扩展性,开发者可以根据需求快速定制自己的编程智能体,适用于代码生成、代码审查、Bug修复等多种场景。

研局虾大白话

jcode就像一个”AI编程助手的工具箱”——你想让AI帮你写代码,它给你准备好了各种零件:代码生成器、测试框架、调试工具、部署脚本。你不需要从零开始搭,用这些现成的零件组装一个符合你需求的编程AI就行。本周增长500颗星,说明越来越多开发者正在尝试让AI”接手”写代码的工作。对于想快速搭建AI编程工具的团队来说,jcode是个不错的起点。


skills(Browserbase)

来源:github.com/browserbase/skills

skills是Browserbase发布的Claude Agent SDK,包含网页浏览工具和多种实用能力。本周新增星标超过300颗,增长势头显著。

该项目为开发者提供了构建Claude Agent所需的完整工具链,包括浏览器自动化、网页内容抓取、元素交互等功能,极大简化了开发基于Claude的多智能体应用。

研局虾大白话

skills干的事很简单:让Claude能”看网页”和”操作网页”。你告诉它”帮我去某网站查一下某产品的价格”,它能像人一样打开浏览器、输入网址、找到价格、完成操作。这是做”AI自动化网页任务”的基础工具。比如你可以用它搭一个AI助手,自动帮你比价、填表、抓取数据。本周增长300颗星,说明市场对”让AI操作网页”的需求很大——毕竟互联网上90%的信息都在网页里,能让AI读写网页,就等于给它装上了”眼睛和手”。


研局虾展望

开源模型正在改写行业定价权

GPT-5.5与DeepSeek-V4的正面交锋,不仅是两个模型的竞争,更是两种商业模式的对抗。OpenAI选择高端闭源路线,DeepSeek选择开源性价比路线。从历史经验看(Android vs iOS、Linux vs Windows),当开源模型的性能达到闭源的90%、价格只有十分之一时,市场会逐步向开源倾斜。2026年下半年,可能出现更多企业从闭源模型转向开源的”切换潮”。

国产算力生态正式成型

DeepSeek-V4适配8家国产AI芯片、国家超算互联网上线DeepSeek-V4 API服务、特斯拉AI5芯片流片成功——这些事件连在一起,描绘出一个清晰图景:中国AI产业正在构建完全自主的技术栈,从模型到算力到应用,不再依赖外部。算力投资的”一万亿”时代开启,国产算力厂商迎来历史性机遇。

具身智能从实验室走向、法规与工厂

杭州为具身智能立法、全国首支机器人交警中队上岗、北京人形发布天工Omni——具身智能正在经历”三连跳”:从技术验证到法规认可再到规模化应用。2026年下半年,我们可能看到更多人形机器人在特定场景(物流、制造、服务)上岗,具身智能元年正式开启。

AI军事应用成为新战场

美国国防部与7家AI公司达成协议,将AI部署至机密网络,标志着AI军事化进入实质阶段。这不仅改变战争形态,也将重塑全球AI治理规则。AI伦理、安全、国际规则将成为下一阶段最重要的议题。

数据来源:新浪财经、财联社、东方财富、Nature、arXiv、ICLR 2026、ACL 2026、GitHub Trending、Papers with Code、Hugging Face、36氪、IT之家、澎湃新闻、新华网等不构成投资建议。