AI内参|博通引爆芯片股抛售潮,DeepSeek首轮融资估值590亿美元,OpenAI Dreaming V3记忆系统上线
2026 年 6 月 6 日(周六)· 第 23 周
过去两天,AI 产业在资本市场和产品层面同步经历了剧烈波动。博通一份低于预期的 AI 芯片指引引发了全球半导体股的连锁暴跌,SK 海力士和三星单日跌幅超 7%,韩国股市触发熔断;与此同时,中国 AI 独角兽 DeepSeek 正式启动首轮外部融资,估值高达 590 亿美元;OpenAI 推出了全新的 Dreaming V3 记忆架构,华为云则在上海发布了 Agentic AI 系列新品。以下是本期完整日报。
🛠️ 技术生态
◆ OpenAI Dreaming V3:ChatGPT 记忆系统迎来架构级重构
6 月 4 日,OpenAI 宣布向 ChatGPT Plus 和 Pro 用户推送一套全新的记忆架构——Dreaming V3。这不是一次简单的功能更新,而是 ChatGPT 记忆系统从"记事本式"到"持续性关系"的基础架构升级。
https://openai.com/index/chatgpt-memory-dreaming
https://startupfortune.com/openai-is-making-chatgpt-memory-work-more-like-a-running-relationship
https://kingy.ai/news/openai-dreaming-chatgpt-memory-explained
原有记忆系统的痛点:ChatGPT 此前的记忆功能本质上是一个"保存的笔记簿"——用户需要手动指定要记住的信息,且记忆内容一旦写入就趋向于过时和僵化。面对数以百万计的用户和跨越数月的多轮对话,"信息陈旧"和"上下文一致性"成为两大核心瓶颈。
Dreaming V3 的核心创新:OpenAI 将新系统描述为"可扩展的记忆综合系统"(Scalable Synthesis System)。与传统记忆的被动存储不同,Dreaming 能够主动综合对话上下文,从中提取用户的偏好、习惯和长期目标,并在后续对话中动态应用这些知识。OpenAI 的内部评估显示,Dreaming V3 在"偏好跟踪准确率"和"长时间跨上下文一致性"两个维度上较上一代实现了显著提升。
性能与覆盖:OpenAI 表示近期优化将 Dreaming 服务免费用户所需的算力降低了约 5 倍,使得面向免费层的部署变得可行。Plus 和 Pro 用户获得 2 倍 的记忆容量提升(从 9to5Mac 的报道来看,记忆存储上限翻倍)。目前 Dreaming V3 已向美国地区的 Plus 和 Pro 用户开放,预计未来数周内扩展至更多国家和 Free/Go 用户。
用户控制:用户可以随时在设置中关闭记忆功能或使用临时对话模式。如果"Improve the model for everyone"设置开启,OpenAI 可能使用共享内容(包括过去的聊天记录、保存的记忆)来帮助改进模型。
行业意义:Dreaming V3 标志着 AI 助手从"每次会话从零开始"向"持续学习的个人 AI"迈出了关键一步。在微软 Scout 和 Google Gemini Spark 等 persistent Agent 纷纷问世的背景下,ChatGPT 的记忆系统升级意味着 OpenAI 也在为"永远在线的个人 AI"铺路。对于开发者而言,这也是一个信号——AI 产品的差异化正在从"模型能力"转向"用户体验连续性"。
◆ 华为云发布 Agentic AI 系列新品:Agentic Infra 新范式 + 百模千态生态计划
6 月 5 日,在上海举行的华为云 INSPIRE 创想者大会上,华为云正式提出 Agentic Infra 新范式,并发布四大 Agentic Infra 新品,涵盖算力集群、记忆存储、调度引擎和 Agent 运行环境四个层面。
https://www.qbitai.com/2026/06/431027.html
https://www.ithome.com/0/960/720.htm
https://finance.eastmoney.com/a/202606053761727583.html
Agentic Infra 四大新品:
- AICS 灵衢智算集群
:基于超大带宽灵衢网络,支持 10 万卡 级集群规模,总算力高达 200 EFLOPS,Token 生成时延降低到 10 毫秒以内,千卡每秒吞吐达到 500 万 Tokens,在线服务可用性达 99.95%。
- AMS Agentic 记忆存储解决方案
:通过 NPU 直通 CMS 硬件,打造 PB 级 超大记忆空间,支持 KV Cache 分层池化——核心思路是在不显著增加推理成本的前提下实现"天级长程任务"的记忆持久化。
- CCE Volcano Next 通智一体化调度引擎
:通过"训推共池+碎片整合"实现通智混合算力负载调度革新,资源利用率提升 30% 以上。
- AgentSphere
:安全自治的 Agent 运行环境,羽量级沙箱技术实现 100 毫秒级 极速启动与每分钟十万级批创能力。
ModelArts Next 模型训推平台同步发布,核心能力之一——MaaS 模型路由支持成本优先、效果优先、均衡模式三种策略,根据请求特征动态择优调度最佳模型,调用成本平均降低 20%。
智果(AgentArts)企业级智能体平台面向 Agent 规模化落地,构建了生产级长程任务、企业级安全、行业知识深度与全链路可观测四大能力。其开源版 openJiuwen 也已上线,内核与 AgentArts 企业版同源度超 90%。
百模千态生态计划:华为云联合 智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、美团 LongCat、讯飞星火、爱诗科技、生数科技 等 20 余家 TOP 模型厂商,发布"百模千态,云聚共赢"生态合作计划,共建系统化商业生态。
行业意义:华为云此次发布直指从"模型服务"到"Agent 基础设施"的竞争升级。当各大云厂商都在提供模型 API 时,华为云选择在 Agent 基础设施层构筑差异化——通过 AICS 算力集群、AMS 记忆方案和 AgentSphere 运行环境,为 Agent 类应用提供"从训练到推理到记忆到安全"的端到端基础设施。同时,百模千态计划事实上将所有主流国产模型厂商拉入了自己的生态体系,形成了一种"开放但绑定"的竞争策略。
◆ 阶跃星辰 Step 3.7 Flash 登海外测评榜多项第一
阶跃星辰(StepFun)发布的 Step 3.7 Flash 开源模型近日冲上海外热榜,在 AI 模型测评平台 Artificial Analysis 的 Output Speed 榜中以 409 Tokens/s 位列主流模型第一。
https://news.softunis.com/60689.html
性能指标:Step 3.7 Flash 是基于稀疏 MoE 架构的轻量化模型,总参数 196B,激活参数仅 11B。在端到端响应时长、智能效率与速度价格比等指标上均处于领先位置。该模型面向生产级 Agent 应用优化了四大核心能力,是国产开源模型中在推理效率方面表现最突出的选项之一。
融资联动:康冠科技同步宣布出资 1.5 亿元 投资阶跃星辰的 Pre-IPO 轮,双方将在端侧智能推理和多模态理解领域深化合作。
🏢 大厂动态
◆ DeepSeek 启动首轮融资:$74 亿估值最高 $590 亿,腾讯、CATL 领衔
6 月 3 日,据 Reuters 和 CNBC 等多家媒体报道,中国 AI 公司 DeepSeek 正式启动首轮外部融资,计划募集约 500 亿元人民币(约 74 亿美元),投后估值介乎 520 亿至 590 亿美元(约 3500-4000 亿元人民币)。
https://www.reuters.com/business/retail-consumer/deepseek-slated-draw-7-billion-maiden-fundraising-sources-say-2026-06-03
https://thenextweb.com/news/deepseek-7-billion-maiden-fundraising
https://www.benzinga.com/news/26/06/52962705/deepseek-eyes-7-4-billion-funding-round-at-up-to-59-billion-valuation-as-tencent-catl-back-chinas-ai-champion-report
投资方阵容:这轮融资的领投方以中国科技和产业巨头为主,具体动向包括:
- 腾讯
:考虑投资约 100 亿元,如果完成将成为 DeepSeek 最大的外部股东 - 宁德时代(CATL)
:评估 50 亿元 投资——作为电池制造巨头而非传统 AI 投资者,CATL 的入局反映了 AI 算力能源消耗带来的跨界投资逻辑 国家人工智能基金、网易、京东、砺思资本、IDG 资本等也在潜在投资方名单中 创始人 梁文锋 个人承诺投入 200 亿元,保持对公司的主导控制权——一位创始人自掏腰包完成四分之一的融资规模,在硅谷几乎闻所未闻
估值对比:590 亿美元的估值将 DeepSeek 推入全球顶级私有 AI 公司的阵营,与 Anthropic(此前 $500 亿估值融资)和 OpenAI($122B 估值)并肩。这是 DeepSeek 自成立以来的首轮外部融资——此前梁文锋一直依赖个人资金和量化基金(幻方量化)的利润来支撑研发,使其成为国内唯一主要未融资的 AI 公司。
战略意义:DeepSeek 构建了一条与硅谷截然不同的道路——从不开源闭源统治模型,到靠极致效率(如 DeepSeek-V3.2 用 $600 万美元训练出接近 GPT-4 水平的模型)重塑行业成本结构。融资完成后,DeepSeek 将从"研究驱动的实验室"转向"商业化的公司"。对腾讯而言,更紧密的 DeepSeek 关系有助于其追赶阿里在 AI 领域的领先地位;对 CATL 而言,这笔投资更像是对"大规模 AI 计算的能源需求"的前瞻性对冲。
◆ 博通 AI 芯片指引不及预期,引发全球芯片股抛售潮,韩国股市触发熔断
美东时间 6 月 4 日,芯片巨头 博通(Broadcom, AVGO) 发布第二财季财报。整体营收和每股收益均略超预期,但下一季度 AI 芯片销售指引仅为 160 亿美元,低于分析师平均预期的 172 亿美元,成为"不够惊喜"的导火索。
https://finance.yahoo.com/markets/article/broadcom-stock-sinks-in-after-hours-as-ai-chip-forecast-disappoints-165602504.html
https://www.marketwatch.com/story/south-korea-leads-asian-tech-stock-declines-after-broadcom-s-guidance-disappoints-762918ee
https://finance.biggo.com/news/CTotmJ4BYH_ypPqOTc77
市场反应——从纽约到首尔的连锁暴跌:
- 美国
:博通股价暴跌 12.59%,带领美股芯片板块集体重挫。Marvell、美光等 AI 芯片概念股同步下跌 - 韩国
:6 月 5 日开盘,SK 海力士暴跌 9.6%,三星电子大跌 7.5%,韩国 KOSPI 指数一度大跌超 6%,触发熔断机制——一家美国芯片公司的业绩指引,能触发首尔的熔断,这在 AI 时代之前几乎是不可想象的现象 - 中国港股
:中芯国际重挫 7.2%,华虹半导体跌 7.2%,港股恒指跌破 25000 点关口
Ray Dalio 火上浇油:桥水基金创始人 Ray Dalio 在抛售期间警告,AI 泡沫指标正在接近 1929 年大崩盘和 2000 年互联网泡沫破裂前的水平。电影《大空头》原型 Michael Burry 也同步放大了对 AI 估值不可持续的担忧。
健康回调还是泡沫破裂? 部分分析师将此轮调整视为"AI 超级周期中的健康修正"——博通的财报不是灾难性的差,而是市场预期过于膨胀。华尔街对 AI 芯片股已经形成了"必须每次都超出预期"的高度苛刻的定价框架。博通 CEO 陈福阳(Hock Tan)在财报电话会议中也强调,公司的订单能见度已排至 2028 年,同时宣布创建 AI XPV 算力融资平台。但从另外一个角度看,这次抛售敲响了警钟:当整个市场的估值建立在对 AI 永无止境的增长预期之上时,任何"符合预期但不够惊艳"的数据都可能触发大规模获利了结。
◆ 台积电股东会:AI 需求续强,2026 年营收增长超 30%,机器人成新增长引擎
6 月 4 日,台积电在新竹召开年度股东大会。董事长魏哲家亲自主持,释放了一系列关键信号——最核心的信息是:AI 需求不是短期热潮,而是牵引整个半导体产业进入新一轮超级循环的根本动力。
https://news.futunn.com/post/74107495/taiwan-semiconductor-annual-general-meeting-ai-demand-remains-robust-full
https://cn.tradingview.com/news/gelonghui:f3f4ce009e3f9:0
https://finance.sina.com.cn/stock/bxjj/2026-06-04/doc-iniaffcy9517876.shtml
财务展望:台积电预计 2026 年美元计价营收增长超过 30%,较 1 月份 25% 的早期预测有所上调。2025 年全年合并营收达 3.81 兆新台币,年增 31.6%,EPS 达 66.25 元创历史新高。2026 年 Q1 营收达 1.13 兆新台币,税后纯益约 5724.8 亿元,每股纯益 22.08 元。资本支出预计约 560 亿美元。
AI 从训练走向 Agent 推理:魏哲家指出,AI 正从生成式查询模式转向 Agent 的"指令与执行"模式,Token 消耗量级大幅提升——这并非一次性的训练投入,而是持续、高频的推理调用。2026 年 Q1 收入中高性能计算(HPC)占比已达 61%,先进制程收入占比达 74%。
2 纳米进展:台积电 2 纳米(N2)已于 2025 年 Q4 进入大批量生产,良率突破 90%。业界传出苹果已提前包下台积电 2026 年 2 纳米过半产能。
机器人战略:魏哲家在股东会上明确表示"机器人永远是未来方向",并风趣地指出随着人类寿命延长,80 岁、90 岁时需要机器人照顾——"比由另一半照顾更有效率"。台积电已将机器人/自驾车列为 AI 需求扩张后的下一波增长引擎。
竞争回应:在回应特斯拉 CEO Musk 可能自建 TeraFab 晶圆厂时,魏哲家以幽默方式回应:"我唯一的结论是祝福他。"并强调台积电"从来没有缺少过竞争对手",面对竞争的方法就是"努力一直赢他们"。
◆ Anthropic 呼吁全球暂停前沿 AI 开发:警告"递归式自我改进"风险
6 月 4 日,Anthropic 在官方博客发表题为 "When AI Builds Itself" 的文章,公开呼吁全球顶级 AI 实验室考虑放缓研发步伐。这一罕见的表态引发了行业内外巨大的争议和讨论。
https://www.wsj.com/tech/ai/anthropic-urges-global-pause-in-ai-development-flags-self-improvement-risk-99cefb73
https://www.nytimes.com/2026/06/05/business/dealbook/anthropic-ai-nonproliferation.html
https://siliconangle.com/2026/06/04/anthropic-calls-global-pause-ai-development-humans-lose-control
核心论据:Anthropic 内部研究机构(The Anthropic Institute)负责人 Marina Favaro 和联合创始人 Jack Clark 在文章中提出,AI 系统进步如此之快,可能很快就能在无需人类干预的情况下自我改进(递归式自我改进,Recursive Self-Improvement)。他们警告,全递归式自我改进(Full Recursive Self-Improvement)可能"增加人类失去对 AI 系统控制的风险"。
具体建议:Anthropic 提出的方案包括:
全球顶尖 AI 实验室建立一个协调的暂停机制——在模型能力接近某些红线时能够共同减速 建立可验证的全球暂缓协议(Verifiable Global Pause Agreement) 呼吁美中等主要 AI 国家达成可验证的全球规则 Anthropic Institute 表示将在未来几个月召集多方商讨协调机制
数据披露:Anthropic 在博客中首次披露,其代码库中 超过 80% 的代码是由 Claude 编写 的——这一数据本身就在印证 AI 正在自我改进的观点。
争议与质疑:这一呼吁立即引发了广泛的质疑。批评者认为:
Anthropic 正在利用安全叙事来抬高自身定位,为即将到来的 IPO 做政策铺垫 考虑到 Anthropic 刚刚秘密提交 IPO 材料,这份"暂停"倡议可能是在借安全名义限制竞争对手(尤其是 OpenAI 和 Google) Anthropic 自身的 Mythos Preview 模型已被证实能够自主发现真实世界软件漏洞——它既是危险制造者,又是解决方案提供者
行业意义:无论 Anthropic 的动机如何,"递归式自我改进"已经从理论概念变成了一个实际的政策讨论议题。OpenAI CEO Sam Altman 此前就曾反复表达过类似的担忧。此次 Anthropic 的公开呼吁将这一议题从内部研讨推向了公众和监管视野——全球 AI 治理可能因为这一声明而迎来新一轮的紧张博弈。
◆ 智谱冲刺科创板 IPO,拟募资 150 亿元构建"A+H"双资本平台
6 月 1 日晚间,港股 AI 大模型公司 智谱(02513.HK)发布公告,董事会审议通过 A 股发行并申请在科创板上市议案,拟发行不少于 909.88 万股、不超过 3876.9 万股新 A 股,募集资金净额 150 亿元。
https://news.softunis.com/60689.html
https://www.jiemian.com/article/14542178.html
资金用途:150 亿元募资中,120 亿元 投入人工智能通用基座大模型项目,20 亿元 投入大模型 MaaS 平台,10 亿元 补充流动资金。
财务数据:2025 年智谱实现收入 7.24 亿元,同比增长 132%,但净亏损 47.18 亿元——当前仍处于大规模研发投入期。相关议案需于 6 月 22 日 年度股东会审议及监管部门批准。
竞争格局:智谱是国内大模型赛道中率先布局"A+H"双平台的企业。与 DeepSeek 同日发布融资消息(6 月 3 日)形成"中国 AI 双响炮"的效应——但两者的策略截然不同:DeepSeek 引入产业资本保持独立,智谱则试图通过双市场融资扩大资本规模。值得注意的是,智谱港股股价当日大跌超 9%,MINIMAX-W 跌幅更猛达 16.65%,显示出港股大模型概念股在博通抛售潮下的连锁反应。
◆ OpenAI CFO 透露 Jony Ive AI 设备"今年年底"发布
OpenAI 首席财务官 Sarah Friar 在 All-In Podcast 团队举办的 Liquity Summit 上透露,OpenAI 与 Jony Ive 合作开发的 AI 硬件设备将在 今年年底前 正式发布。这是 OpenAI 首次给出该设备的具体时间表。
https://www.businessinsider.com/openai-cfo-ai-device-jony-ive-2026-6
https://www.axios.com/2026/01/19/openai-device-2026-lehane-jony-ive
体验描述:Friar 表示自己已经亲自体验过该设备,非常难以用语言描述——"它给人的感觉非常自然,同时又非常讨喜。"当被问及设备是否是一个耳机(earpiece)时,Friar 调侃道:"如果我说是耳机,Jony 会来偷走我十几岁的儿子。"Friar 强调,Jony Ive 团队真正擅长的是"为设备注入人性化特质"——"当你亲眼看到它时,你就能感受到。"
产品方向:Sam Altman 此前曾表示该设备将比智能手机更"平和"(peaceful),用户会对它的简洁程度感到惊讶。Axios 的报道指出,OpenAI 的目标是超越屏幕和键盘,转向多模态界面——使用视觉、声音和语音进行交互。设备形态被认为可能是一款AI 眼镜或可穿戴设备。高通 CEO 在同一场活动上提到,目前已经每年有约 1000 万 台 AI 眼镜在出货,这一数字有望在最近一两年增长到 1 亿。
📍 论文解读
◆ ArcANE:让大语言模型成为精准的"角色扮演者"
arXiv:2606.05158 · https://arxiv.org/abs/2606.05158
研究背景:大语言模型在角色扮演(Role-Playing)场景中展现出了令人印象深刻的能力——从扮演虚构人物到模拟历史人物。然而,现有模型在维持角色弧线一致性(Character Arc Consistency)方面表现不佳:它们可能在一段对话的开始时记住了角色的关键背景,但随着交互的深入,角色特征逐渐褪色,最终滑向"默认的通用 AI 人格"。这个问题在长篇角色扮演场景(如 AI 伴侣、游戏 NPC、教育角色模拟)中尤为突出。
核心方案:来自百度研究团队的工作提出了 ArcANE(Arc-Aligned Narrative Engine),包含 ArcANE-8B 和 ArcANE-32B 两个版本。这是通过精细微调(Fine-tuning)使语言模型更忠实地跟踪角色弧线的专项模型。研究团队构建了专门的角色弧线数据集,包含丰富的角色背景设定、性格特征、对话风格和知识边界约束,然后对基座模型进行定向微调。
关键指标:在角色扮演一致性评估基准上,ArcANE 系列在多项指标上超越了同等规模的通用模型。模型权重已在 HuggingFace 上开源。
作者团队:百度研究团队(Baido Research),论文已在 HuggingFace Papers 上获得热度关注。
行业意义:角色一致性是 AI 人格化能力中最被低估但最具商业价值的挑战之一。从 AI 伴侣(Character.AI 等)到游戏 NPC,从虚拟教学助手到企业客服角色扮演,"长期的一致性"决定了用户是否愿意持续与 AI 交互。ArcANE 的工作证明,通过专门的数据集和微调策略,角色一致性是可以显著改善的——这比依赖模型本身规模增长更经济且更有效。
https://x.com/HuggingPapers/status/2063475517650854004
◆ 多伦多高校发布自主传播 AI 蠕虫:开源模型变身网络攻击武器
近期加拿大一个科研团队基于开源轻量化大模型研发并发布了自治 AI 蠕虫——无需人工干预即可自主扫描企业内网漏洞、窃取凭证并横向渗透。研究团队使用了开源权重模型,不对模型本身进行修改,而是将其嵌入一个自主行动的 Agent 框架中。
https://openeuler.csdn.net/6a226401662f9a54cb79d3d2.html
核心发现:这项研究最重要的警示信息在于——普通开源权重模型(非专门训练的攻击模型)已经具备制作高危网络攻击工具的能力。研究团队展示的 AI 蠕虫可以自主完成"扫描-识别漏洞-生成利用代码-横向移动"的完整攻击链路,整个过程无需人工干预。
行业意义:这一发现与 Anthropic Mythos 的能力形成了呼应——后者被证实能够自主发现所有主流操作系统和浏览器的高危漏洞。两者的本质差异在于:Mythos 是一个高度强大的前沿模型,而多伦多大学使用的仅是普通开源模型。这意味着当前网络安全的威胁模型发生了根本性变化:不再只有顶尖实验室的模型才具备攻击能力,而是任何有能力微调开源模型的团队都可以构建自主攻击 Agent。对于企业的安全防护而言,这意味着"AI 对 AI"的防御竞赛从可选策略变成了生存必要条件。
标签: #AI日报 #博通 #Broadcom #芯片股 #SK海力士 #KOSPI熔断 #DeepSeek #融资 #590亿美元 #腾讯 #CATL #OpenAI #DreamingV3 #记忆系统 #ChatGPT #华为云 #AgenticAI #百模千态 #Anthropic #AI暂停 #递归式自我改进 #阶跃星辰 #Step3.7Flash #台积电 #TSMC #股东会 #AI需求 #智谱 #科创板IPO #JonyIve #AI设备 #ArcANE #角色扮演 #AI蠕虫 #网络安全
标签:#AI日报#博通#Broadcom#芯片股#SK海力士#KOSPI熔断#DeepSeek#融资#590亿美元#腾讯#CATL#OpenAI#DreamingV3#记忆系统#ChatGPT#华为云#AgenticAI#百模千态#Anthropic#AI暂停#递归式自我改进#阶跃星辰#Step3.7Flash#台积电#TSMC#股东会#AI需求#智谱#科创板IPO#JonyIve#AI设备#ArcANE#角色扮演#AI蠕虫#网络安全
夜雨聆风