AI要闻速递 | OpenAI四弹齐发,DeepSeek杀到1元,港股AI股暴跌6%
本周 AI大模型 圈信息量大到让人喘不过气——OpenAI 连发四弹、DeepSeek 价格屠夫再出手、AI智能体 成为新风口。谁在狂欢?谁在焦虑?答案藏在20条新闻里。
1. GPT-5.5 正式发布,Agentic Coding 稳坐 SOTA
OpenAI 在 4/23 连续发布 GPT-5.5 和 GPT-5.5 Pro,其中 GPT-5.5 在 Terminal-Bench 达到 82.7%,GDPval 达到 84.9%,双双刷新 Agentic Coding 最佳成绩。比 GPT-5.4 更智能、更快、Token 效率更高。
观点:Agentic Coding 已成 OpenAI 的”杀手级场景”,Terminal-Bench 82.7% 意味着什么?意味着 AI 写代码的能力已经超过大多数中级程序员。这不是危言耸听——你可以不会写代码,但你的竞争者会。
2. GPT-5.5 Pro 推理能力炸裂,FrontierMath Tier 4 达 39.6%
GPT-5.5 Pro 在 FrontierMath Tier 4 级别测试中达到 39.6%,远超 GPT-5.4 的 27.1%。这是当前最强推理模型之一,专门为复杂科学问题设计。
观点:Tier 4 是什么概念?这是数学研究前沿的难度级别。39.6% 听起来不高,但这是”AI 能解决人类数学家都头疼的问题”的开始。下一个突破口,很可能是 AI 自主发现新的数学定理。
3. ChatGPT Images 2.0 上线,图像生成进入新纪元
OpenAI 同步发布 ChatGPT Images 2.0,新一代图像生成能力,具体细节尚未完全公开,但已知在质量和效率上有显著提升。
观点:图像生成赛道卷了两年,OpenAI 终于入场。这次不是”画得好看”,而是”用得顺手”——ChatGPT 的用户基数就是护城河。Midjourney、Stability,你们准备好了吗?
4. Workspace Agents 登场,企业级共享 Agent 时代开启
OpenAI 推出 Workspace Agents,企业级共享 Agent,支持 Slack 集成,可在云端持续运行。85% 的 OpenAI 员工每周都在用 Codex。
观点:这才是 AI 落地的真正形态——不是”每个人一个 AI 助手”,而是”每个团队一个共享 Agent”。Slack 集成意味着什么?意味着 AI 正式进入企业工作流的核心。上班族们,你们的工作方式要变了。
5. DeepSeek-V4-Flash 发布,1 元/百万 Token 成新基准
DeepSeek 发布 V4-Flash 版本,284B 参数激活 13B,1M 上下文,输入价格仅 1 元/百万 Token(缓存命中 0.2 元),输出 2 元/百万 Token。
观点:价格战进入”极限时代”。1 元/百万 Token 是什么概念?你可以把《三体》全文扔进去,花费不到一毛钱。这对开发者来说是福音,对竞争对手来说是噩梦——DeepSeek 在用”补贴式定价”抢占市场。
6. DeepSeek-V4-Pro 数学能力超越所有开源模型
DeepSeek-V4-Pro 拥有 1.6T 参数激活 49B,在数学、STEM、竞赛代码评测中超越所有开源模型,Agent 能力接近 Opus 4.6 水平,世界知识储备仅次于 Gemini Pro 3.1。
观点:开源模型的”天花板”又被抬高了。V4-Pro 的数学能力意味着什么?意味着开源社区终于有了一个”能用、好用、便宜用”的数学推理模型。学术界、创业公司,你们的算力焦虑可以缓解了。
7. 美团秘密试水万亿参数大模型,纯国产算力训练
美团被曝正在秘密测试万亿参数大模型,完全依赖国产算力集群训练,目前仅限邀请测试。
观点:互联网大厂都在押注”自研大模型”,美团的选择是”万亿参数+国产算力”。这背后是两个信号:一是国产算力产业链已经成熟,二是万亿参数已成”入场券”。美团能跑通吗?答案是——必须跑通,否则就没有下一代电商。
8. 寒武纪 Day0 适配 DeepSeek-V4,国产芯片产业链协同加速
寒武纪宣布 Day0 适配 DeepSeek-V4 全系列芯片,实现”发布即兼容”。
观点:Day0 适配意味着什么?意味着国产芯片厂商的响应速度已经达到国际水平。这不是简单的”兼容”,而是”生态协同”——DeepSeek 出新模型,寒武纪立刻跟进。国产 AI 产业链的”完整流程”正在形成。
9. 腾讯云 DeepSeek-V4 预览版上线,百万上下文+新加坡节点
腾讯云 TokenHub 上线 DeepSeek-V4 预览版,支持百万上下文,新加坡节点同步开放。
观点:腾讯的打法很清晰——”模型不是我做的,但我提供最好的服务”。新加坡节点意味着海外用户也能用上 DeepSeek。云厂商的竞争,正在从”谁家模型强”转向”谁家服务好”。
10. Cohere × Aleph Alpha 跨大西洋合作,共建”主权 AI”
加拿大 Cohere 与德国 Aleph Alpha 达成战略合作,交易金额传闻 200 亿美元(另有版本称 20 亿),共建欧洲”主权 AI”。
观点:主权 AI 是什么?就是”不依赖美国科技巨头”的 AI 能力。欧洲正在觉醒,德国出技术、加拿大出算力,共同对抗 OpenAI 和 Google。这场”AI 冷战”,主角越来越多。
11. 福客 AI 获阿里战略投资,AI Agent 电商全链路
福客 AI 获得阿里巴巴战略投资,专注于 AI Agent 在电商场景的全链路应用。
观点:电商是 AI Agent 最容易落地的场景之一——客服、选品、定价、投放,每个环节都能自动化。阿里投资福客,意味着电商巨头正在为”无人工干预运营”做准备。中小卖家们,你们准备好了吗?
12. 港股大模型股集体大跌,智谱跌 6.3%、MiniMax 跌 3.9%
港股 AI 概念股遭遇重挫,智谱 AI 跌 6.3%,MiniMax 相关概念股跌 3.9%,市场情绪转向谨慎。
观点:为什么大跌?可能是前期涨幅过大,可能是估值泡沫,也可能是市场在等待”真正赚钱的 AI 公司”。大模型概念股的”蜜月期”正在过去,接下来要看谁能交出真实的商业化答卷。
13. Google DeepMind DiLoCo 架构突破,硬件故障利用率从 27% 升至 88%
Google DeepMind 发布 Disentangled DiLoCo 分布式训练架构,在硬件故障场景下,利用率从传统的 27% 提升至 88%,带宽需求从 198Gbps 降至 0.84Gbps。
观点:这是”基础设施层面的革命”。训练大模型最怕什么?硬件故障。传统架构一旦故障,利用率直接崩盘。DiLoCo 解决了这个问题,意味着更稳定、更便宜的大模型训练。开源社区会跟进吗?
14. 宝马发布 AI 智能座舱助手,能理解复杂出行需求
宝马发布新一代 AI 智能座舱助手,能够理解复杂的出行需求,如”带我去一个安静的地方喝咖啡”。
观点:车载 AI 的竞争已经从”语音控制”升级为”需求理解”。宝马的野心是让汽车成为”会思考的出行伙伴”。特斯拉、蔚来、小鹏,你们跟上了吗?
15. 斑马智行接入支付宝 AI 付,车载支付进入 AI 时代
斑马智行宣布接入支付宝 AI 付车载版,用户可在车内完成语音支付。
观点:车载场景的最后一个”缺口”被填补了——支付。以后加油、停车、过路费,一句话就能搞定。AI 正在渗透生活的每个角落,包括你的驾驶座。
16. 昆仑万维发布”4+3 战略”,从技术底座到商业完整流程
昆仑万维发布”4+3 战略”,覆盖技术底座、模型平台、应用场景、商业化变现四大层面,三个核心业务方向。
观点:昆仑万维的打法是”全栈布局”。不是单点突破,而是”技术+平台+应用+商业化”一条龙。这条路风险高、投入大,但如果跑通,就是真正的 AI 公司,而不是”AI 概念公司”。
17. Perplexity CEO:AI 将强化而非取代 iPhone
Perplexity CEO Aravind Srinivas 表示,AI 不会取代 iPhone,而是会强化 iPhone 的体验。
观点:为什么 Perplexity 的 CEO 要为 iPhone 站台?因为 Perplexity 需要苹果生态的流量入口。AI 搜索 + iPhone,这个组合正在成为现实。下一个被 AI 改变的硬件,会是什么?
18. 银河医美发布小俊医生 2.0,颅脑 CT 全疾病覆盖
银河医美联合天坛医院发布小俊医生 2.0,全球首个实现颅脑 CT 全疾病覆盖的大模型,可辅助生成 CT 报告。
观点:医疗 AI 正在从”辅助诊断”进化为”全疾病覆盖”。颅脑 CT 是高难度领域,小俊医生 2.0 的发布意味着 AI 在医学影像上的能力已经达到专家级。医生的”数字助手”,正在变成”数字同事”。
19. 九成游戏开发商已使用 AI 技术,谷歌高管揭秘
谷歌高管透露,90% 的游戏开发商已经在使用 AI 技术,涵盖美术、代码、策划等多个环节。
观点:游戏行业是 AI 的”试验田”——成本敏感、迭代快、创意密集。九成使用率意味着什么?意味着”不用 AI 的游戏公司,正在被淘汰”。AI 不是选择题,而是生存题。
20. 小俊医生 2.0:全球首个颅脑 CT 辅助报告大模型
小俊医生 2.0 由银河医美与天坛医院联合发布,是全球首个实现颅脑 CT 全疾病覆盖的大模型,可自动生成辅助报告。
观点:这是 AI 在垂直领域的”里程碑式”应用。颅脑 CT 涉及数十种疾病类型,小俊医生 2.0 的全覆盖意味着 AI 已经可以在特定领域超越人类医生的平均水平。下一个被 AI 革新的医疗领域,会是什么?
写在最后
这周的 AI 圈,三大趋势呼之欲出:
1. 价格战进入”极限时代”:1 元/百万 Token 成新基准,DeepSeek 再次定义”便宜”。
2. Agent 能力成核心竞争力:从 GPT-5.5 的 Agentic Coding SOTA,到 Workspace Agents 的企业落地,AI 正在从”辅助工具”进化为”工作伙伴”。
3. 国产产业链协同加速:从美团的万亿参数,到寒武纪的 Day0 适配,国产 AI 的”完整流程”正在形成。
下周会发生什么?我们拭目以待。
夜雨聆风