乐于分享
好东西不私藏

2026年04月29日全球AI前沿动态

2026年04月29日全球AI前沿动态

一句话总结: 2026年4月28-29日,AI领域迎来Agentic AI商业化爆发、万亿参数MoE模型密集发布、微软OpenAI结束独家合作、物理AI进入工厂实测、算力基础设施多元竞争七大核心趋势,同时Agent安全风险、就业冲击与治理框架滞后等深层挑战同步浮现。


一、模型与技术突破

1.1 通用大模型

DeepSeek: 发布V4系列大模型,采用万亿参数MoE架构,支持百万级Token上下文,核心特性为”批次不变性”设计(确保不同批次大小下输出逐比特一致),牺牲部分GPU利用率换取稳定性与可复现性,采用dual-kernel注意力解码与自研DeepGEMM替代cuBLAS。完成对华为昇腾芯片适配,在昇腾950PR上实现35倍推理速度提升。API缓存命中价格降至0.025元/百万tokens(首发价1/10),Pro版限时2.5折,Flash版0.02元/百万tokens,旨在极致性价比推动普及。

阿里巴巴: 发布视频生成模型HappyHorse 1.0,采用150亿参数统一Transformer架构,原生多模态设计将文字理解、图像参考、视频生成和音频合成整合至单一模型,避免多模型级联导致的信息损失和音画不同步。支持15秒多镜头叙事、1080P超分输出、多画幅适配(16:9/9:16/1:1),具备方言口型匹配与跨语言对白生成能力,在Artificial Analysis评测平台登顶。定价低于主要竞品,单条短片成本约为竞品三成。

腾讯混元: 发布并开源Hy3 preview,采用MoE架构(295B总参/21B激活),最大支持256K上下文,复杂推理和代码能力显著提升,首Token延迟降低54%。同时开源具身多模态大模型HY-Embodied-0.5-X,专为具身任务优化,包含端侧部署版和复杂任务版。另开源离线翻译模型Hy-MT1.5-1.8B-1.25bit,采用Sherry稀疏三值量化技术压缩至440MB,支持33种语言手机端离线运行,翻译质量超越谷歌翻译。

小米: 发布并开源MiMo-V2.5系列,总参数310B、激活参数15B,上下文窗口最高支持1M tokens,采用MIT协议。基于MiMo-V2-Flash骨干拓展专用视觉、音频编码器,统一架构支持文本、图像、视频、音频理解,在多模态感知、长上下文推理、智能体工作流场景表现优异。开源首日完成阿里平头哥、AWS、AMD、百度昆仑芯、燧原、沐曦、天数智芯7家芯片厂商Day-0适配。推出”百万亿Token创造者激励计划”,30天内免费发放总计100万亿Token权益。

月之暗面: Kimi K2.6参与横评,在长上下文推理、Agent长程任务等维度表现突出。计划于第三季度推出Kimi K3,参数规模达2.5万亿,上下文长度预计提升至约100万字。

蚂蚁集团: 百灵大模型系列更新,开源Ling-2.6-flash模型,总参数104B、激活参数7.4B,针对Agent场景优化推理效率和Token利用率。通过混合线性架构和稀疏MoE技术,在4×H20服务器上推理速度达340 tokens/s。在编码、文档处理和轻量级Agent工作流程方面表现出色,BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval等基准接近SOTA。

商汤科技: 发布并开源SenseNova U1系列原生理解生成统一模型,基于NEO-Unify架构去除VE和VAE,构建统一表征空间,无需适配器即可原生实现语言、视觉模态的统一处理。轻量版U1 Lite推出8B-MoT和A3B-MoT两个规格,多项基准测试达同量级开源SOTA,部分指标比肩Qwen-Image 2.0 Pro等闭源大模型。业内首次实现单次单模型调用的连续性图文创作输出,图像间风格保持高一致性。

英伟达: 发布开源多模态模型Nemotron 3 Nano Omni,采用30B-A3B混合专家(MoE)架构,统一支持视频、音频、图像、文本理解,集成GUI、OCR、语音转录能力。在单一推理循环中统一处理多模态输入,吞吐量达同类开放模型9倍,在MMlongbench-Doc、OCRBenchV2等文档智能排行榜表现最佳。支持跨Ampere/Hopper/Blackwell GPU系列硬件感知优化推理,完全开放权重、数据集和配方。

阶跃星辰: 发布Step Image Edit 2,参数量仅3.5B,采用多专家自演化学习和分布匹配强化学习两大创新,实现轻量级参数下的跨量级性能突破,超越12B-20B级开源模型。单次生图仅需0.5-2秒,支持中英文渲染、局部编辑、视觉推理、主体一致性、风格迁移等,在KRIS-Bench轻量级榜单排名第一。

讯飞星火: 发布X2-Flash模型,采用MoE架构,支持256K超长上下文,基于华为昇腾910B集群训练。在代码生成和智能体任务中表现媲美万亿级参数模型,深耕国产算力生态。

字节跳动: Doubao-Seed-2.0-Pro-260215在SuperCLUE-VLM测评中以90.66分列总榜第一。

面壁智能: 联合清华大学等机构发布MiniCPM-o 4.5,业界首个端到端全双工全模态大模型,参数规模约9B,支持视频、音频、文本流输入及文本与语音连续输出。基于Omni-Flow流式全模态框架,打破传统回合式交互逻辑,实现毫秒级统一时间轴。量化优化后仅需12GB显存即可流畅运行全双工模式,消费级显卡可部署。

阿里千问: Qwen3.6-27B推出全新3bit混合量化版本,采用5bit处理嵌入层和预测层、其余部分3bit,Mac用户推理速度提升两倍。另发布QoderWorker桌面Agent,上线金融、法律、营销等六大领域共10套专家套件。

1.2 垂直大模型

OpenAI: 发布生命科学专用模型GPT-Rosalind,在蛋白质结构预测中TM-score达0.978,药物靶点预测准确率89%,将生命科学研究效率提升一个量级。同时发布GPT-5.5全新提示词指南,建议抛弃冗长指令转向精简、结果导向的提示方式。

中国科学院: 发布”磐石100″科学大模型体系,以”磐石”科学基础大模型为底座,覆盖数学、物理、材料等八大领域,集成2000多个科研工具,已在50多家科研单位应用。

易鑫: 推出汽车金融Agentic AI解决方案,发布专属大模型XinMM-AM1,参数量约300亿,单卡吞吐可达370 tokens/s,响应延迟低于200ms,支持语音实时交互。配套Harness AI Infra框架及三层驾驭体系,实现人机协同与风险管控,覆盖风控反欺诈、智能进件及融后服务全链路。

达摩院: 联合广东省人民医院发布肠癌筛查AI模型DAMO COCA,基于27433人平扫CT数据,敏感性86.6%,特异性99.8%,研究成果发表于Annals of Oncology。

1.3 专项技术突破

DeepSeek V4批次不变性: 技术报告揭示核心工程设计,确保同一token无论批次大小或组合如何输出均保持逐比特一致。采用dual-kernel处理注意力解码,使用自研DeepGEMM替代cuBLAS进行矩阵乘法,牺牲部分GPU利用率与推理速度,换取预训练、后训练及推理全流程的可复现性与对齐稳定性。

华为SHAPE: 泰勒实验室与北京大学、上海财经大学合作提出,通过”里程碑+推理税”机制优化大模型数学推理能力,在ACL 2026被接收。实验结果显示在多个基准测试中平均提高3%准确性,Token使用量降低约30%。

华为Coordination Engineering: openJiuwen社区发布技术体系,实现多智能体自主协作、高效沟通和无缝合作。包含Agent Team引擎、Team Skills技能沉淀与复用、Team Skills Hub共享平台,具备自演进能力,使AI团队从”单兵作战”升级为可复制、可进化的能力集合。

清华AutoSOTA: 徐丰力助理教授团队推出AI科研自动化项目,一周内消耗约10.4万美元算力,成功发现105个性能显著提升的新模型,旨在将AI研究从手工艺模式转变为工业流水线模式。

北大One-Eval: 开源AI评测框架,采用智能体化设计,在DeepSeek-V4发布后10小时内完成全量自动化评测。通过自然语言交互取代传统脚本,降低评测门槛,提供破解”数据污染”的技术方案。

论文揭示ERM几何盲点: 研究证明使用标准经验风险最小化(ERM)训练模型时,几何脆弱性并非学习失败而是监督目标强加的数学必然性。PGD对抗训练仅将敏感度重新分布而非消除,导致各向异性雅可比矩阵。提出轨迹偏差指数(TDI)和PMH(惩罚流形硬化)修复方法。

ACL 2026 | LCA: 长文本推理提速技术,缓存缩减90%,效率提升2.5倍,适用于多种规模及架构的大模型。

ACL 2026 | Doc-V:* 小米大模型Plus团队与华中科技大学VLRLab合作提出多页文档理解新范式,通过交互式视觉推理让模型像人类一样有策略地阅读长文档,在Qwen2.5-VL 7B模型下比RAG变体高出49.7%。

微软World-R1: 通过强化学习增强文本到视频生成中的三维约束,结合相机感知潜在初始化、来自预训练基础模型的3D感知奖励以及周期性解耦训练策略,提高几何一致性同时保持视觉质量和运动多样性。

英伟达Blackwell软件升级: GB200 NVL72平台运行DeepSeek-R1模型,单GPU吞吐量三个月内提升2.8倍。引入NVFP4四比特浮点格式,结合分解服务策略将预填充与解码任务分配至不同GPU组,解决MoE架构通信瓶颈。

1.4 AI框架

MathForge (ICLR 2026): 数学推理优化双轨框架,包含难度感知组策略优化(DGPO)算法与多维度问题重构(MQR)策略。DGPO解决传统GRPO对难题更新权重不足问题,MQR在保留标准答案前提下提升训练数据难度,二者形成协同优化循环。

STReasoner (ACL 2026): 面向时序数据时空推理的大模型框架,通过三阶段训练管线(时序对齐SFT、冷启动推理SFT、空间感知强化学习)实现,配套专用ST-Bench多模态评测基准。

LLaDA2.0-Uni: Inclusion AI推出的基于扩散大语言模型的MoE架构多模态模型,统一多模态理解与生成能力,支持文生图、图像理解、图像编辑、多模态混合推理等任务,经蒸馏可实现8步快速推理。

Beads: 为AI编程助手提供结构化任务追踪系统,利用依赖关系图管理任务,基于Dolt版本控制数据库支持分支和合并,允许多个Agent在不同分支上并行工作。具备记忆衰减机制,自动压缩已完成任务摘要。

OpenChronicle: 面向具备工具调用能力的LLM Agent的开源、本地优先内存方案,以AX树优先、截图辅助方式捕获用户操作结构化上下文,生成持久化Markdown内存,支持多种模型提供商。

JiuwenClaw: 基于openJiuwen开发的智能AI Agent,采用Python编写,可将大模型能力通过各类通讯应用触达用户。支持任务智能调度、自主技能进化,可私有化部署保障数据主权。

FireRed-OpenStoryline: 开源AI自动化视频创作智能体,基于大语言模型和多模态大模型构建,用自然语言对话代替传统手动剪辑操作,涵盖智能素材搜索与整理、智能文案生成、智能视听匹配及对话式精修。

holaOS: 新型智能体操作系统,为AI智能体分配独立计算机环境,每个工作空间具备完全隔离的应用程序、记忆、文件及执行能力,不使用API封装或影子账户,让智能体在独立空间内运行真实账户。

AgentPort: 开源工具,为AI智能体连接第三方服务时提供细粒度权限管理与安全网关。用户可设置自动批准、需人工审批及禁止操作等权限级别,智能体通过MCP或CLI连接,无需直接接触API密钥。

VLAA-GUI: 针对图形用户界面智能体的创新框架,包含停止完整性验证器、恢复循环打破者、搜索智能体三个核心模块。结合Opus 4.6模型在OSWorld-Verified基准上达到77.5%成功率,首次超过人类72.4%水平。


二、智能体与AI应用

Manus/Genspark: Agent商业化路径验证。Manus于2025年3月上线,8个月后ARR突破1亿美元。Genspark成立45天实现ARR 3600万美元,成立9个月后ARR突破1亿美元,标志Agent全新赛道正式开启。

OpenClaw (龙虾): MIT协议开源AI Agent,核心主张”每个人都应该有一只自己的虾”,GitHub星标突破36万。引发百虾争鸣生态,腾讯、智谱、MiniMax、Kimi、字节等纷纷推出各种版本。发布v2026.4.25版本,全面接入OTEL可观测性框架,接入13个TTS语音提供商,重构插件冷启动机制。

Hermes: 突破工具边界,不仅拥有持久记忆(记得用户偏好、习惯和上下文),还可自动创建技能,每解决新问题生成可复用技能文档,甚至能生成子Agent进行并行处理,实现从工具向数字员工跃迁。

Claude Code: Anthropic发布一系列创意软件连接器,将Claude深度整合到Blender、Autodesk、Adobe(8款工具打包接入)、Ableton、Splice等3D、设计、音乐、VJ软件中。通过MCP接口直接操作软件Python API,实现分析场景、批量修改对象、编写脚本等功能。同时新增手机推送通知功能,任务完成主动提醒,形成派活、执行、汇报完整闭环。

Codex: OpenAI编程助手,400万周活跃用户。与AWS合作上线Bedrock平台,支持命令行及桌面应用接入。具备浏览器智能体能力,支持在同一界面生成文档、调用浏览器及控制本地应用。

Devin终端版: Cognition推出本地命令行智能体,核心设计在于本地与云端无缝交接。支持多模型路由(Anthropic/OpenAI/Google及自家SWE-1.6),SWE-1.6在代码基准测试性能提升约11%,吞吐率达每秒950令牌。使用Rust自研终端渲染库。

Amazon Quick: 亚马逊云科技推出桌面端AI助手,常驻后台运行,深度联通本地文件、邮箱、日程及Microsoft 365、Slack、Salesforce等主流办公平台。支持自然语言生成演示文稿、数据看板和智能应用,从被动应答升级为主动预判式办公。3M、宝马、纽约人寿等已规模化部署,文档制作时长缩减80%。

ima copilot: 正式上线知识Agent,内置记忆系统包含设定、用户档案、长期记忆和经验技巧四大模块,可跨场景连续调用减少重复输入。支持全场景感知,以浮窗形式伴随用户浏览网页、文件和知识库。同步上线Skills生态,支持用户自行添加技能和接入第三方模型API。

百度GenFlow 4.0: 通用智能体,Office Agent月活用户突破1亿,月任务交付量达2亿次。PPT、Excel、Word三大Agent支持自然语言生成与一键排版,新增记忆中心实现自主思考与项目记忆。深度兼容OpenClaw支持手机电脑协作与定时任务,团队版Agent军团将于5月底发布,团队工作流可压缩至13分钟。

支付宝”AI收”: 推出智能体支付生态闭环功能,支持OpenClaw等AI Agent通过标准接口实现”按调用即时收款”,补齐供给侧收款短板,构建从支付到收款的完整双向生态。

美团”小团”: AI助手完成重大升级,入口迁移至App首页核心位置,支持自然语言理解如规划旅游路线,能动态组合优惠券直接下单。基于真实数据核验商家信息,简化从搜索到支付流程。

高德”AI专车管家”: 将AI应用于接驾、行程和服务全流程,首期在北京、上海上线。

携程商旅AI生态: 发布全景图,覆盖差旅出行、管理等四大场景,推出差旅问答、合规风控等7个专属AI Agent,已向15家大型企业输出17项AI底层能力。

字节豆包”帮你选”: 推出AI导购功能,将对话式推荐与一键下单深度融合,实现从”人找货”向”AI带货”模式演进。

阿里QoderWorker: 桌面Agent,上线金融、法律、营销等六大领域共10套专家套件。

小红书AI治理: 首次发布AI治理主张,要求创作者如实标识AI生成内容,未主动标注的平台将统一添加标识,反对AI造假、侵权和仿冒行为,上线申诉通道。

七家财经媒体联合版权声明: 《证券时报》等七家主流财经媒体联合发布版权保护声明,明确禁止未经授权将原创内容用于AI模型训练。

南非撤回AI政策: 通信与数字技术部长撤回首份国家人工智能政策草案,因引用AI生成的虚假参考文献。

国家发改委禁止外资收购Manus: 依法禁止美国科技巨头Meta以约20亿美元收购中国人工智能项目Manus,并责令撤销该笔交易,成为《外商投资安全审查办法》实施以来首个被叫停的AI领域收购案,维护国家安全和AI技术主权。

印度AI内容强制标签新规: 出台AI内容强制标签新规,中小平台合规成本分化导致股价平均下跌11.5%。


三、物理AI/机器人

小米人形机器人: 新款人形机器人亮相投资者日,已进入汽车工厂实测阶段,复杂安装成功率超过90%,自主运行3小时。计划未来5年内实现大批量工厂进驻,并逐步渗透至办公及家庭场景。

小米Xiaomi-Robotics-0: 发布并开源视觉-语言-动作大模型真机后训练全流程,机器人可利用约20小时数据实现亚毫米级精度操作。开源攻克”偷懒效应”三大关键技术:自适应加权机制、Λ型掩码、前缀动作随机遮蔽。

Kinetix AI KAI: 成立仅7个月发布人形机器人,具备115个自由度和18000触点全身触觉皮肤系统,采用世界模型、数据体系与训练方法三者闭环设计理念。通过机器人主持发布会展示高拟人技术路线。

银河通用LDA-1B: 发布跨本体”隐式世界-动作基础模型”,1.6B参数,在RSS 2026收录。首次实现虚实共融、人机混合、有无标注的全类数据统一高效利用,在单一扩散框架内融合策略学习、前向/逆向动力学和视觉预测四大能力,性能超越GR00T-N1.6和π0.5等顶尖模型最高达48%。仅需1小时后训练即可适配不同机器人本体。

生数科技MotuBrain: 发布通用世界行动模型,基于UniDiffuser框架统一建模视频与动作模态,定位具身智能机器人通用大脑。采用视频、动作、语言三流MoT架构,可完成10个原子动作级别的复杂长程任务,在WorldArena与RoboTwin 2.0两大国际榜单同时夺冠。

宇树G1: 人形机器人将于5月在日本羽田机场试点,辅助搬运行李货物。

破壳机器人: 前星海图首席科学家许华哲创立,专注具身智能C端家庭赛道,完成数千万美元天使轮融资。计划优先落地物体传递、收纳及清洁等10项通用任务,坚持端到端模型训练,依托世界模型具身基模。

星动纪元: 具身智能企业完成超2亿美元融资,顺丰领投,推进千台级别机器人交付。

无界动力: 完成天使++轮融资,累计融资额超2亿美元,获5亿元订单,将面向欧洲、亚洲等地区部署应用。

森启智能RoboBrain: 发布系统,利用Milvus向量数据库打造机器人分层记忆(实时状态、短期上下文、长期语义记忆),解决任务断点问题,实现任务可重复执行、过程可追踪及经验可沉淀。

灵初智能SpatiXBot: 发布具身时空大脑及Psi-R2模型,使用9.5万小时人类数据训练,在服装分拣任务中成功率99.9%。已完成20亿元融资,布局数据入口。

佑驾创新小竹T5 Pro: 推出国内首款”真无图”L4级无人物流车,采用一段式端到端大模型,摆脱高精地图依赖,部署周期缩至天级。硬件架构全国产化,已在18座城市落地超7000台。

小马智行RoboVan: 发布全球首款全车规、全冗余L4级无人驾驶轻卡,正式进军城配市场。宣布2027版全无人Robotaxi整车总成本将降至23万元以内,依托”世界模型2.0″技术基座,预计2026年全球落地超20座城市,车辆总规模超3000台。

曹操出行Eva Cab: 发布中国首款原生研发Robotaxi原型车,基于AI电子电气架构EEA 4.0,搭载英伟达Thor芯片与高通8797处理器,总算力2000TOPS,2160线数字化激光雷达。

华为与江淮尊界: 计划推出售价约200万元的高定新车S800 Ultimate,预计6月底发布,直接竞争劳斯莱斯、宾利等超豪华品牌。首款车型S800已累计交付超1.6万台,连续7个月位居百万级轿车销量榜首。

奇瑞与英伟达: 达成全球战略合作,将采用DRIVE Hyperion平台支持L3/L4级智能汽车,并利用生成式AI技术提升座舱功能。双方还将在机器人领域合作,基于Jetson平台探索人形机器人。

富士通与卡内基梅隆大学: 宣布合作成立”物理AI联合研究中心”,共同研发AI驱动机器人的操作系统,计划于2026年内推出首个版本。

Hugging Face Reach Mini: 接收首批开源机器人,优先分发至迈阿密办公室,允许开发者利用智能体构建各类应用程序,推动开源机器人生态发展。


四、硬件与基础设施

英伟达Blackwell: GB200 NVL72平台运行DeepSeek-R1模型,单GPU吞吐量三个月内提升2.8倍。引入NVFP4四比特浮点格式,结合分解服务策略将预填充与解码任务分配至不同GPU组。另发布Vera CPU作为独立基础设施选项,首次推向市场挑战英特尔和AMD数据中心处理器地位。Groq 3 LPX芯片预计2026年Q3提前发货,富士康为独家代工厂。

芯擎科技龙鹰二号: 发布5nm车规级AI座舱芯片,AI算力达200TOPS,原生支持7B以上参数多模态大模型。采用柔性架构覆盖从入门到旗舰级中央计算平台,集成车控处理单元实现”舱驾融合”,计划2027年Q1启动适配。

阿里平头哥磐脉920: 发布国内首款智能网卡,最大支持400Gbps带宽,已量产部署。

香蕉派BPI-SM10: 发布微型计算机,搭载进迭时空K3 RISC-V AI CPU,集成60 TOPS AI加速器,可运行300亿参数模型,功耗18-35瓦,推动RISC-V AI生态发展。

曦智科技: 在港交所上市,首日开盘大涨超380%,总市值达809亿港元,为全球首家大规模部署光电混合算力的公司,2025年占中国光互连市场88.3%。

摩尔线程: 2026年Q1营收7.38亿元同比增长155.35%,归母净利润扭亏为盈至0.29亿元,获得6.6亿元夸娥智算集群大单,成为少数实现千卡级、万卡级大规模集群商业化应用的GPU供应商。

沐曦股份: 高级副总裁指出国产算力突围关键在于补全生态协同短板,2025年底量产曦云C600 GPU,计划2026年推出下一代曦云C700及面向科学智能的曦索X系列。

英特尔: 2026年Q1营收136亿美元,数据中心与AI业务贡献51亿美元同比增长22%,股价创历史新高,本月累计上涨87%。发布DeepSeek-V4大模型INT4量化版本,支持无MXFP4硬件环境运行。

三星Galaxy Glasses: 实拍图曝光,搭载高通AR1处理器和Gemini AI,重约50克,采用光致变色镜片和Android XR系统,预计售价379-499美元。

OpenAI手机芯片: 正与高通、联发科合作研发专用手机芯片,选定立讯精密为独家代工商,预计2028年量产。新手机将采用以AI Agent为核心的系统架构,推动手机从”App为中心”向”AI Agent为内核”范式转变。

华为昇腾950PR: DeepSeek-V4完成适配,实现35倍推理速度提升。另推出8192张昇腾NPU卡组成的新一代算力底座,提升大模型训练效率。

天翼云: 在第九届数字中国建设峰会展示Token生产、输送、应用全链条能力,智算总规模达91EFLOPS。

京东JoyInside: 启动AI硬件孵化计划”Aidol创造营”,清华大学开发的”画伴”获得总冠军。

图灵量子: 完成数亿元融资,由国家创投引导基金及浦东国资领投,建成国内首条光子芯片中试线。

存储行业: HBM需求强劲推动DRAM产能转移,美股存储概念股闪迪、美光、希捷创下新高。Gartner预测PC价格将上涨17%,SSD价格已翻倍,博通等公司已锁定至2028年内存储供应。

光模块产业: 1.6T光模块量产出货,3.2T产能启动建设,上游磷化铟衬底供不应求价格持续攀升,薄膜铌酸锂材料有望在3.2T时代规模化应用。

PCB板块: 受AI算力需求驱动,一季度归母净利润同比增长53.62%,部分CCL厂商宣布涨幅最高达20%至40%,AI服务器PCB成为核心增长动力。

高纯氦气: 受中东局势及俄罗斯出口限制影响,价格近一月内暴涨333.63%,六氟化钨和三氟化氮也迎来涨价。


五、企业动态

微软-OpenAI: 结束七年独家合作关系,修订合作协议。微软对OpenAI模型和产品的知识产权许可由独占变为非独占,有效期维持至2032年。OpenAI获得多云部署能力,可接入AWS等其他云平台,新产品仍优先在Azure发布。微软不再向OpenAI支付收入分成,OpenAI向微软支付的收入分成将持续到2030年并有总额上限。通用人工智能退出条款修改,需经独立验证才能触发。微软仍是主要云合作伙伴和重要股东,股价盘前一度下跌约4%。

OpenAI-AWS: 扩大战略合作伙伴关系,GPT-5.5及Codex正式上线Amazon Bedrock,推出Amazon Bedrock Managed Agents(限量预览)。企业可在熟悉AWS环境中使用最新OpenAI模型、代码代理和托管智能体服务。

谷歌-Anthropic: 计划向Anthropic投资100亿美元(未来可能增至400亿美元),提供5吉瓦算力和100万颗TPU芯片,使其估值飙升至3500亿美元。Anthropic正筹备IPO预计10月启动。

亚马逊-Anthropic: 追加250亿美元投资,总计超650亿美元,实质为云服务商锁定顶级AI模型的”算力预售”。

Anthropic: 年营收从10亿美元飙升至300亿美元(15个月内),超越OpenAI。但毛利率为-94%,每收入1美元需支出近2美元算力成本,预计2028年才能实现盈利。CEO的Claude Code产品年化收入约25亿美元,但按当前定价无法覆盖成本。

OpenAI: 未达内部用户与收入目标,CFO与Sam Altman就算力支出策略产生分歧。正与高通、联发科合作研发专用手机芯片,预计2028年量产。硬件负责人Richard Ho透露正在构建从芯片、机架、网络到数据中心的完整硬件系统,与Broadcom合作保留系统级架构设计权。

Meta: 签署协议采购1吉瓦太空太阳能电力用于AI数据中心,但相关技术尚未实际存在。内部AI竞赛”Claudeonomics”暴露员工月消耗Token达60.2万亿,一名员工消耗3285亿Token成本近200万美元。启动裁员计划,暂停填补空缺岗位并提供自愿买断。

Meta-微软: 同步启动裁员计划,暂停填补空缺岗位并提供自愿买断方案。

苹果: 计划未来数年推出约10个全新产品品类,涵盖智能家居、AI穿戴设备及硬件领域,首款为今年9月发布的折叠屏iPhone,售价预计超2000美元。计划将iPhone 18标准款运行内存从8GB升级至12GB以匹配Pro系列,满足”苹果智能”AI功能需求。新CEO约翰·特努斯将于9月1日上任。

小米: 宣布未来三年在AI领域投入超600亿元,基座大模型MiMo v2.5即将开源并适配国内所有芯片。布局具身智能、芯片xAI和Agent全场景化,预测机器人GPT3时刻将在1-2年到来。副总裁屈恒宣布相关战略。

字节跳动: 2025年净利润同比下滑超70%,主因第三、四季度大幅增加AI算力采购、基建及研发投入。优先股和期权成本变动亦影响财务表现。豆包App推出”帮你选”AI导购功能。

百度: 发布通用智能体GenFlow 4.0,Office Agent月活用户突破1亿。懂车帝旗下汽车垂直领域大模型通过国家生成式人工智能服务备案。

火山引擎: 发布基于Agentic AI架构的新一代汽车AI解决方案,通过统一”AI大脑”联动车控、导航、智驾等功能域,实现”感知、推理、执行、记忆、学习”闭环。已搭载于超700万辆汽车,覆盖50余个品牌、145款车型,日均座舱交互超3000万次。

华为: 发布新一代鸿蒙座舱HarmonySpace 6和AI交互式星环散射体技术,集成200余种动态光效与驾驶模式同步。推出”华为智擎”品牌及双94%电驱动系统,综合效率达94%以上。乾崑智驾ADS 5引入WEWA 2.0 AI智能体架构,云端算力增长至60 EFLOPS。

360: 发布ADE认证全国渠道合作战略,推出AI智能体工程师认证体系,与工信部NITE项目合作提供”一考双证”模式。

马斯克起诉微软/OpenAI: 正式提起诉讼,案件定于周一开庭审理。确认微软CEO萨提亚·纳德拉、OpenAI高管希冯·齐利斯、米拉·穆拉蒂及格雷格·布罗克曼将作为证人出庭。

XTransfer: 拟港交所主板上市,2025年TPV达605.16亿美元,占全球5.1%,将成全球最大B2B跨境支付上市公司。自研AI系统TradePilot实现98.5%自动审核。

三七互娱: 2026年第一季度营收37.20亿元,净利8.73亿元同比增长59.02%,智谱AI上市带动投资收益增长981.35%。


六、产品更新

GitHub Copilot: 宣布将于2026年6月1日起全面转向按量计费模式,引入AI Credits积分体系。基础月费保持不变(Pro 10美元/月,Pro+ 39美元/月),但按输入、输出和缓存的token使用量扣减。代码补全和”下一步编辑”建议仍包含在订阅中不消耗积分。5月开始提供账单预览,年付用户在当前套餐到期前仍按旧规则计费。

Claude Code: 新增手机推送通知功能,任务完成后主动向用户手机发送提醒,无需频繁切换终端查看进度。支持Ghostty、Kitty等终端桌面原生通知。

OpenClaw v2026.4.25: 发布新版本,口号”Less mystery, more machinery”,全面接入OTEL可观测性框架,覆盖模型调用、Token消耗、工具循环等全链路。默认不暴露原始prompt,一次性接入13个TTS语音提供商,重构插件冷启动机制改为查找表方案。

QClaw v0.2.14: 接入Hermes框架实现单一应用内调度两种Agent内核,底层模型支持Hy3 preview、DeepSeek-V4 Pro、KIMI-K2.6、GLM-5.1等。灵感广场升级为专家广场,内置100多个按行业和场景分类的AI专家。新增百度网盘、携程、飞猪、腾讯新闻四个平台接入,微信小程序新增语音交互和文件共享。

TRAE SOLO: 上线语音办公功能,与Insta360联名推出Mic Air麦克风套装(仅重7.9克,支持低延迟传输与AI降噪)。支持口语自动清洗、语义理解与自动修正,中英夹杂识别,全球注册用户超600万。

Adobe Firefly AI助手: 开启公测,面向Creative Cloud Pro订阅用户,支持自然语言指令跨软件协同创作。可将重复性任务处理时间缩短60%以上,具备个性化学习功能。

支付宝”AI收”: 推出智能体支付生态闭环,支持OpenClaw等AI Agent通过标准接口实现按调用即时收款。

高德地图AI Agent: 发布汽车出行AI Agent,具备”语言大脑”和”空间大脑”双引擎架构,能理解模糊指令如”去机场顺便充电”,动态规划包含充电桩和最优路径的行程方案。

可灵AI创作者计划3.0: 发布”灵感聚光计划”,每月百万奖金千万灵感值激励,单项目最高百万级宣发预算扶持。平台已吸引全球6000万创作者,累计生成超6亿视频,服务3万家企业客户。同步演示业内首个原生4K直出视频模型。

蚂蚁灵光App: 上线”体验世界模型”功能,成为业界首个可在移动端实现3D场景交互的AGI应用。用户上传图片即可生成可自由探索的3D环境,最长60秒,采用流式传输技术实现百毫秒级响应延迟。

阿里千问App: 首发灰度测试HappyHorse视频模型,可一键做TVB港风短片,推出”测一测”玩法让用户生成专属角色短剧片段。

荣耀YOYO: 智能助理率先接入DeepSeek-V4大模型,成为安卓阵营首个整合该技术的智能体,推理速度较前代提升37%,多轮对话准确率超92%。

三星Galaxy Glasses: 实拍图曝光,搭载骁龙AR1芯片与Gemini AI,重量约50克,定价379-499美元。

问界M9: 全新一代发布,首搭6颗激光雷达与ADS 5智驾系统,预售价49.98万元起,72小时预订量达25000台。魔方技术平台集成增程5.0、鸿蒙座舱及智能底盘,支持向L4具身智能演进。

理想L9 Livis: 旗舰车型亮相,预售价55.98万元,车身尺寸达5.25米。搭载自研5纳米马赫100芯片(算力2560 TOPS),配备4颗激光雷达,CLTC纯电续航420km,综合续航超1500km。

蔚来ES9: 全新大型SUV定位”科技行政旗舰”,车身尺寸5365/2029/1870mm,轴距3250mm,采用三颗激光雷达与天行全主动悬架。

东风奕派M8: 与华为乾崑达成战略合作,首款搭载ADS 5智驾系统与鸿蒙座舱的大六座SUV,将于5月首发。

吉利帝豪i-HEV: 发布第5代智擎混动车型,发动机热效率达48.41%,通过”电混同构”技术实现超八成行驶工况为纯电驱动,将高端混动技术下放至10万元级家用车市场。

长安启源Q05: 发布激光极智版,将激光雷达配置引入8万元级别市场,官方指导价10.49万元起,搭载地平线征程6M芯片(128TOPS算力)。

深蓝L06 Max: 发布全新中型纯电轿跑,官方指导价12.59万元起,可选装磁流变智能底盘系统(悬架调节频率高达1000次/秒),CLTC最高续航670km。

比亚迪天神之眼5.0: 展出自研智能辅助驾驶系统,支持全场景泊车及低温闪充技术(零下30度12分钟充满)。推出行业首个”智能泊车安全责任险”。

宁德时代: 第三代神行超充电池可实现6分27秒充满98%续航能力,新一代麒麟凝聚态电池有望使电动汽车续航达到1500公里。计划到2026年底建成4000座超换一体站。


七、投资

Ineffable Intelligence: 前谷歌DeepMind研究员David Silver创办的AI初创公司,在成立仅四个月后完成11亿美元种子轮融资,估值达到51亿美元,获得Sequoia Capital和Nvidia等机构投资。致力于通过强化学习开发超级智能系统。

谷歌-Anthropic: 计划投资100亿美元(最高400亿美元),提供5吉瓦算力和100万颗TPU芯片,推动Anthropic估值至3500亿美元。

亚马逊-Anthropic: 追加250亿美元投资,总计超650亿美元。

星动纪元: 具身智能企业完成超2亿美元融资,顺丰集团领投,推进千台级别机器人交付。

无界动力: 完成天使++轮融资,累计融资额超2亿美元,获5亿元订单。

破壳机器人: 完成数千万美元天使轮融资,许华哲创立,专注家庭场景具身智能。

中数睿智: 完成亿元级B轮融资,由多家机构领投,鼎晖VGC跟投,聚焦To B智能体操作系统。

MemoraX AI: 完成千万美元级种子轮融资,由L2F光源与钟鼎资本领投,专注解决大模型”健忘”难题,创始人郝建业为前华为高管。

图灵量子: 完成数亿元融资,由国家创投引导基金及浦东国资领投,建成国内首条光子芯片中试线。

曦智科技: 港股上市首日开盘大涨超380%,总市值达809亿港元,为全球首家大规模部署光电混合算力的公司。

摩尔线程: 2026年Q1营收7.38亿元同比增长155.35%,归母净利润扭亏为盈,获得6.6亿元夸娥智算集群大单。

英特尔: 股价创历史新高,本月累计上涨87%,AI算力结构从GPU主导向CPU需求增长转变。

英伟达: 股价突破历史新高,总市值超5.23万亿美元,4月累计涨幅达23%。黄仁勋宣布以20亿美元购入CoreWeave价值A类普通股,加速其在2030年前建成超过5吉瓦AI工厂的计划。

韩国KOSPI指数: 首次突破6600点创历史新高,主要受AI驱动的芯片和电力设备板块拉动,外国和机构投资者净买入约1.99万亿韩元。

中芯国际: 市值逼近6000亿元,半导体板块全面爆发,受DeepSeek-V4发布、国产替代强化及产业景气度提升三大利好驱动。

三七互娱: 智谱AI上市带动投资收益增长981.35%,2026年Q1净利8.73亿元同比增长59.02%。


八、行业观点与社会影响

腾讯研究院-智联网: 提出”智联网(Agentic Internet)”概念,以AI Agent为核心节点、自然语言为交互方式、任务完成为价值度量的新一代数字基础设施。核心转变包括:从GUI到CLI交互范式跃迁、从注意力变现到效果变现商业模式重构、从流量经济到能力经济生态逻辑重塑、从用户画像到用户记忆数据范式跃迁、从实名认证到Agent认证信任基础设施建立。

人类配额制探讨: 腾讯研究院提出应对AI就业冲击的可能性方案,参考残疾人就业配额制(《残疾人就业条例》规定1.5%比例),通过法律规定要求行业保留一定比例人类岗位,特别是在兜底性、基础性领域确保”人在环中”。与UBI(全民基本收入)区别:UBI把人从劳动者变成”受益人”,人类配额制通过法律保障”人被需要”的主体性。

Hinton预警: 在2026世界数字大会警告,全球AI产业2033年将达4.8万亿美元,但安全研究投入仅约1%。认为AGI是愚蠢术语,智能是多维的,应关注”超级智能”。将AI风险分为恶意使用、商业副作用、自主接管三类。对LeCun”LLM是死胡同”观点,认为多模态AI更高效,但纯语言模型在哲学层面也能理解空间。

吴恩达: 分析AI编程代理对不同软件任务加速效果差异:前端开发加速最明显(模型熟练主流技术栈),后端开发次之(需人类介入处理边界情况),基础设施环节加速有限(复杂取舍与测试瓶颈难以压缩),研究环节加速最小(思考与判断等非编码工作受益有限)。建议工程师学习产品管理技能,产品经理学习构建软件。

a16z Marc Andreessen: 认为风险投资中机会成本错误远比成本错误更危险,错过Google意味着失去千亿美元价值。识别顶尖创始人需关注智力、勇气与原始驱动力三要素。AI价值约99%将归属使用者形成消费者剩余,技术高度民主化但人才高度集中于硅谷。

桥水基金: 发出警告称AI快速发展对传统软件公司构成”生存性风险”,类似亚马逊对巴诺书店的冲击。标普500软件服务指数年内下跌约17%,AI公司正高薪挖角传统软件人才。

美联储研究: 显示自ChatGPT上线以来美国编程岗位三年减少约50万个。

短剧演员失业: 超过三分之二面临无剧可演,”卖脸”价格从早期1500-3000元降至100元/年。AI生产内容一个月上线量超过过去一年的真人短剧规模,生产效率提升超10倍。

AI就业冲击数据: 基础编程领域75%新增代码由AI生成,客服领域80%常规咨询由AI对接,翻译领域90%需求消失。群演、客服、翻译、设计、基础编程为被冲击第一批从业者。

数据权利: 用户上下文记忆将成为平台竞争新制高点,引发”用户的上下文记忆应归平台所有还是用户所有”的重要议题。

中心化风险: 若Agent调度权集中在少数主体手中,对整个数字经济的控制力将远超今天的超级App。

黑箱风险: Agent决策过程不透明,偏见、利益冲突和操纵有藏身之处。

数字鸿沟: 不会使用Agent或无法获得高质量Agent服务者,在效率和信息上的劣势将更加明显。

AI安全事件: Cursor AI Agent 9秒误删PocketOS生产数据库及备份,业务中断30小时,暴露Agent越权使用凭证、破坏性操作无需二次确认、备份与源数据共存等多重安全问题。过去五周内类似事故已发生多起。

Cloudflare警告: AI或加速破解当前加密体系,设定2029年实现后量子安全的具体目标。

Anthropic实验: 揭示AI智能体交易中技术代差可能引发经济鸿沟,使用强模型的用户平均多赚70%,弱势方对劣势毫不知情,警告技术代差可能导致复利式经济差距。


九、学习与研究资源

斯坦福: 推出免费两小时讲座,涵盖大语言模型核心工作原理,据称覆盖Anthropic支付给工程师年薪75万美元以上所需80%的核心内容。

Hugging Face smol-audio: 推出本地音频模型工具集,支持Whisper、Parakeet、Voxtral、Granite Speech等模型微调,以及Dia-1.6B对话式语音合成、PE-AV零样本视频与音频文本检索。

Hugging Face工程师: 分享开源AI模型工作流与工具选型指南,推荐Transformers运行模型、TRL和Unsloth微调、PEFT降低tuning成本、BitsAndBytes和MLX支持小硬件运行。

Anthropic: 团队发布免费Claude提示词工作坊,24分钟视频涵盖40种具体技巧,无付费墙限制。

LangChain: 发布长运行智能体运行时需求综合指南,由Sydney Runkle逐一解析各项具体需求及对应运行时能力。

阿里技术分享: 发布Agent架构工程实践文章,系统梳理影响Agent工程效果的核心要素(控制流、上下文工程、工具设计、记忆管理、多Agent组织、评测追踪、安全),以OpenClaw框架实现串联。提出关键判断:更贵模型带来的提升往往不如预期,Harness和验证测试质量对成功率影响更大。

基于Postgres+pgvector: 开发者分享五层AI记忆栈架构(对话上下文、结构化操作记忆、项目任务知识、机构知识、维护层),总成本为零。强调记忆系统难点在于维护而非搭建,未经维护的记忆会在数周内变成矛盾数据。

独立研究者: 提出两种LLM训练新函数(每令牌增益、每层发散缩放),1.2B模型人类偏好提升59.9%,双尾二项式p值为2.80e-8。

三年每日使用Claude经验: 总结18个实用提示词,经过长期验证旨在解决日常交互中的常见痛点。

生产环境AI智能体监控: 开发者分享使用Langfuse进行链路追踪的困境,智能体开始拒绝本应回答的请求,耗时一周才通过累积支持工单发现异常,评估指标却显示正常。行业缺乏有效的自动质量监控方案。

资深QA工程师: 质疑LLM智能体测试方法,非确定性输出导致传统断言、快照测试、正则匹配均无法适用,使用另一个大模型作为评判者会引入新故障模式,急需严谨测试方案。

生产环境RAG: 开发者分享法律领域遇到的三大挑战:分散检索(需从8-10份文档提取信息)、负面知识(知识库无相关指导时仍会合成错误答案)、时间线问题(法规变更前后对比查询难以构建连贯叙事)。

二本学生用免费AI考北大硕士: 安徽二本学生陈雨欣跨专业考取北京大学社会工作硕士,主要使用DeepSeek、豆包、讯飞星火等免费国产AI工具,未付费使用ChatGPT或Claude。揭示免费AI工具有效性及付费模型带来的经济门槛问题。

开发者微调Qwen3-1.7B: 通过清洗生产痕迹(相关性过滤+4个教师大模型委员会重新标记),微调后模型在法官评分上以0.846超越744B的GLM-5教师模型,函数匹配率达76/78,M2 MacBook生成速度约38 tokens/s。

五款32GB显存开源模型: Ollama本地部署指南,测试Qwen3:32b、Qwen2.5-Coder:32b、DeepSeek-R1:32b、Gemma3:27b、Mistral-Small:24b,推荐Q4_K_M量化为最佳实用方案。

DeepSeek v4 Flash: 支持本地推理,2比特量化GGUF实现前沿模型本地运行,即使在高压缩率下性能依然保持可用。

Lemonade OmniRouter: 推出本地多模态工具调用功能,一次安装一个端点,通过自然语言指令生成或编辑图像、添加语音叙述,利用sd.cpp/kokoros/whisper.cpp/llama.cpp等本地引擎。

人类最后黑客松: 开启注册,评审标准侧重于上下文理解而非代码本身,参赛者需使用Codex构建本地推理模型,5月4日启动。


十、总结与洞察

核心趋势:

(1) Agentic AI爆发: 从技术demo到基础设施的转折点,商业化路径清晰(Manus/Genspark/OpenClaw/Hermes),”Agent能赚钱/属于每个人/能自我进化”三大命题已验证。交互范式从GUI向CLI跃迁,结果式交互成为主流。

(2) 模型军备竞赛白热化: 万亿参数MoE成标配(DeepSeek/腾讯混元/小米MiMo),多模态统一架构成主流(HappyHorse/SenseNova-U1/Nemotron 3 Nano Omni),国产模型快速追赶并在性价比上形成优势。上下文长度竞争至1M级别,量化技术推动端侧部署。

(3) 算力基础设施多元竞争: 英伟达Blackwell/国产昇腾/光芯片/CPU价值重估多元格局形成,算力供需紧张持续至2027年。DeepSeek与华为昇腾深度适配标志国产算力自主可控突破。

(4) 物理AI进入实测阶段: 人形机器人(小米/Kinetix AI/宇树)、自动驾驶(元戎启行/Momenta/佑驾创新)、具身智能(银河通用/生数科技)从实验室走向工厂和道路,数据瓶颈(真机数据不足、利用率低)成为主要制约。

(5) 商业模式重构: 从SaaS到AaaS(Agent-as-a-Service),按结果付费+共建评测集、GEO(生成式引擎优化)、Agent佣金与交易分润、用户记忆飞轮等新模式涌现。微软-OpenAI结束独家合作反映AI生态多元化趋势。

(6) 安全与治理滞后: Agent安全风险凸显(9秒删库事件),Cursor/Anthropic账号封禁暴露服务商责任边界模糊。监管框架(人类配额制/AI内容标签/外资安全审查)开始探索但远未成熟。Hinton警告4.8万亿市场仅1%投入安全。

(7) 开源生态繁荣: MIT/Apache协议成主流,Day-0芯片适配成为标配,百万亿Token激励计划降低开发者门槛,OpenClaw引发百虾争鸣生态,推动AI能力民主化。

深层矛盾: 技术迭代速度(月级)远超社会适应能力(年级),就业冲击(编程/翻译/客服/群演)已从预言变为现实,”人类配额制”等应对思路浮现但尚未形成共识。Agent的自主性与可控性之间的张力(9秒删库vs效率提升)将成为未来核心议题。