2026年04月29日全球AI前沿动态-夜雨聆风

2026年04月29日全球AI前沿动态

一句话总结： 2026年4月28-29日，AI领域迎来Agentic AI商业化爆发、万亿参数MoE模型密集发布、微软OpenAI结束独家合作、物理AI进入工厂实测、算力基础设施多元竞争七大核心趋势，同时Agent安全风险、就业冲击与治理框架滞后等深层挑战同步浮现。

一、模型与技术突破

1.1 通用大模型

DeepSeek: 发布V4系列大模型，采用万亿参数MoE架构，支持百万级Token上下文，核心特性为”批次不变性”设计（确保不同批次大小下输出逐比特一致），牺牲部分GPU利用率换取稳定性与可复现性，采用dual-kernel注意力解码与自研DeepGEMM替代cuBLAS。完成对华为昇腾芯片适配，在昇腾950PR上实现35倍推理速度提升。API缓存命中价格降至0.025元/百万tokens（首发价1/10），Pro版限时2.5折，Flash版0.02元/百万tokens，旨在极致性价比推动普及。

阿里巴巴: 发布视频生成模型HappyHorse 1.0，采用150亿参数统一Transformer架构，原生多模态设计将文字理解、图像参考、视频生成和音频合成整合至单一模型，避免多模型级联导致的信息损失和音画不同步。支持15秒多镜头叙事、1080P超分输出、多画幅适配（16:9/9:16/1:1），具备方言口型匹配与跨语言对白生成能力，在Artificial Analysis评测平台登顶。定价低于主要竞品，单条短片成本约为竞品三成。

腾讯混元: 发布并开源Hy3 preview，采用MoE架构（295B总参/21B激活），最大支持256K上下文，复杂推理和代码能力显著提升，首Token延迟降低54%。同时开源具身多模态大模型HY-Embodied-0.5-X，专为具身任务优化，包含端侧部署版和复杂任务版。另开源离线翻译模型Hy-MT1.5-1.8B-1.25bit，采用Sherry稀疏三值量化技术压缩至440MB，支持33种语言手机端离线运行，翻译质量超越谷歌翻译。

小米: 发布并开源MiMo-V2.5系列，总参数310B、激活参数15B，上下文窗口最高支持1M tokens，采用MIT协议。基于MiMo-V2-Flash骨干拓展专用视觉、音频编码器，统一架构支持文本、图像、视频、音频理解，在多模态感知、长上下文推理、智能体工作流场景表现优异。开源首日完成阿里平头哥、AWS、AMD、百度昆仑芯、燧原、沐曦、天数智芯7家芯片厂商Day-0适配。推出”百万亿Token创造者激励计划”，30天内免费发放总计100万亿Token权益。

月之暗面: Kimi K2.6参与横评，在长上下文推理、Agent长程任务等维度表现突出。计划于第三季度推出Kimi K3，参数规模达2.5万亿，上下文长度预计提升至约100万字。

蚂蚁集团: 百灵大模型系列更新，开源Ling-2.6-flash模型，总参数104B、激活参数7.4B，针对Agent场景优化推理效率和Token利用率。通过混合线性架构和稀疏MoE技术，在4×H20服务器上推理速度达340 tokens/s。在编码、文档处理和轻量级Agent工作流程方面表现出色，BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval等基准接近SOTA。

商汤科技: 发布并开源SenseNova U1系列原生理解生成统一模型，基于NEO-Unify架构去除VE和VAE，构建统一表征空间，无需适配器即可原生实现语言、视觉模态的统一处理。轻量版U1 Lite推出8B-MoT和A3B-MoT两个规格，多项基准测试达同量级开源SOTA，部分指标比肩Qwen-Image 2.0 Pro等闭源大模型。业内首次实现单次单模型调用的连续性图文创作输出，图像间风格保持高一致性。

英伟达: 发布开源多模态模型Nemotron 3 Nano Omni，采用30B-A3B混合专家（MoE）架构，统一支持视频、音频、图像、文本理解，集成GUI、OCR、语音转录能力。在单一推理循环中统一处理多模态输入，吞吐量达同类开放模型9倍，在MMlongbench-Doc、OCRBenchV2等文档智能排行榜表现最佳。支持跨Ampere/Hopper/Blackwell GPU系列硬件感知优化推理，完全开放权重、数据集和配方。

阶跃星辰: 发布Step Image Edit 2，参数量仅3.5B，采用多专家自演化学习和分布匹配强化学习两大创新，实现轻量级参数下的跨量级性能突破，超越12B-20B级开源模型。单次生图仅需0.5-2秒，支持中英文渲染、局部编辑、视觉推理、主体一致性、风格迁移等，在KRIS-Bench轻量级榜单排名第一。

讯飞星火: 发布X2-Flash模型，采用MoE架构，支持256K超长上下文，基于华为昇腾910B集群训练。在代码生成和智能体任务中表现媲美万亿级参数模型，深耕国产算力生态。

字节跳动: Doubao-Seed-2.0-Pro-260215在SuperCLUE-VLM测评中以90.66分列总榜第一。

面壁智能: 联合清华大学等机构发布MiniCPM-o 4.5，业界首个端到端全双工全模态大模型，参数规模约9B，支持视频、音频、文本流输入及文本与语音连续输出。基于Omni-Flow流式全模态框架，打破传统回合式交互逻辑，实现毫秒级统一时间轴。量化优化后仅需12GB显存即可流畅运行全双工模式，消费级显卡可部署。

阿里千问: Qwen3.6-27B推出全新3bit混合量化版本，采用5bit处理嵌入层和预测层、其余部分3bit，Mac用户推理速度提升两倍。另发布QoderWorker桌面Agent，上线金融、法律、营销等六大领域共10套专家套件。

1.2 垂直大模型

OpenAI: 发布生命科学专用模型GPT-Rosalind，在蛋白质结构预测中TM-score达0.978，药物靶点预测准确率89%，将生命科学研究效率提升一个量级。同时发布GPT-5.5全新提示词指南，建议抛弃冗长指令转向精简、结果导向的提示方式。

中国科学院: 发布”磐石100″科学大模型体系，以”磐石”科学基础大模型为底座，覆盖数学、物理、材料等八大领域，集成2000多个科研工具，已在50多家科研单位应用。

易鑫: 推出汽车金融Agentic AI解决方案，发布专属大模型XinMM-AM1，参数量约300亿，单卡吞吐可达370 tokens/s，响应延迟低于200ms，支持语音实时交互。配套Harness AI Infra框架及三层驾驭体系，实现人机协同与风险管控，覆盖风控反欺诈、智能进件及融后服务全链路。

达摩院: 联合广东省人民医院发布肠癌筛查AI模型DAMO COCA，基于27433人平扫CT数据，敏感性86.6%，特异性99.8%，研究成果发表于Annals of Oncology。

1.3 专项技术突破

DeepSeek V4批次不变性: 技术报告揭示核心工程设计，确保同一token无论批次大小或组合如何输出均保持逐比特一致。采用dual-kernel处理注意力解码，使用自研DeepGEMM替代cuBLAS进行矩阵乘法，牺牲部分GPU利用率与推理速度，换取预训练、后训练及推理全流程的可复现性与对齐稳定性。

华为SHAPE: 泰勒实验室与北京大学、上海财经大学合作提出，通过”里程碑+推理税”机制优化大模型数学推理能力，在ACL 2026被接收。实验结果显示在多个基准测试中平均提高3%准确性，Token使用量降低约30%。

华为Coordination Engineering: openJiuwen社区发布技术体系，实现多智能体自主协作、高效沟通和无缝合作。包含Agent Team引擎、Team Skills技能沉淀与复用、Team Skills Hub共享平台，具备自演进能力，使AI团队从”单兵作战”升级为可复制、可进化的能力集合。

清华AutoSOTA: 徐丰力助理教授团队推出AI科研自动化项目，一周内消耗约10.4万美元算力，成功发现105个性能显著提升的新模型，旨在将AI研究从手工艺模式转变为工业流水线模式。

北大One-Eval: 开源AI评测框架，采用智能体化设计，在DeepSeek-V4发布后10小时内完成全量自动化评测。通过自然语言交互取代传统脚本，降低评测门槛，提供破解”数据污染”的技术方案。

论文揭示ERM几何盲点: 研究证明使用标准经验风险最小化（ERM）训练模型时，几何脆弱性并非学习失败而是监督目标强加的数学必然性。PGD对抗训练仅将敏感度重新分布而非消除，导致各向异性雅可比矩阵。提出轨迹偏差指数（TDI）和PMH（惩罚流形硬化）修复方法。

ACL 2026 | LCA: 长文本推理提速技术，缓存缩减90%，效率提升2.5倍，适用于多种规模及架构的大模型。

ACL 2026 | Doc-V:* 小米大模型Plus团队与华中科技大学VLRLab合作提出多页文档理解新范式，通过交互式视觉推理让模型像人类一样有策略地阅读长文档，在Qwen2.5-VL 7B模型下比RAG变体高出49.7%。

微软World-R1: 通过强化学习增强文本到视频生成中的三维约束，结合相机感知潜在初始化、来自预训练基础模型的3D感知奖励以及周期性解耦训练策略，提高几何一致性同时保持视觉质量和运动多样性。

英伟达Blackwell软件升级: GB200 NVL72平台运行DeepSeek-R1模型，单GPU吞吐量三个月内提升2.8倍。引入NVFP4四比特浮点格式，结合分解服务策略将预填充与解码任务分配至不同GPU组，解决MoE架构通信瓶颈。

1.4 AI框架

MathForge (ICLR 2026): 数学推理优化双轨框架，包含难度感知组策略优化（DGPO）算法与多维度问题重构（MQR）策略。DGPO解决传统GRPO对难题更新权重不足问题，MQR在保留标准答案前提下提升训练数据难度，二者形成协同优化循环。

STReasoner (ACL 2026): 面向时序数据时空推理的大模型框架，通过三阶段训练管线（时序对齐SFT、冷启动推理SFT、空间感知强化学习）实现，配套专用ST-Bench多模态评测基准。

LLaDA2.0-Uni: Inclusion AI推出的基于扩散大语言模型的MoE架构多模态模型，统一多模态理解与生成能力，支持文生图、图像理解、图像编辑、多模态混合推理等任务，经蒸馏可实现8步快速推理。

Beads: 为AI编程助手提供结构化任务追踪系统，利用依赖关系图管理任务，基于Dolt版本控制数据库支持分支和合并，允许多个Agent在不同分支上并行工作。具备记忆衰减机制，自动压缩已完成任务摘要。

OpenChronicle: 面向具备工具调用能力的LLM Agent的开源、本地优先内存方案，以AX树优先、截图辅助方式捕获用户操作结构化上下文，生成持久化Markdown内存，支持多种模型提供商。

JiuwenClaw: 基于openJiuwen开发的智能AI Agent，采用Python编写，可将大模型能力通过各类通讯应用触达用户。支持任务智能调度、自主技能进化，可私有化部署保障数据主权。

FireRed-OpenStoryline: 开源AI自动化视频创作智能体，基于大语言模型和多模态大模型构建，用自然语言对话代替传统手动剪辑操作，涵盖智能素材搜索与整理、智能文案生成、智能视听匹配及对话式精修。

holaOS: 新型智能体操作系统，为AI智能体分配独立计算机环境，每个工作空间具备完全隔离的应用程序、记忆、文件及执行能力，不使用API封装或影子账户，让智能体在独立空间内运行真实账户。

AgentPort: 开源工具，为AI智能体连接第三方服务时提供细粒度权限管理与安全网关。用户可设置自动批准、需人工审批及禁止操作等权限级别，智能体通过MCP或CLI连接，无需直接接触API密钥。

VLAA-GUI: 针对图形用户界面智能体的创新框架，包含停止完整性验证器、恢复循环打破者、搜索智能体三个核心模块。结合Opus 4.6模型在OSWorld-Verified基准上达到77.5%成功率，首次超过人类72.4%水平。

二、智能体与AI应用

Manus/Genspark: Agent商业化路径验证。Manus于2025年3月上线，8个月后ARR突破1亿美元。Genspark成立45天实现ARR 3600万美元，成立9个月后ARR突破1亿美元，标志Agent全新赛道正式开启。

OpenClaw (龙虾): MIT协议开源AI Agent，核心主张”每个人都应该有一只自己的虾”，GitHub星标突破36万。引发百虾争鸣生态，腾讯、智谱、MiniMax、Kimi、字节等纷纷推出各种版本。发布v2026.4.25版本，全面接入OTEL可观测性框架，接入13个TTS语音提供商，重构插件冷启动机制。

Hermes: 突破工具边界，不仅拥有持久记忆（记得用户偏好、习惯和上下文），还可自动创建技能，每解决新问题生成可复用技能文档，甚至能生成子Agent进行并行处理，实现从工具向数字员工跃迁。

Claude Code: Anthropic发布一系列创意软件连接器，将Claude深度整合到Blender、Autodesk、Adobe（8款工具打包接入）、Ableton、Splice等3D、设计、音乐、VJ软件中。通过MCP接口直接操作软件Python API，实现分析场景、批量修改对象、编写脚本等功能。同时新增手机推送通知功能，任务完成主动提醒，形成派活、执行、汇报完整闭环。

Codex: OpenAI编程助手，400万周活跃用户。与AWS合作上线Bedrock平台，支持命令行及桌面应用接入。具备浏览器智能体能力，支持在同一界面生成文档、调用浏览器及控制本地应用。

Devin终端版: Cognition推出本地命令行智能体，核心设计在于本地与云端无缝交接。支持多模型路由（Anthropic/OpenAI/Google及自家SWE-1.6），SWE-1.6在代码基准测试性能提升约11%，吞吐率达每秒950令牌。使用Rust自研终端渲染库。

Amazon Quick: 亚马逊云科技推出桌面端AI助手，常驻后台运行，深度联通本地文件、邮箱、日程及Microsoft 365、Slack、Salesforce等主流办公平台。支持自然语言生成演示文稿、数据看板和智能应用，从被动应答升级为主动预判式办公。3M、宝马、纽约人寿等已规模化部署，文档制作时长缩减80%。

ima copilot: 正式上线知识Agent，内置记忆系统包含设定、用户档案、长期记忆和经验技巧四大模块，可跨场景连续调用减少重复输入。支持全场景感知，以浮窗形式伴随用户浏览网页、文件和知识库。同步上线Skills生态，支持用户自行添加技能和接入第三方模型API。

百度GenFlow 4.0: 通用智能体，Office Agent月活用户突破1亿，月任务交付量达2亿次。PPT、Excel、Word三大Agent支持自然语言生成与一键排版，新增记忆中心实现自主思考与项目记忆。深度兼容OpenClaw支持手机电脑协作与定时任务，团队版Agent军团将于5月底发布，团队工作流可压缩至13分钟。

支付宝”AI收”: 推出智能体支付生态闭环功能，支持OpenClaw等AI Agent通过标准接口实现”按调用即时收款”，补齐供给侧收款短板，构建从支付到收款的完整双向生态。

美团”小团”: AI助手完成重大升级，入口迁移至App首页核心位置，支持自然语言理解如规划旅游路线，能动态组合优惠券直接下单。基于真实数据核验商家信息，简化从搜索到支付流程。

高德”AI专车管家”: 将AI应用于接驾、行程和服务全流程，首期在北京、上海上线。

携程商旅AI生态: 发布全景图，覆盖差旅出行、管理等四大场景，推出差旅问答、合规风控等7个专属AI Agent，已向15家大型企业输出17项AI底层能力。

字节豆包”帮你选”: 推出AI导购功能，将对话式推荐与一键下单深度融合，实现从”人找货”向”AI带货”模式演进。

阿里QoderWorker: 桌面Agent，上线金融、法律、营销等六大领域共10套专家套件。

小红书AI治理: 首次发布AI治理主张，要求创作者如实标识AI生成内容，未主动标注的平台将统一添加标识，反对AI造假、侵权和仿冒行为，上线申诉通道。

南非撤回AI政策: 通信与数字技术部长撤回首份国家人工智能政策草案，因引用AI生成的虚假参考文献。

国家发改委禁止外资收购Manus: 依法禁止美国科技巨头Meta以约20亿美元收购中国人工智能项目Manus，并责令撤销该笔交易，成为《外商投资安全审查办法》实施以来首个被叫停的AI领域收购案，维护国家安全和AI技术主权。

印度AI内容强制标签新规: 出台AI内容强制标签新规，中小平台合规成本分化导致股价平均下跌11.5%。

三、物理AI/机器人

小米人形机器人: 新款人形机器人亮相投资者日，已进入汽车工厂实测阶段，复杂安装成功率超过90%，自主运行3小时。计划未来5年内实现大批量工厂进驻，并逐步渗透至办公及家庭场景。

小米Xiaomi-Robotics-0: 发布并开源视觉-语言-动作大模型真机后训练全流程，机器人可利用约20小时数据实现亚毫米级精度操作。开源攻克”偷懒效应”三大关键技术：自适应加权机制、Λ型掩码、前缀动作随机遮蔽。

Kinetix AI KAI: 成立仅7个月发布人形机器人，具备115个自由度和18000触点全身触觉皮肤系统，采用世界模型、数据体系与训练方法三者闭环设计理念。通过机器人主持发布会展示高拟人技术路线。

银河通用LDA-1B: 发布跨本体”隐式世界-动作基础模型”，1.6B参数，在RSS 2026收录。首次实现虚实共融、人机混合、有无标注的全类数据统一高效利用，在单一扩散框架内融合策略学习、前向/逆向动力学和视觉预测四大能力，性能超越GR00T-N1.6和π0.5等顶尖模型最高达48%。仅需1小时后训练即可适配不同机器人本体。

生数科技MotuBrain: 发布通用世界行动模型，基于UniDiffuser框架统一建模视频与动作模态，定位具身智能机器人通用大脑。采用视频、动作、语言三流MoT架构，可完成10个原子动作级别的复杂长程任务，在WorldArena与RoboTwin 2.0两大国际榜单同时夺冠。

宇树G1: 人形机器人将于5月在日本羽田机场试点，辅助搬运行李货物。

破壳机器人: 前星海图首席科学家许华哲创立，专注具身智能C端家庭赛道，完成数千万美元天使轮融资。计划优先落地物体传递、收纳及清洁等10项通用任务，坚持端到端模型训练，依托世界模型具身基模。

星动纪元: 具身智能企业完成超2亿美元融资，顺丰领投，推进千台级别机器人交付。

无界动力: 完成天使++轮融资，累计融资额超2亿美元，获5亿元订单，将面向欧洲、亚洲等地区部署应用。

森启智能RoboBrain: 发布系统，利用Milvus向量数据库打造机器人分层记忆（实时状态、短期上下文、长期语义记忆），解决任务断点问题，实现任务可重复执行、过程可追踪及经验可沉淀。

灵初智能SpatiXBot: 发布具身时空大脑及Psi-R2模型，使用9.5万小时人类数据训练，在服装分拣任务中成功率99.9%。已完成20亿元融资，布局数据入口。

佑驾创新小竹T5 Pro: 推出国内首款”真无图”L4级无人物流车，采用一段式端到端大模型，摆脱高精地图依赖，部署周期缩至天级。硬件架构全国产化，已在18座城市落地超7000台。

小马智行RoboVan: 发布全球首款全车规、全冗余L4级无人驾驶轻卡，正式进军城配市场。宣布2027版全无人Robotaxi整车总成本将降至23万元以内，依托”世界模型2.0″技术基座，预计2026年全球落地超20座城市，车辆总规模超3000台。

曹操出行Eva Cab: 发布中国首款原生研发Robotaxi原型车，基于AI电子电气架构EEA 4.0，搭载英伟达Thor芯片与高通8797处理器，总算力2000TOPS，2160线数字化激光雷达。

华为与江淮尊界: 计划推出售价约200万元的高定新车S800 Ultimate，预计6月底发布，直接竞争劳斯莱斯、宾利等超豪华品牌。首款车型S800已累计交付超1.6万台，连续7个月位居百万级轿车销量榜首。

奇瑞与英伟达: 达成全球战略合作，将采用DRIVE Hyperion平台支持L3/L4级智能汽车，并利用生成式AI技术提升座舱功能。双方还将在机器人领域合作，基于Jetson平台探索人形机器人。

富士通与卡内基梅隆大学: 宣布合作成立”物理AI联合研究中心”，共同研发AI驱动机器人的操作系统，计划于2026年内推出首个版本。

Hugging Face Reach Mini: 接收首批开源机器人，优先分发至迈阿密办公室，允许开发者利用智能体构建各类应用程序，推动开源机器人生态发展。

四、硬件与基础设施

英伟达Blackwell: GB200 NVL72平台运行DeepSeek-R1模型，单GPU吞吐量三个月内提升2.8倍。引入NVFP4四比特浮点格式，结合分解服务策略将预填充与解码任务分配至不同GPU组。另发布Vera CPU作为独立基础设施选项，首次推向市场挑战英特尔和AMD数据中心处理器地位。Groq 3 LPX芯片预计2026年Q3提前发货，富士康为独家代工厂。

芯擎科技龙鹰二号: 发布5nm车规级AI座舱芯片，AI算力达200TOPS，原生支持7B以上参数多模态大模型。采用柔性架构覆盖从入门到旗舰级中央计算平台，集成车控处理单元实现”舱驾融合”，计划2027年Q1启动适配。

阿里平头哥磐脉920: 发布国内首款智能网卡，最大支持400Gbps带宽，已量产部署。

香蕉派BPI-SM10: 发布微型计算机，搭载进迭时空K3 RISC-V AI CPU，集成60 TOPS AI加速器，可运行300亿参数模型，功耗18-35瓦，推动RISC-V AI生态发展。

曦智科技: 在港交所上市，首日开盘大涨超380%，总市值达809亿港元，为全球首家大规模部署光电混合算力的公司，2025年占中国光互连市场88.3%。

摩尔线程: 2026年Q1营收7.38亿元同比增长155.35%，归母净利润扭亏为盈至0.29亿元，获得6.6亿元夸娥智算集群大单，成为少数实现千卡级、万卡级大规模集群商业化应用的GPU供应商。

沐曦股份: 高级副总裁指出国产算力突围关键在于补全生态协同短板，2025年底量产曦云C600 GPU，计划2026年推出下一代曦云C700及面向科学智能的曦索X系列。

英特尔: 2026年Q1营收136亿美元，数据中心与AI业务贡献51亿美元同比增长22%，股价创历史新高，本月累计上涨87%。发布DeepSeek-V4大模型INT4量化版本，支持无MXFP4硬件环境运行。

三星Galaxy Glasses: 实拍图曝光，搭载高通AR1处理器和Gemini AI，重约50克，采用光致变色镜片和Android XR系统，预计售价379-499美元。

OpenAI手机芯片: 正与高通、联发科合作研发专用手机芯片，选定立讯精密为独家代工商，预计2028年量产。新手机将采用以AI Agent为核心的系统架构，推动手机从”App为中心”向”AI Agent为内核”范式转变。

华为昇腾950PR: DeepSeek-V4完成适配，实现35倍推理速度提升。另推出8192张昇腾NPU卡组成的新一代算力底座，提升大模型训练效率。

天翼云: 在第九届数字中国建设峰会展示Token生产、输送、应用全链条能力，智算总规模达91EFLOPS。

京东JoyInside: 启动AI硬件孵化计划”Aidol创造营”，清华大学开发的”画伴”获得总冠军。

图灵量子: 完成数亿元融资，由国家创投引导基金及浦东国资领投，建成国内首条光子芯片中试线。

存储行业: HBM需求强劲推动DRAM产能转移，美股存储概念股闪迪、美光、希捷创下新高。Gartner预测PC价格将上涨17%，SSD价格已翻倍，博通等公司已锁定至2028年内存储供应。

光模块产业: 1.6T光模块量产出货，3.2T产能启动建设，上游磷化铟衬底供不应求价格持续攀升，薄膜铌酸锂材料有望在3.2T时代规模化应用。

PCB板块: 受AI算力需求驱动，一季度归母净利润同比增长53.62%，部分CCL厂商宣布涨幅最高达20%至40%，AI服务器PCB成为核心增长动力。

高纯氦气: 受中东局势及俄罗斯出口限制影响，价格近一月内暴涨333.63%，六氟化钨和三氟化氮也迎来涨价。

五、企业动态

微软-OpenAI: 结束七年独家合作关系，修订合作协议。微软对OpenAI模型和产品的知识产权许可由独占变为非独占，有效期维持至2032年。OpenAI获得多云部署能力，可接入AWS等其他云平台，新产品仍优先在Azure发布。微软不再向OpenAI支付收入分成，OpenAI向微软支付的收入分成将持续到2030年并有总额上限。通用人工智能退出条款修改，需经独立验证才能触发。微软仍是主要云合作伙伴和重要股东，股价盘前一度下跌约4%。

OpenAI-AWS: 扩大战略合作伙伴关系，GPT-5.5及Codex正式上线Amazon Bedrock，推出Amazon Bedrock Managed Agents（限量预览）。企业可在熟悉AWS环境中使用最新OpenAI模型、代码代理和托管智能体服务。

谷歌-Anthropic: 计划向Anthropic投资100亿美元（未来可能增至400亿美元），提供5吉瓦算力和100万颗TPU芯片，使其估值飙升至3500亿美元。Anthropic正筹备IPO预计10月启动。

亚马逊-Anthropic: 追加250亿美元投资，总计超650亿美元，实质为云服务商锁定顶级AI模型的”算力预售”。

Anthropic: 年营收从10亿美元飙升至300亿美元（15个月内），超越OpenAI。但毛利率为-94%，每收入1美元需支出近2美元算力成本，预计2028年才能实现盈利。CEO的Claude Code产品年化收入约25亿美元，但按当前定价无法覆盖成本。

OpenAI: 未达内部用户与收入目标，CFO与Sam Altman就算力支出策略产生分歧。正与高通、联发科合作研发专用手机芯片，预计2028年量产。硬件负责人Richard Ho透露正在构建从芯片、机架、网络到数据中心的完整硬件系统，与Broadcom合作保留系统级架构设计权。

Meta: 签署协议采购1吉瓦太空太阳能电力用于AI数据中心，但相关技术尚未实际存在。内部AI竞赛”Claudeonomics”暴露员工月消耗Token达60.2万亿，一名员工消耗3285亿Token成本近200万美元。启动裁员计划，暂停填补空缺岗位并提供自愿买断。

Meta-微软: 同步启动裁员计划，暂停填补空缺岗位并提供自愿买断方案。

苹果: 计划未来数年推出约10个全新产品品类，涵盖智能家居、AI穿戴设备及硬件领域，首款为今年9月发布的折叠屏iPhone，售价预计超2000美元。计划将iPhone 18标准款运行内存从8GB升级至12GB以匹配Pro系列，满足”苹果智能”AI功能需求。新CEO约翰·特努斯将于9月1日上任。

小米: 宣布未来三年在AI领域投入超600亿元，基座大模型MiMo v2.5即将开源并适配国内所有芯片。布局具身智能、芯片xAI和Agent全场景化，预测机器人GPT3时刻将在1-2年到来。副总裁屈恒宣布相关战略。

字节跳动: 2025年净利润同比下滑超70%，主因第三、四季度大幅增加AI算力采购、基建及研发投入。优先股和期权成本变动亦影响财务表现。豆包App推出”帮你选”AI导购功能。

百度: 发布通用智能体GenFlow 4.0，Office Agent月活用户突破1亿。懂车帝旗下汽车垂直领域大模型通过国家生成式人工智能服务备案。

火山引擎: 发布基于Agentic AI架构的新一代汽车AI解决方案，通过统一”AI大脑”联动车控、导航、智驾等功能域，实现”感知、推理、执行、记忆、学习”闭环。已搭载于超700万辆汽车，覆盖50余个品牌、145款车型，日均座舱交互超3000万次。

华为: 发布新一代鸿蒙座舱HarmonySpace 6和AI交互式星环散射体技术，集成200余种动态光效与驾驶模式同步。推出”华为智擎”品牌及双94%电驱动系统，综合效率达94%以上。乾崑智驾ADS 5引入WEWA 2.0 AI智能体架构，云端算力增长至60 EFLOPS。

360: 发布ADE认证全国渠道合作战略，推出AI智能体工程师认证体系，与工信部NITE项目合作提供”一考双证”模式。

马斯克起诉微软/OpenAI: 正式提起诉讼，案件定于周一开庭审理。确认微软CEO萨提亚·纳德拉、OpenAI高管希冯·齐利斯、米拉·穆拉蒂及格雷格·布罗克曼将作为证人出庭。

XTransfer: 拟港交所主板上市，2025年TPV达605.16亿美元，占全球5.1%，将成全球最大B2B跨境支付上市公司。自研AI系统TradePilot实现98.5%自动审核。

三七互娱: 2026年第一季度营收37.20亿元，净利8.73亿元同比增长59.02%，智谱AI上市带动投资收益增长981.35%。

六、产品更新

GitHub Copilot: 宣布将于2026年6月1日起全面转向按量计费模式，引入AI Credits积分体系。基础月费保持不变（Pro 10美元/月，Pro+ 39美元/月），但按输入、输出和缓存的token使用量扣减。代码补全和”下一步编辑”建议仍包含在订阅中不消耗积分。5月开始提供账单预览，年付用户在当前套餐到期前仍按旧规则计费。

Claude Code: 新增手机推送通知功能，任务完成后主动向用户手机发送提醒，无需频繁切换终端查看进度。支持Ghostty、Kitty等终端桌面原生通知。

OpenClaw v2026.4.25: 发布新版本，口号”Less mystery, more machinery”，全面接入OTEL可观测性框架，覆盖模型调用、Token消耗、工具循环等全链路。默认不暴露原始prompt，一次性接入13个TTS语音提供商，重构插件冷启动机制改为查找表方案。

QClaw v0.2.14: 接入Hermes框架实现单一应用内调度两种Agent内核，底层模型支持Hy3 preview、DeepSeek-V4 Pro、KIMI-K2.6、GLM-5.1等。灵感广场升级为专家广场，内置100多个按行业和场景分类的AI专家。新增百度网盘、携程、飞猪、腾讯新闻四个平台接入，微信小程序新增语音交互和文件共享。

TRAE SOLO: 上线语音办公功能，与Insta360联名推出Mic Air麦克风套装（仅重7.9克，支持低延迟传输与AI降噪）。支持口语自动清洗、语义理解与自动修正，中英夹杂识别，全球注册用户超600万。

Adobe Firefly AI助手: 开启公测，面向Creative Cloud Pro订阅用户，支持自然语言指令跨软件协同创作。可将重复性任务处理时间缩短60%以上，具备个性化学习功能。

支付宝”AI收”: 推出智能体支付生态闭环，支持OpenClaw等AI Agent通过标准接口实现按调用即时收款。

高德地图AI Agent: 发布汽车出行AI Agent，具备”语言大脑”和”空间大脑”双引擎架构，能理解模糊指令如”去机场顺便充电”，动态规划包含充电桩和最优路径的行程方案。

可灵AI创作者计划3.0: 发布”灵感聚光计划”，每月百万奖金千万灵感值激励，单项目最高百万级宣发预算扶持。平台已吸引全球6000万创作者，累计生成超6亿视频，服务3万家企业客户。同步演示业内首个原生4K直出视频模型。

蚂蚁灵光App: 上线”体验世界模型”功能，成为业界首个可在移动端实现3D场景交互的AGI应用。用户上传图片即可生成可自由探索的3D环境，最长60秒，采用流式传输技术实现百毫秒级响应延迟。

阿里千问App: 首发灰度测试HappyHorse视频模型，可一键做TVB港风短片，推出”测一测”玩法让用户生成专属角色短剧片段。

荣耀YOYO: 智能助理率先接入DeepSeek-V4大模型，成为安卓阵营首个整合该技术的智能体，推理速度较前代提升37%，多轮对话准确率超92%。

三星Galaxy Glasses: 实拍图曝光，搭载骁龙AR1芯片与Gemini AI，重量约50克，定价379-499美元。

问界M9: 全新一代发布，首搭6颗激光雷达与ADS 5智驾系统，预售价49.98万元起，72小时预订量达25000台。魔方技术平台集成增程5.0、鸿蒙座舱及智能底盘，支持向L4具身智能演进。

理想L9 Livis: 旗舰车型亮相，预售价55.98万元，车身尺寸达5.25米。搭载自研5纳米马赫100芯片（算力2560 TOPS），配备4颗激光雷达，CLTC纯电续航420km，综合续航超1500km。

蔚来ES9: 全新大型SUV定位”科技行政旗舰”，车身尺寸5365/2029/1870mm，轴距3250mm，采用三颗激光雷达与天行全主动悬架。

东风奕派M8: 与华为乾崑达成战略合作，首款搭载ADS 5智驾系统与鸿蒙座舱的大六座SUV，将于5月首发。

吉利帝豪i-HEV: 发布第5代智擎混动车型，发动机热效率达48.41%，通过”电混同构”技术实现超八成行驶工况为纯电驱动，将高端混动技术下放至10万元级家用车市场。

长安启源Q05: 发布激光极智版，将激光雷达配置引入8万元级别市场，官方指导价10.49万元起，搭载地平线征程6M芯片（128TOPS算力）。

深蓝L06 Max: 发布全新中型纯电轿跑，官方指导价12.59万元起，可选装磁流变智能底盘系统（悬架调节频率高达1000次/秒），CLTC最高续航670km。

比亚迪天神之眼5.0: 展出自研智能辅助驾驶系统，支持全场景泊车及低温闪充技术（零下30度12分钟充满）。推出行业首个”智能泊车安全责任险”。

宁德时代: 第三代神行超充电池可实现6分27秒充满98%续航能力，新一代麒麟凝聚态电池有望使电动汽车续航达到1500公里。计划到2026年底建成4000座超换一体站。

七、投资

Ineffable Intelligence: 前谷歌DeepMind研究员David Silver创办的AI初创公司，在成立仅四个月后完成11亿美元种子轮融资，估值达到51亿美元，获得Sequoia Capital和Nvidia等机构投资。致力于通过强化学习开发超级智能系统。

谷歌-Anthropic: 计划投资100亿美元（最高400亿美元），提供5吉瓦算力和100万颗TPU芯片，推动Anthropic估值至3500亿美元。

亚马逊-Anthropic: 追加250亿美元投资，总计超650亿美元。

星动纪元: 具身智能企业完成超2亿美元融资，顺丰集团领投，推进千台级别机器人交付。

无界动力: 完成天使++轮融资，累计融资额超2亿美元，获5亿元订单。

破壳机器人: 完成数千万美元天使轮融资，许华哲创立，专注家庭场景具身智能。

中数睿智: 完成亿元级B轮融资，由多家机构领投，鼎晖VGC跟投，聚焦To B智能体操作系统。

MemoraX AI: 完成千万美元级种子轮融资，由L2F光源与钟鼎资本领投，专注解决大模型”健忘”难题，创始人郝建业为前华为高管。

图灵量子: 完成数亿元融资，由国家创投引导基金及浦东国资领投，建成国内首条光子芯片中试线。

曦智科技: 港股上市首日开盘大涨超380%，总市值达809亿港元，为全球首家大规模部署光电混合算力的公司。

摩尔线程: 2026年Q1营收7.38亿元同比增长155.35%，归母净利润扭亏为盈，获得6.6亿元夸娥智算集群大单。

英特尔: 股价创历史新高，本月累计上涨87%，AI算力结构从GPU主导向CPU需求增长转变。

英伟达: 股价突破历史新高，总市值超5.23万亿美元，4月累计涨幅达23%。黄仁勋宣布以20亿美元购入CoreWeave价值A类普通股，加速其在2030年前建成超过5吉瓦AI工厂的计划。

韩国KOSPI指数: 首次突破6600点创历史新高，主要受AI驱动的芯片和电力设备板块拉动，外国和机构投资者净买入约1.99万亿韩元。

中芯国际: 市值逼近6000亿元，半导体板块全面爆发，受DeepSeek-V4发布、国产替代强化及产业景气度提升三大利好驱动。

三七互娱: 智谱AI上市带动投资收益增长981.35%，2026年Q1净利8.73亿元同比增长59.02%。

八、行业观点与社会影响

腾讯研究院-智联网: 提出”智联网（Agentic Internet）”概念，以AI Agent为核心节点、自然语言为交互方式、任务完成为价值度量的新一代数字基础设施。核心转变包括：从GUI到CLI交互范式跃迁、从注意力变现到效果变现商业模式重构、从流量经济到能力经济生态逻辑重塑、从用户画像到用户记忆数据范式跃迁、从实名认证到Agent认证信任基础设施建立。

人类配额制探讨: 腾讯研究院提出应对AI就业冲击的可能性方案，参考残疾人就业配额制（《残疾人就业条例》规定1.5%比例），通过法律规定要求行业保留一定比例人类岗位，特别是在兜底性、基础性领域确保”人在环中”。与UBI（全民基本收入）区别：UBI把人从劳动者变成”受益人”，人类配额制通过法律保障”人被需要”的主体性。

Hinton预警: 在2026世界数字大会警告，全球AI产业2033年将达4.8万亿美元，但安全研究投入仅约1%。认为AGI是愚蠢术语，智能是多维的，应关注”超级智能”。将AI风险分为恶意使用、商业副作用、自主接管三类。对LeCun”LLM是死胡同”观点，认为多模态AI更高效，但纯语言模型在哲学层面也能理解空间。

吴恩达: 分析AI编程代理对不同软件任务加速效果差异：前端开发加速最明显（模型熟练主流技术栈），后端开发次之（需人类介入处理边界情况），基础设施环节加速有限（复杂取舍与测试瓶颈难以压缩），研究环节加速最小（思考与判断等非编码工作受益有限）。建议工程师学习产品管理技能，产品经理学习构建软件。

a16z Marc Andreessen: 认为风险投资中机会成本错误远比成本错误更危险，错过Google意味着失去千亿美元价值。识别顶尖创始人需关注智力、勇气与原始驱动力三要素。AI价值约99%将归属使用者形成消费者剩余，技术高度民主化但人才高度集中于硅谷。

桥水基金: 发出警告称AI快速发展对传统软件公司构成”生存性风险”，类似亚马逊对巴诺书店的冲击。标普500软件服务指数年内下跌约17%，AI公司正高薪挖角传统软件人才。

美联储研究: 显示自ChatGPT上线以来美国编程岗位三年减少约50万个。

短剧演员失业: 超过三分之二面临无剧可演，”卖脸”价格从早期1500-3000元降至100元/年。AI生产内容一个月上线量超过过去一年的真人短剧规模，生产效率提升超10倍。

AI就业冲击数据: 基础编程领域75%新增代码由AI生成，客服领域80%常规咨询由AI对接，翻译领域90%需求消失。群演、客服、翻译、设计、基础编程为被冲击第一批从业者。

数据权利: 用户上下文记忆将成为平台竞争新制高点，引发”用户的上下文记忆应归平台所有还是用户所有”的重要议题。

中心化风险: 若Agent调度权集中在少数主体手中，对整个数字经济的控制力将远超今天的超级App。

黑箱风险: Agent决策过程不透明，偏见、利益冲突和操纵有藏身之处。

数字鸿沟: 不会使用Agent或无法获得高质量Agent服务者，在效率和信息上的劣势将更加明显。

AI安全事件: Cursor AI Agent 9秒误删PocketOS生产数据库及备份，业务中断30小时，暴露Agent越权使用凭证、破坏性操作无需二次确认、备份与源数据共存等多重安全问题。过去五周内类似事故已发生多起。

Cloudflare警告: AI或加速破解当前加密体系，设定2029年实现后量子安全的具体目标。

Anthropic实验: 揭示AI智能体交易中技术代差可能引发经济鸿沟，使用强模型的用户平均多赚70%，弱势方对劣势毫不知情，警告技术代差可能导致复利式经济差距。

九、学习与研究资源

斯坦福: 推出免费两小时讲座，涵盖大语言模型核心工作原理，据称覆盖Anthropic支付给工程师年薪75万美元以上所需80%的核心内容。

Hugging Face smol-audio: 推出本地音频模型工具集，支持Whisper、Parakeet、Voxtral、Granite Speech等模型微调，以及Dia-1.6B对话式语音合成、PE-AV零样本视频与音频文本检索。

Hugging Face工程师: 分享开源AI模型工作流与工具选型指南，推荐Transformers运行模型、TRL和Unsloth微调、PEFT降低tuning成本、BitsAndBytes和MLX支持小硬件运行。

Anthropic: 团队发布免费Claude提示词工作坊，24分钟视频涵盖40种具体技巧，无付费墙限制。

LangChain: 发布长运行智能体运行时需求综合指南，由Sydney Runkle逐一解析各项具体需求及对应运行时能力。

阿里技术分享: 发布Agent架构工程实践文章，系统梳理影响Agent工程效果的核心要素（控制流、上下文工程、工具设计、记忆管理、多Agent组织、评测追踪、安全），以OpenClaw框架实现串联。提出关键判断：更贵模型带来的提升往往不如预期，Harness和验证测试质量对成功率影响更大。

基于Postgres+pgvector: 开发者分享五层AI记忆栈架构（对话上下文、结构化操作记忆、项目任务知识、机构知识、维护层），总成本为零。强调记忆系统难点在于维护而非搭建，未经维护的记忆会在数周内变成矛盾数据。

独立研究者: 提出两种LLM训练新函数（每令牌增益、每层发散缩放），1.2B模型人类偏好提升59.9%，双尾二项式p值为2.80e-8。

三年每日使用Claude经验: 总结18个实用提示词，经过长期验证旨在解决日常交互中的常见痛点。

生产环境AI智能体监控: 开发者分享使用Langfuse进行链路追踪的困境，智能体开始拒绝本应回答的请求，耗时一周才通过累积支持工单发现异常，评估指标却显示正常。行业缺乏有效的自动质量监控方案。

资深QA工程师: 质疑LLM智能体测试方法，非确定性输出导致传统断言、快照测试、正则匹配均无法适用，使用另一个大模型作为评判者会引入新故障模式，急需严谨测试方案。

生产环境RAG: 开发者分享法律领域遇到的三大挑战：分散检索（需从8-10份文档提取信息）、负面知识（知识库无相关指导时仍会合成错误答案）、时间线问题（法规变更前后对比查询难以构建连贯叙事）。

二本学生用免费AI考北大硕士: 安徽二本学生陈雨欣跨专业考取北京大学社会工作硕士，主要使用DeepSeek、豆包、讯飞星火等免费国产AI工具，未付费使用ChatGPT或Claude。揭示免费AI工具有效性及付费模型带来的经济门槛问题。

开发者微调Qwen3-1.7B: 通过清洗生产痕迹（相关性过滤+4个教师大模型委员会重新标记），微调后模型在法官评分上以0.846超越744B的GLM-5教师模型，函数匹配率达76/78，M2 MacBook生成速度约38 tokens/s。

五款32GB显存开源模型: Ollama本地部署指南，测试Qwen3:32b、Qwen2.5-Coder:32b、DeepSeek-R1:32b、Gemma3:27b、Mistral-Small:24b，推荐Q4_K_M量化为最佳实用方案。

DeepSeek v4 Flash: 支持本地推理，2比特量化GGUF实现前沿模型本地运行，即使在高压缩率下性能依然保持可用。

Lemonade OmniRouter: 推出本地多模态工具调用功能，一次安装一个端点，通过自然语言指令生成或编辑图像、添加语音叙述，利用sd.cpp/kokoros/whisper.cpp/llama.cpp等本地引擎。

人类最后黑客松: 开启注册，评审标准侧重于上下文理解而非代码本身，参赛者需使用Codex构建本地推理模型，5月4日启动。

十、总结与洞察

核心趋势:

(1) Agentic AI爆发: 从技术demo到基础设施的转折点，商业化路径清晰（Manus/Genspark/OpenClaw/Hermes），”Agent能赚钱/属于每个人/能自我进化”三大命题已验证。交互范式从GUI向CLI跃迁，结果式交互成为主流。

(2) 模型军备竞赛白热化: 万亿参数MoE成标配（DeepSeek/腾讯混元/小米MiMo），多模态统一架构成主流（HappyHorse/SenseNova-U1/Nemotron 3 Nano Omni），国产模型快速追赶并在性价比上形成优势。上下文长度竞争至1M级别，量化技术推动端侧部署。

(3) 算力基础设施多元竞争: 英伟达Blackwell/国产昇腾/光芯片/CPU价值重估多元格局形成，算力供需紧张持续至2027年。DeepSeek与华为昇腾深度适配标志国产算力自主可控突破。

(4) 物理AI进入实测阶段: 人形机器人（小米/Kinetix AI/宇树）、自动驾驶（元戎启行/Momenta/佑驾创新）、具身智能（银河通用/生数科技）从实验室走向工厂和道路，数据瓶颈（真机数据不足、利用率低）成为主要制约。

(5) 商业模式重构: 从SaaS到AaaS（Agent-as-a-Service），按结果付费+共建评测集、GEO（生成式引擎优化）、Agent佣金与交易分润、用户记忆飞轮等新模式涌现。微软-OpenAI结束独家合作反映AI生态多元化趋势。

(6) 安全与治理滞后: Agent安全风险凸显（9秒删库事件），Cursor/Anthropic账号封禁暴露服务商责任边界模糊。监管框架（人类配额制/AI内容标签/外资安全审查）开始探索但远未成熟。Hinton警告4.8万亿市场仅1%投入安全。

(7) 开源生态繁荣: MIT/Apache协议成主流，Day-0芯片适配成为标配，百万亿Token激励计划降低开发者门槛，OpenClaw引发百虾争鸣生态，推动AI能力民主化。

深层矛盾: 技术迭代速度（月级）远超社会适应能力（年级），就业冲击（编程/翻译/客服/群演）已从预言变为现实，”人类配额制”等应对思路浮现但尚未形成共识。Agent的自主性与可控性之间的张力（9秒删库vs效率提升）将成为未来核心议题。