AI要闻周报(2026年5月18日-5月24日)
【谷歌】
1、Google I/O 2026:进入Agentic Gemini时代,全面AI升级与生态重构
美东时间5月19日,Google在年度I/O大会上发布从模型、应用到生态的多项AI更新,宣告正式进入以Agent为核心的“Agentic Gemini时代”。Alphabet CEO Sundar Pichai提出AI已成为“下一代计算平台”。
模型发布:Gemini 3.5 Flash与Gemini Omni
Google推出Gemini 3.5 Flash,在几乎所有基准测试中超越前代旗舰3.1 Pro,输出速度达289 tok/s,是其他前沿模型的四倍,被称为“迄今为止最强大的智能体和编码模型”。定价仅为同类模型的一半甚至三分之一。更强大的3.5 Pro将于下个月发布。
同时亮相的Gemini Omni是谷歌首个真正的全模态世界模型,能够接收文本、图像、视频、音频等任意组合输入,生成任意内容——首发支持高质量视频输出。用户可通过自然语言对话式编辑视频。Omni Flash已上线Gemini App、Google Flow及YouTube Shorts。
关键Agent:Gemini Spark与Antigravity 2.0
最具战略意义的产品是Gemini Spark,一款7×24小时在云端运行的个人AI智能体。底层基于Gemini 3.5 Flash和Antigravity Harness,可跨Gmail、Drive、Sheets、Calendar执行多步后台任务,还可以自定义Skills。下周向美国AI Ultra订阅者开放Beta。此外,Hacker News相关讨论中提及Gemini Spark是长期以来最有潜力的AI智能体之一。
Antigravity 2.0从IDE进化为完整的Agent-first开发平台,支持桌面应用、CLI、SDK及Managed Agents。现场演示仅用12小时、93个subagent、不到1000美元API额度,从零构建了一个可运行的操作系统。
搜索与订阅体系重塑
搜索迎来25年来最大改版:AI Overviews月活达25亿,AI Mode月活超10亿。搜索引入信息智能体,可后台持续追踪用户关注的主题,并具备生成式UI能力——自动生成定制化迷你应用和动态界面。
订阅体系全面重构:新增每月100美元的AI Ultra开发者计划,提供更高API额度、AI Studio高级功能和Agent访问权限;原有AI Ultra最高档从250美元降至200美元。
其他关键发布
Gemini App月活用户一年翻倍至超9亿,覆盖230多个国家。全新Neural Expressive设计语言上线,使AI交互更具动态与视觉吸引力。Google智能眼镜基于Android XR平台,音频眼镜今秋上市,显示眼镜正在测试。此外,SynthID水印已保护1000亿张图片和6万年音频资产,OpenAI等宣布采用。三大科技媒体报道(The Verge、CNET、TechCrunch)均聚焦Spark和Omni,认为这是Google对OpenAI和微软的全面反击。
Pichai指出,AI战略已从“聊天助手”转向“任务执行平台”,Google正试图把Gemini变成覆盖搜索、办公、开发、视频和移动生态的统一AI操作系统。
2、谷歌CEO皮查伊承认Gemini在Coding方面落后
谷歌CEO皮查伊在接受《纽约时报》播客采访时承认,Gemini在带工具调用的智能体编程、长期复杂代码任务等方面落后于行业前沿。他表示谷歌在文本、多模态、推理等整体能力上仍强,但在编码领域存在短板。皮查伊透露谷歌正通过推进Gemini 3.5 Flash迭代和内部应用Antigravity 2.0来追赶,认为过去一两年AI进展使AGI可能比预期更近。他还指出公众对AI影响工作的担忧是合理的,社会需重视AI的价值并为AGI做好准备。
3、谷歌与黑石集团合资成立AI云端公司,CoreWeave承压
谷歌与黑石集团计划合资成立一家AI云端公司。黑石投入约50亿美元股权资金并持多数股份,谷歌提供软件、服务及TPU晶片。此举为谷歌对外销售自研晶片的最大商业尝试,旨在与AI运算市场主导者英伟达展开直接竞争。伯恩斯坦分析预警,谷歌与黑石合资组建专注于TPU云计算的公司,将对CoreWeave等算力新贵的定价能力与利润率构成持续压制。超大规模云计算巨头对算力租赁市场的进攻将使新兴服务商面临系统性结构劣势。
【微软】
4、微软计划取消内部Claude Code授权
微软此前向数千名内部开发者开放Anthropic的Claude Code编码工具,该工具因支持非技术人员尝试编码而广受欢迎。但因削弱了GitHub Copilot CLI的推广并削减财年开支,微软计划取消大部分Claude Code授权。微软Experiences + Devices团队将在6月底停用Claude Code,推动工程师过渡至GitHub Copilot CLI,同时Anthropic的模型仍可通过Copilot CLI使用,Foundry合作不受影响。微软将加大对Copilot CLI的投入以优化其工程工作流适配。
5、微软阻止Databricks连接Power BI,争夺语义层控制权
微软阻止包括Databricks在内的合作伙伴将数据管理工具连接到Power BI产品。微软称是出于可靠性担忧,但行业多认为这是争夺语义层控制权的举措。语义层对提升AI代理准确性、降低成本至关重要。Databricks曾测试新功能方便Power BI客户在Databricks平台管理数据和构建AI代理,该功能采用率高。微软通过Fabric产品与Databricks和Snowflake竞争,同时又在Azure云上与之合作。Snowflake等近50家企业推动语义层标准,微软拒绝参与。
6、微软与 Anthropic 洽谈 Maia 芯片租用 深化 AI 算力合作
据报道,Anthropic 正与微软就租用其自研 Maia AI 芯片驱动的服务器展开早期谈判,以满足旗下 Claude 模型日益增长的算力需求。目前谈判尚处初步阶段,未必达成最终协议。
此次合作是双方现有战略关系的自然延伸。2025 年底,微软宣布向 Anthropic 投资最高 50 亿美元,后者承诺在 Azure 云服务上支出 300 亿美元。微软已将 Claude 系列模型通过 Azure 向企业客户销售,并每年至少购买 5 亿美元的 Claude 访问权限用于驱动 Copilot 产品。
微软今年 1 月已在 Azure 数据中心正式部署第二代自研 AI 芯片 Maia 200。该芯片针对 AI 推理任务深度优化,每美元 Token 生成效率提升 30%,已用于降低微软 Copilot 的运行成本。与英伟达芯片不同,Maia 主要聚焦于让现有模型运行更快、更便宜,而非用于训练新模型。
Anthropic 长期坚持多供应商策略,目前同时使用亚马逊、谷歌和英伟达的芯片资源。若此次芯片合作达成,将帮助 Anthropic 进一步优化算力投入成本,同时为微软自研芯片业务赢得一位极具分量的外部客户。这一动态也折射出 AI 行业头部玩家加速摆脱对单一芯片供应商依赖的整体趋势,可能重塑全球 AI 算力供给格局。
【DeepSeek】
7、DeepSeek V4 Pro API永久降价75%
DeepSeek宣布从6月1日起,V4-Pro API永久调整为当前促销价(原价的四分之一),输入缓存命中0.025元/百万Token、缓存未命中3元、输出6元。梁文锋解释定价原则是不贴钱也不赚取暴利,认为AI应普惠。该降价与融资并行,引起市场关注。DeepSeek V4是1.6万亿参数模型,通过技术实现极低KV Cache占用,缓存命中价格不到Claude Sonnet 4.6同类价格的3%。
8、DeepSeek计划推出DeepSeek Code,崔添翼挂帅
DeepSeek资深研究员Deli Chen发帖招聘,从零构建Code Harness团队,将推出DeepSeek Code产品。前TSY Capital联合创始人崔添翼(ACM金牌得主)或出任Agent Harness团队负责人。DeepSeek已在官网密集释放Agent Harness产品经理、研发工程师、深度学习算法研究员等10余个岗位,要求应聘者深度使用过Claude Code、Codex、Cursor、GitHub Copilot、Manus、OpenClaw等产品,显示其布局AI代码工具与Agent能力的明确信号。
9、DeepSeek获宁德时代、京东、网易等投资意向
据The Information报道,宁德时代(CATL)计划参投DeepSeek首轮融资,以实现锁定未来AI数据中心储能订单的战略。京东和网易也在洽谈参投但尚未最终确定。宁德时代近年来向数据中心储能领域扩张,关联公司曾收购VNET股权并投资供电系统公司。DeepSeek正在内蒙古自建数据中心以降低冷却成本。此次融资体现了AI竞赛从模型层向能源基础设施的延伸。
10、DeepSeek开招Agent Harness产品经理,透露Agent产品发力信号
DeepSeek最新热招岗位是Agent Harness产品经理,要求与工程师、研究员紧密协作参与桌面端Agent产品全过程,定义公司对Harness的理解。对候选人在Agent产品方面经验要求高,涉及Claude Code、Cowork、Codex等产品深度使用经验。此举表明DeepSeek正从模型实验室走向AI公司,同时推进模型与产品商业化。
【华为】
11、华为鲲鹏昇腾开发者大会发布多项技术成果
2026年鲲鹏昇腾开发者大会以“心怀挚爱,共绽光芒”为主题,发布昇腾超节点架构、CANN全面开源开放、Mind系列软件升级、鲲鹏超节点架构、BoostKit开源等成果。CANN兼容PyTorch、vLLM等主流框架,完成Triton和TileLang双引擎适配,全面支持PyTorch生态。MindSpore、MindSpeed、MindIE等软件栈全面升级。昇腾与鲲鹏推出升级后的开发者使能计划。华为强调将持续创新筑牢算力底座共建Agentic AI时代。
12、华为发布AI DC数据基础设施全栈方案
华为在2026创新数据基础设施论坛上正式发布AI DC数据基础设施全栈方案,涵盖五大核心模块:AI数据湖(OceanStor Pacific全闪分布式存储,容量密度11PB/2U)、知识与记忆平台(支持KV语义直通的上下文记忆存储CMS,降低推理首Token时延90%)、模型工程与资源调度(ModelEngine支持0码适配、一卡多用)、Agent框架(ModelEngine Nexent智能体平台,上线周期缩短80%)、数据韧性平台(端到端防滥用、防投毒、防勒索)。方案适配Agent普及与企业Token消耗爆发式增长的行业趋势。
【高通】
13、高通2026年产业动态:与OpenAI联手开发AI终端设备芯片
据媒体报道,高通正与OpenAI联手开发AI终端设备芯片,同时已与Stellantis达成芯片供应协议。高通股价单日飙升12%创历史新高,过去一个月累计涨幅75%。其在汽车领域营收同比增长38%至13亿美元,超100万辆汽车搭载其自动驾驶系统。高通还推出定制AI加速芯片进军数据中心业务,分析师看好其引领互联设备革命的前景。
【阿里巴巴】
14、阿里巴巴2026年产业动态:阿里云峰会发布真武M890芯片、Qwen3.7-Max模型,全线升级Agent基础设施
阿里巴巴于2026年5月20日(周三)在年度云峰会上集中亮出AI技术底牌,推出全新“芯—云—模型—推理”技术体系。
芯片方面,平头哥发布新一代自研AI芯片真武M890,性能是上一代真武810E的三倍,内置144GB显存,片间互联带宽达800GB/s,原生支持FP32到FP4多精度,覆盖高精度训练与低精度推理。配合自研ICN Switch 1.0芯片,实现64卡全带宽互联,128张芯片组成单一计算单元,通信时延低至百纳秒级,同步推出基于该芯片的128卡超节点服务器,已通过阿里云百炼平台开放。同时公布芯片路线图:2027年Q3推V900(性能再提升三倍),2028年Q3推J900。平头哥累计出货量已达56万片,客户覆盖20个行业逾400家企业,正筹备独立IPO。
模型方面,发布旗舰大模型Qwen3.7-Max。在Arena全球盲测总榜中位列国产模型第一,性能接近GPT、Claude、Gemini最强版本。模型可在连续35小时内自主完成1158次工具调用,实现生产级AI推理内核10倍几何平均加速。多项基准测试成绩亮眼:GPQA Diamond 92.4,SWE-Verified 80.4,MCP-Mark 60.8。Qwen3.7-Max即将通过阿里云百炼平台提供API接入,支持Claude Code、OpenClaw、Qwen Code等主流智能体框架。
平台方面,阿里云发布为Agent而生的全新AI产品官网“千问云”,提供150多款主流模型API,并将核心服务能力封装为Skills和CLI工具,实现Agent一键调用模型、自动选型与智能用量管理,同时提供按量付费和Token Plan订阅模式,Skills和CLI已在GitHub开源。
阿里云资深副总裁刘伟光表示,过去模型服务平台为人服务,未来主力将是Agent,千问云正在全面重构模型服务平台。目前阿里云百炼MaaS开发平台客户数同比增长8倍,AI相关产品收入保持快速增长。
【英伟达】
15、英伟达Q1营收超预期但不够亮眼,数据中心续创新高,新增800亿回购
英伟达公布截至2026年4月26日的2027财年第一财季业绩:营收816.2亿美元,同比增长85%,较分析师预期高约3.1%。数据中心业务营收752亿美元,同比增92%,贡献超九成营收,双双创单季新高。非GAAP口径下调整后每股收益1.87美元,同比增140%,毛利率75.0%,略低于上季但高于预期。
董事会批准追加800亿美元股票回购授权,并将季度股息从0.01美元大幅提高至0.25美元,显示现金流充沛。二季度营收指引中值910亿美元,高于分析师预期873.6亿美元,但指引低端仅持平共识。市场此前对英伟达“持续大幅超预期”期待较高,本次超预期幅度未形成压倒性惊喜,叠加报告框架调整影响可比性,股价盘后反复波动。英伟达称AI工厂扩张正以非凡速度加速。
16、英伟达:要成为全球领先CPU供应商, Vera CPU 剑指智能体 AI 开辟两千亿美元新市场
英伟达在电话会上,黄仁勋披露 Vera Rubin 系统将于 2026 年 Q3 量产,推理吞吐量较 Blackwell 提升 35 倍。
Vera CPU 基于定制 Arm 核心,与 Rubin GPU、NVLink 端到端协同优化,相较 x86 方案实现1.5 倍单核性能、2 倍能效、4 倍机架密度提升。作为独立 CPU 及存储节点销售,Vera 为英伟达打开2000 亿美元全新市场,公司预计今年 CPU 收入近 200 亿美元,冲刺全球领先 CPU 供应商地位。
英伟达大幅上调行业预期,预计 2030 年全球 AI 年支出达3-4 万亿美元,2027 年超大规模数据中心资本支出将超 1 万亿美元。当前推理市场份额正快速增长,Anthropic 已加入英伟达生态,通过 Azure、AWS 等平台获得算力支持。黄仁勋强调,Vera Rubin 全生命周期将持续供应紧张,定制芯片(如 LPX)因架构局限仍为小众选择。
生态合作同步扩容,英伟达与谷歌云推出搭载 Vera Rubin 的 A5X 实例,可跨站部署 96 万枚 Rubin GPU,支撑超大规模 AI 工作负载。在物理 AI 领域,英伟达与现代、起亚合作开发 L4 级自动驾驶系统,联合 Uber 布局自动驾驶车队,并发布 Halos OS 统一安全架构。
黄仁勋详细解释了“harness”概念:框架负责处理I/O、编排、内存管理和工具调用(如浏览器、编译器),这些在CPU上运行;智能体“思考”在GPU上进行,框架在CPU上执行。Vera CPU专为这一架构设计,提供高效的工具调用和编排能力。Harness工程的重要性将随着智能体数量增长而指数级上升。
为匹配业务节奏,英伟达调整报告框架,将数据中心拆分为超大规模云(379 亿美元)与 AI 云、工业及企业(374 亿美元),边缘计算收入 64 亿美元,同比增 29%。面对 AWS、微软等自研芯片竞争,英伟达以 Vera+Rubin 全栈方案巩固壁垒,但市场预期高企致财报后股价微跌 1%,毛利率或于 2028 财年后承压。
【摩尔线程】
17、摩尔线程2026年产业动态:发布“云边端”全栈智算矩阵,国产算力迈向全闭环
摩尔线程在年度产品发布会上全面展示了覆盖云、边、端的全栈智算矩阵。云端核心为夸娥万卡级智算集群,搭载MTT S5000智算卡,Dense大模型训练MFU达60%、MoE达40%,有效训练时长90%,线性扩展效率95%,并引入零中断容错技术支撑长周期稳定训练。端侧推出自研“长江”智能SoC,基于全大核CPU+全功能GPU+高能效NPU+统一高速内存架构,驱动家庭AI中枢AICUBE(集成“小麦”智能体、AI NAS与AI PC能力)和AI算力本AIBOOK(原生Linux系统,支持多智能体协作及多系统),同时发布MTT E300 AI模组切入工业与边缘场景。具身智能方面推出首个全栈仿真平台MT Lambda,实现渲染、物理、AI三引擎合一与“零拷贝”数据流通,已打通大模型训练—仿真模拟—端侧部署的生态闭环。MUSA生态持续进化,MUSA SDK 5.1.0深度兼容CUDA 12.8,获vLLM与SGLang官方原生支持,并借助Automusify等工具实现用AI加速生态自我演进,为国产算力从替代走向定义提供了完整底座。
【Anthropic】
18、Anthropic预计Q2营收109亿美元,首次实现运营盈利
Anthropic预计第二季度营收翻倍至109亿美元,首次实现5.59亿美元运营利润。其季度营收增速超过Zoom、谷歌和Facebook IPO时期。Claude模型走红,agentic任务能力受追捧,但计算资源承压限访问。算力支出占比降至56美分/美元,使用低成本芯片和保守支出策略保持效率。
19、OpenAI联合创始人Andrej Karpathy加入Anthropic
OpenAI联合创始人Andrej Karpathy宣布加入Anthropic,负责预训练团队。他将组建团队利用Claude加速预训练研究,推动LLM前沿迭代。Anthropic相信AI辅助研究而非纯粹算力是其与OpenAI和谷歌保持竞争力的关键。
20、Anthropic:企业客户数量首次超越OpenAI,市场份额扩大至四倍
金融科技公司Ramp的AI指数报告显示,Anthropic的企业付费客户占比达34.4%,首次超越OpenAI的32.3%,其在金融、科技、专业服务等领域的领先得益于聚焦技术客户群的精准策略。自2025年5月以来市场份额扩大至原来的四倍,年度经常性收入已飙升至450亿美元。建议结合更广泛市场数据评估其可持续性。
【长鑫科技】
21、长鑫科技2026年产业动态:业绩爆发式逆转
长鑫科技更新招股书披露,过去近10年累计亏损超366亿元后,2025年实现营收617.99亿元、归母净利18.75亿元,2026年第一季度营收508亿元、归母净利247.62亿元,预计上半年归母净利500-570亿元,主要受益于存储涨价及产能利用率高企。
【紫光闪芯】
22、紫光闪芯2026年产业动态:构建全栈场景闪存产品布局
紫光闪芯是新紫光集团2024年成立的全资子公司,定位AI时代固态硬盘及闪存产品提供商。构建覆盖云边端的全场景闪存产品矩阵,已推出多系列企业级SSD并完成头部客户适配。依托集团生态与双供应链具备稳定供货优势。
【AMD】
23、AMD 2026年产业动态:AI开发者大会首次登陆上海,苏姿丰高喊“开放共赢”
5月19日,AMD AI开发者大会首次在美国之外的城市——上海举办,吸引了超2000名开发者到场。AMD董事会主席兼CEO苏姿丰亲临现场,直言“中国是全球最具活力的AI生态系统”。
核心发布:全方位赋能中国AI开发者。AMD宣布推出首个面向中国AI开发者的免费公共AI开发者云,搭载Radeon GPU,加入开发者计划即可获得价值100美元的免费算力额度。同时,AMD AI开发者计划-中国正式上线,通过技术资源、开发课程与社区活动助力开发者成长。ROCm软件栈更新至7.2版本,扩展对Windows和Linux的兼容性,并实现“一次编写,全路径运行”。
智能体主机:端侧AI新品类。AMD率先提出“智能体主机”新概念,基于锐龙AI Max+系列处理器,搭载CPU+GPU双引擎和统一内存架构,至高支持96GB GPU显存、原生运行高达200B参数的大模型(如Qwen 3.5)。惠普、华硕、联想等伙伴已推出超35款相关产品,涵盖一体机、笔记本与Mini AI工作站。
生态合作密集落地。苏姿丰与零一万物CEO李开复对话“AI智能体新范式”,双方联合发布企业智能体一体机Cube01,采用128GB统一内存,可在本地运行数百个Agent。AMD还宣布已与阿里云、DeepSeek、小米MiMo、阶跃星辰、MiniMax等完成Day-0适配与深度优化,其EPYC处理器支持中国顶级CSP的700多个云实例。苏姿丰总结道:“AMD在中国已深耕超过30年,拥有4000余名工程师。我们正以开放平台连接开发者,共同构建下一代AI计算的基石。”
【OpenAI】
24、OpenAI:实施IPO前夕最大规模重组,Brockman全面接管产品战略
OpenAI在IPO前夕实施历史上最大规模组织架构重组,将ChatGPT、Codex与API三大核心产品线合并为统一产品组织,联合创始人兼总裁Greg Brockman全面接管产品战略。此举源于内部核心高管离职导致管理层空心化,同时面临Anthropic估值反超及谷歌即将推出竞品的双重压力,实质是以整合能力向Agentic Future进军并向资本市场传递清晰战略故事。
25、OpenAI:立场转变,与Anthropic共同支持含强制审计的AI安全法案
OpenAI近期在伊利诺伊州立法事务中明确反对此前支持的SB 3444法案中的责任豁免条款,并与Anthropic共同支持要求第三方审计、聚焦灾难性风险的更强法案SB 315,显示其转向接受有意义的AI安全立法。这一立场变化标志着公司从宽松监管支持向实质性安全措施认可的重大转变,有助于推动建立更高标准的行业合规框架。建议政策制定者推进类似含强制审计与风险防控机制的立法。
【西部数据】
26、西部数据2026年产业动态:推出业界首款后量子加密硬盘
WD在最新Ultrastar UltraSMR硬盘中整合经NIST核准的后量子加密技术,结合双重签章与PKI/HSM构建从制造到运行的信任链。旨在保护AI时代海量长期存储资料免受未来量子计算攻击威胁,标志着硬件级量子韧性防护进入实际部署阶段。
【IBM】
27、IBM 2026年产业动态:量子计算创纪录——52量子比特量子傅里叶变换
ParityQC研究团队在IBM Quantum Heron r3处理器上成功演示了52量子比特的量子傅里叶变换,创下迄今最大规模纪录。采用Parity Twine方法替代传统SWAP门路由,显著降低错误率、提升保真度。量子傅里叶变换是Shor算法、量子相位估计等的基础构建模块,此成果展示了算法、编译与硬件协同对量子计算性能的提升。为优化、模拟和量子化学等领域的复杂算法开辟新路径,团队计划发布相关功能供开发人员探索。
【HPE】
28、HPE 2026年产业动态:重构私有云产品栈,助力企业应对VMware迁移与AI需求
HPE对其私有云、存储及数据保护产品进行全面更新,通过HPE GreenLake平台交付,重点简化虚拟机、Kubernetes与AI工作负载统一管理。新产品包括支持与VMware并行运行的HPE私有云平台、AI就绪存储方案(如HPE Alletra Storage MP X10000)及增强的数据保护功能。
【Teradata】
29、Teradata 2026年产业动态:发布整合数据、分析、AI与智能体编排的企业级自主知识平台
Teradata发布企业级自主知识平台,面向已完成AI试点的企业,提供AI Studio、自然语言工作区Tera、Tera Agents等功能。通过Enterprise MCP实现每次工具调用的权限验证、审计与人工介入审批。该平台以治理能力为核心卖点,被分析师视为有实质意义的战略整合。
【行业研究机构/预测】
30、EIA预测2050年数据中心耗电量将是2020年的16倍
美国能源信息署最新报告显示,在高电力需求情景下,2050年数据中心服务器电力消耗将达8180亿千瓦时,为2020年水平的16倍,届时将占商业建筑总用电量的22%至33%。AI服务器装机规模的指数级增长是核心驱动因素,能效提升无法抵消规模扩张的影响。该趋势将推动美国整体电力消费以每年0.9%至1.6%速度增长至2050年,对能源基础设施投资者和电力市场参与者具有直接影响。
31、戴尔科技世界 2026 开幕:AI Factory 2.0 与智能体 AI 成核心焦点
拉斯维加斯,2026 年 5 月 18 日 — 戴尔科技全球峰会(Dell Technologies World 2026)今日在美国拉斯维加斯威尼斯人会展中心正式开幕,为期四天的大会以聚焦 AI 从实验阶段向企业级生产应用的全面转型。
戴尔科技集团董事长兼首席执行官迈克尔・戴尔(Michael Dell)与 NVIDIA 创始人兼首席执行官黄仁勋发表联合主题演讲。两位科技巨头共同发布了Dell AI Factory 2.0,这是戴尔与 NVIDIA 合作推出的下一代企业级 AI 基础设施平台。
AI Factory 2.0 的核心亮点在于其全新的 PowerEdge 服务器产品线,支持最多 256 块 NVIDIA Blackwell Ultra GPU 每机架,采用先进的直接芯片液冷技术,LLM 训练速度比上一代平台提升 4 倍。专为推理工作负载设计的 PowerEdge XE9712 服务器则搭载 NVIDIA GB300 NVL72,AI 推理输出能力提升 50 倍。
Agentic AI成为本届大会的绝对主题。戴尔数据显示,目前已有 68% 的企业在智能体部署方面取得了成熟度。戴尔推出了与 Cohere North、DataRobot 和 ClearML 等合作伙伴共同开发的智能体 AI 平台,提供编排、治理和可观测性能力,帮助企业安全地部署和管理多智能体工作流。
截至目前,全球已有超过 4000 家客户部署了戴尔 AI 工厂,早期采用者在第一年就实现了高达 2.6 倍的投资回报率。戴尔同时宣布扩大与 AMD 的合作,在 PowerEdge 服务器中支持 AMD Instinct MI350P GPU,为企业提供多供应商 AI 基础设施选择。
EMC在Dell Technologies World发布了PowerProtect数据保护平台升级,新增AI工作负载保护和快速恢复功能。平台支持多云环境,自动识别和保护AI模型数据,降低AI部署的数据安全风险。
32、2026中国AIGC产业峰会:发布《2026中国AI应用全景图谱报告》
中国AIGC产业峰会成功举办,围绕AI应用落地与智能体新范式展开深入探讨。峰会上正式发布了《2026中国AI应用全景图谱报告》,该报告以“9亿次点击背后”为切入点,全景式揭示了中国AI应用的真实生态。数据显示,2026年4月国内AI应用Web端月访问量突破9亿,APP端月下载量超2.4亿,日活同比暴涨223%,日均Token调用量突破140万亿,中国已成为全球AI应用活跃度最高的国家。报告将AI应用分为AI智能助手、AI文娱生活、AI效率办公、AI创作四大赛道,发现用户留存差异显著:智能助手留存最高,AI效率Web端活跃份额超七成,AI创作APP端日活年增449%。核心观点是AI正从“好玩的AI”迈向“离不开的AI”,并提炼出Agent化、模型普惠化、入口化、付费化、垂直深化五大趋势,标志着AI已深度嵌入工作流,产业进入商业化深水区。
二、新品发布与技术应用
1、谷歌推出AI购物智能体“通用购物车”
谷歌在I/O大会上发布基于通用商务协议(UCP)的AI购物智能体“通用购物车”,整合YouTube、Gmail、Gemini等平台数据,支持Target、Shopify、Wayfair等零售商跨平台结账。该功能可自动检测商品兼容性、推荐优惠信用卡、比价提醒,并能在用户授权下自动完成日常采购。UCP由谷歌联合多家零售商开发,允许商家在Google Pay上保留会员积分等个性化数据。该功能与Chrome“自动浏览”功能协同,旨在实现自然语言授权的AI购物体验,降低结账门槛并提升转化率。
2、谷歌:宣布安卓版Gemini Intelligence,跨App实现AI任务自动化;推出基于设备端AI的"情境建议"功能
谷歌在Android Show上宣布将Gemini深度整合至Android系统并推出Gemini Intelligence,可跨应用自动完成表单填写、日程安排、购物清单生成、旅游项目查找及自定义小组件等多项日常任务。该升级将率先登陆三星Galaxy和谷歌Pixel手机,并覆盖Android Auto、Wear OS及智能眼镜,旨在减少用户手动操作,重塑人机交互方式。
谷歌在Android系统中推出基于设备端AI的"情境建议"功能,通过分析用户日常活动与位置数据,在设备本地加密空间内学习用户习惯,提供个性化应用建议,且数据不会上传或共享。该功能目前仅在搭载Android 16及Google Play服务26.18的Pixel 10系列设备上逐步推送,用户可自主管理数据权限。这标志着Android在设备端个性化AI应用上的重要进展。
3、智谱2026年新品发布:落地ZCube组网架构,让同样GPU多干15%的活
智谱率先在GLM-5.1生产集群中规模化落地新一代组网架构ZCube(发表于ACM SIGCOMM 2025)。该架构通过取消分层实现全网扁平化、单轨多轨混合接入实现负载均衡、精简交换机层级,解决了传统架构下AI推理流量的结构性拥塞。在不新增GPU、不修改代码前提下,集群推理吞吐提升15%,首Token响应尾延迟下降40.6%,交换机与光模块硬件成本减少1/3。ZCube与OpenAI发布的MRC协议共同指向AI基础设施价值重心从算力向系统效率迁移。
4、SAP 2026年新品发布:推出2.0版Joule Studio及Joule Desktop,升级AI工具
SAP此前承诺推出的Knowledge Graph、Joule Studio和AI Agent Hub等AI工具虽已上线,但采用率远低预期。目前SAP正推出2.0版本大幅升级,新版Joule Studio支持LangGraph、AutoGen等主流框架,并原生理解SAP专有代码模型,正式版预计第三季度发布。SAP还在调整交付方式,推出允许个人用户自主构建自动化的Joule Desktop,押注草根式采用会比集中式推广更快。
5、【谷歌2026年新品发布合集】覆盖I/O全栈新品、AI设计应用、搜索功能及溯源体系。
1、谷歌 I/O 2026 集中发布 AI 全栈新品 Gemini 生态全面升级
谷歌在 2026 I/O 开发者大会上集中发布了涵盖大模型、智能体、开发平台、科研工具及硬件的全栈 AI 新品,全面推进其 "AI 优先" 战略。
核心模型方面,谷歌推出 Gemini 3.5 Flash,输出速度达 289 tok/s,是同类模型四倍,以不到一半成本提供前沿能力,已上线所有谷歌产品和 API 并驱动 Gemini Spark;同时发布 Gemini Omni 全能多模态模型,支持文本、图像、音频、视频任意输入输出,首发视频生成与对话式视频编辑功能,今日起在 Gemini app 等平台上线。
智能体与开发领域,谷歌推出 7×24 小时个人 AI 智能体 Gemini Spark,深度集成 Workspace 工具,可后台持续执行复杂任务,下周向美国 Ultra 用户开放 Beta;发布 Antigravity 2.0 agent-first 开发平台,现场演示 12 小时内用 93 个子代理构建可运行操作系统,仅耗费不到 1000 美元 API 额度。
此外,谷歌还推出 Neural Expressive 新设计语言、ERA 科研工具(成果已发表于《自然》);Gemini 应用新增 "扩展" 思考模式并将集成 Canva 等第三方应用;将 Street View 接入 Project Genie 世界模型,基于 2800 亿张街景实现沉浸式环境模拟。硬件方面,谷歌发布融合 Android 与 ChromeOS 的 Googlebook 笔记本。
2、Google推出AI设计应用Pics挑战Canva
Google宣布推出面向Google Workspace用户的AI设计应用Pics,该应用由Gemini与Nano Banana 2模型驱动。用户可通过文字提示生成社交媒体图文、邀请函等视觉内容,并支持局部精细编辑与手动修改,显著降低专业设计门槛。该应用旨在挑战Canva等主流设计工具,目前已进入测试阶段,并将于今夏向Google AI Ultra订阅用户推出。
3、YouTube推出“Ask YouTube”AI对话搜索功能并引入Gemini Omni
YouTube宣布推出“Ask YouTube”AI对话搜索功能,支持复杂查询与追问,并可整合长短视频生成回答。该功能目前面向美国桌面端Premium用户进行测试。同时,YouTube将Gemini Omni视频模型引入Shorts Remix与YouTube Create,以提升创作连贯性和叙事效果。平台还将肖像权检测工具扩展至18岁以上用户,帮助防范AI生成内容中的深度伪造滥用。
4、谷歌和OpenAI联合推出SynthID溯源体系
OpenAI与Google合作,将SynthID不可见水印与C2PA合规元数据结合,构建多层溯源体系以提升AI生成图像来源的可验证性。该综合方案弥补单一元数据易被剥离的缺陷,使溯源信号在文件变换中仍可被识别。
6、OpenAI 2026年新品发布:为ChatGPT Pro美国用户推出个人财务管理新功能预览版
OpenAI面向美国ChatGPT Pro订阅用户推出个人理财工具预览版,通过与Plaid合作支持接入逾12,000家金融机构,可查看投资组合、消费分析及订阅管理等信息并获取对话式理财建议。该工具整合了收购的Hiro团队金融经验,支持Web及iOS端使用,未来将接入Intuit以提供税务与信贷审批预测功能,并设有数据解绑及30天删除机制保障安全。建议根据用户反馈持续优化后向Plus用户开放,同时依托与金融专家合作的基准测试提升模型在个人理财场景的表现。
7、Cursor 2026年新品发布:发布Composer 2.5,性能接近Claude Opus 4.7
Cursor发布Composer 2.5编码代理,基于Moonshot的Kimi K2.5开源模型构建。该版本在持续执行长任务方面显著提升,性能接近Claude Opus 4.7而成本仅为后者1/10。Cursor还加速自研并与SpaceXAI达成算力合作。
8、英特尔2026年新品发布:发布Wildcat Lake处理器
英特尔将最先进的18A制程首次下放至面向主流市场的第三代酷睿处理器Wildcat Lake。具备40TOPS平台算力、显著降低的功耗与大幅提升的GPU AI性能,推出萤火虫计划通过系统级重构降低成本,打破AI PC的高端限制。
9、Redis 2026年新品发布:推出实时Context Engine解决AI智能体记忆缺失问题
Redis宣布推出专为企业级AI智能体设计的实时Context Engine。该引擎包含Context Retriever、Agent Memory和Data Integration三大组件,分别解决语义建模与数据获取、双层记忆管理及实时数据同步问题,旨在消除AI智能体因记忆缺失引发的上下文错误与停滞。该方案依托Redis已覆盖43%企业AI智能体技术栈的基础,有望使其成为AI智能体的“操作系统”,显著提升复杂任务的可靠性与自主性。建议企业利用该引擎构建更复杂可靠的智能体,以在自动化处理高级业务时减少失效风险。
10、Anthropic 2026年新品发布:推出Claude for Small Business及合同审查工具
Anthropic发布面向小型企业的Claude for Small Business套件,其中核心功能/review-contract能在约5分钟内提供详尽的合同风险分析,标出红旗条款、隐藏陷阱并给出谈判建议。测试显示其分析质量优于高价律师服务。该套件还包含31项可集成主流商业应用的技能,订阅价格每月20美元(Claude Pro)。Anthropic表示中小企业贡献美国近半经济总量,但缺乏学习使用AI的资源。
11、Dataiku与Snowflake 2026年新品发布:深度集成推出Cobuild on Snowflake
Dataiku与Snowflake深度集成推出新产品“Cobuild on Snowflake”,结合Snowflake Cortex AI与Dataiku编排平台,让用户通过自然语言创建AI工作流和智能体,并在Snowflake环境中实现治理与部署。该工具通过可视化工作流逻辑和内置治理功能,帮助企业解决生成式AI项目在生产环境中的合规与管理难题。
12、Meta 2026年新品发布:Threads平台测试@Meta AI功能,无法屏蔽引发用户不满
Meta在Threads平台测试新功能,允许用户通过@Meta AI账号获取问题解答,但用户发现无法屏蔽该AI账号,引发大量不满。Meta表示目前暂不支持直接屏蔽,但用户可通过静音、隐藏回复或选择“不感兴趣”来管理AI内容体验。此举反映了社交平台集成AI助手时面临的用户体验与控制权平衡问题。
三、学术前沿与研究突破
1、斯坦福HAI与谷歌DeepMind联合发起组织AI大挑战赛
斯坦福HAI和谷歌DeepMind发起“AI与组织大挑战赛”,吸引全球156所高校超200支学术团队参赛。获奖团队计划利用Transformer架构构建“大型协调模型”,学习高效团队的协作规律并预测最优行动序列。决赛团队还从精益创新管理、集体智能测量、隐性专业知识挖掘等角度提出方案。谷歌DeepMind为获奖团队提供算力、工程资源与导师支持。斯坦福HAI同步宣布成立AI与组织实验室,旨在将学术成果转化为组织管理实践。
2、阿里巴巴与北大BEAM技术
阿里巴巴与北京大学联合提出BEAM(二值掩码动态路由)方法,用于MoE大模型动态稀疏推理。通过可学习二值掩码实现每个词自适应选择激活专家数量,保留98%性能前提下推理速度最高提升2.5倍。无需从零训练模型,已集成vLLM框架。在Qwen1.5-MoE、DeepSeekV2-Lite和Qwen3-30B-A3B上验证,对MoE架构具有普适性。
3、Harness工程研究:Anthropic和OpenAI实验证明Harness关键
Anthropic实验显示,同一个Opus 4.5模型,无Harness时9美元全废,套上Harness花200美元效果起飞。OpenAI百万行实验证明,在仓库根目录加AGENTS.md文件(不到100行Markdown)即可大幅提升Codex成功率。结论:AI编程智能体失败主因不在模型而在Harness。Harness由指令、工具、环境、状态、反馈五子系统构成。DeepSeek也开始招聘Harness工程师。
4、Data Engineering Harness概念提出
未来十年的数据工程将从过度拆分的Modern Data Stack转向Data Engineering Harness范式:人定义目标,AI自动执行任务,Harness提供工程边界与管控。该框架封装各类数据工程能力,让AI操作受控可审计并保留人类审查权。未来数据工程师分化为工具操作层与工程指挥官两类,能整合业务、工程与AI工具、沉淀企业工程经验的人才价值凸显。
5、浙江大学与西湖大学联合提出FAAST
浙大和西湖大学联合提出FAAST方法,无需反向传播,一次正向扫描将训练样本压缩为快速权重矩阵,推理时间和内存占用分别节省90%和95%以上。该方法解决了传统模型适配需反向传播的局限。
6、EIA预测2050年数据中心耗电量将是2020年的16倍
美国能源信息署最新报告显示,在高电力需求情景下,2050年数据中心服务器电力消耗将达8180亿千瓦时,为2020年水平的16倍,届时将占商业建筑总用电量的22%至33%。AI服务器装机规模的指数级增长是核心驱动因素,能效提升无法抵消规模扩张的影响。该趋势将推动美国整体电力消费以每年0.9%至1.6%速度增长至2050年,对能源基础设施投资者和电力市场参与者具有直接影响。
7、加州大学圣地亚哥分校提出BOOKMARKS系统,助AI代理长程记忆
加州大学圣地亚哥分校提出BOOKMARKS系统,通过主动提问、书签复用和按需更新三种机制,帮助AI角色扮演代理高效记忆长篇故事细节。系统包含概念、状态、行为三类书签,对应不同性质信息追踪需求。在16部作品85个角色的评测中,该系统表现显著优于纯模型、检索法、档案法等现有方法,超90%情况可复用或衍生已有书签,能节省超70%搜索计算量。系统可应用于陪伴型AI助手、交互式叙事游戏、长文创作等场景,相关论文和代码已开源。
8、V-Nova提出下一代AI数据架构应具备层次化与计算感知特性
V-Nova提出,当前AI系统缺乏类似人类元认知的感知反馈机制,现有单体数据格式迫使AI全量加载数据,效率低下。下一代AI数据架构应具备层次化、并行化与计算感知特性,让模型可先获取概要再按需查询关键细节,将数据转变为可交互的感知接口。这种分层数据架构对视觉AI与物理AI尤为关键,能大幅降低I/O、内存移动和预处理开销,提升实时系统响应速度与能效。
9、OpenAI通用内部模型突破埃尔德什单位距离经典数学难题
OpenAI的通用内部模型未采用数学专用设计,自主突破了埃尔德什1946年提出的已80年无实质进展的单位距离经典数学难题,证明单位距离对数增长为超线性,打破了过往数学家认为其呈线性增长的核心共识。该成果获菲尔兹奖得主高尔斯等高度认可,被认为是AI在数学领域最亮眼成就。负责该模型的Noam Brown表示将尽快发布,其精简思路内容达125页,被描述为“令人恐惧”的推演。
10、研究建议大模型推理评价纳入“焦耳/词元”能耗指标
香港科技大学等机构联合研究指出,大模型推理评价应纳入“焦耳/词元”能耗指标并构建“词元生产函数”理论框架。该研究将计算能力与电力供应作为双重约束,揭示当前评价体系因忽视能耗而无法识别瓶颈的问题。结果表明,通过KV缓存压缩、稀疏注意力等优化可在保持质量前提下显著提升能效,不同测量方式可能导致对瓶颈类型的相反判断。
11、伊利诺伊大学联合团队提出PyRAG:将多跳问答转化为可执行Python程序,编译器反馈驱动自愈
由伊利诺伊大学厄巴纳-香槟分校、香港科技大学和德克萨斯农工大学联合完成的研究(arXiv:2605.12975)提出PyRAG框架。其核心思想是让AI将多跳问答过程写为一段实际可运行的Python程序,以变量存储中间结果、通过执行代码获得客观反馈,颠覆传统RAG依赖自然语言推理的脆弱模式。
框架由三个智能代理分工:分解代理将复杂问题拆成可单步回答的子问题;规划代理生成完整的Python代码,调用retrieve(搜索)和answer(回答)函数;回答代理专注从检索文档中提取答案。系统提供两种自动纠错机制:编译器驱动的自我修复——Python解释器报错后规划代理可针对性修改代码(最多三次);执行驱动的自适应检索——回答代理输出"unknown"时自动将搜索文档从5篇扩至10篇,避免错误静默传播。
在PopQA、HotpotQA、2WikiMultihopQA、MuSiQue和Bamboogle五个基准上全面测试:无训练设置下以Qwen2.5-7B为基座,PyRAG平均精确匹配率达30.8%,比单步RAG提升11.8个百分点;在组合推理数据集Bamboogle上提升高达25.5个百分点。强化学习版PyRAG-RL在7B规模模型中达39.2%,所有同类模型中最佳。失败分析表明,约一半错误源于检索召回率不足,程序代码本身错误仅占5%,印证了结构化规划的可靠性。
12、UNC、Meta、谷歌等12机构开源AutoResearchClaw:打造会“自救”的AI科研Agent
UNC、Meta、谷歌等12机构联合开源AutoResearchClaw,这是一套将失败诊断修复与经验沉淀置于核心的AI科研Agent系统。系统通过23阶段管道(涵盖发现、实验、写作)精细管理研究流程,每阶段有明确证据提交与验收标准。多智能体辩论在假设生成与结果分析环节引入对立角色,防止自我确认偏差。自愈执行使实验失败后能诊断错误或换向(Pivot/Refine),而非直接终止。结果注册表限制写作Agent只能读取真实运行记录,搭配四层引用验证消除幻觉。跨运行经验存储(Lesson Store)将失败转化为后续任务的防护栏。在ARC-Bench评测中,CoPilot模式综合得分0.648,较AI Scientist v2提升54.7%,结果分析维度提升100.4%。消融实验表明,辩论是最大质量贡献项,自愈是最大完成率贡献项。
13、UIUC与Meta等提出"Code as Agent Harness"综述
UIUC、Meta、斯坦福等机构联合发布综述,提出"Code as Agent Harness"概念。代码正成为Agentic AI的运行底座,模型负责生成与判断,Harness承担执行、验证与治理。指出未来可靠性将从模型问题转为系统问题。
14、Nous Research 推出 TST 预训练新方法 算力成本直降六成
凭借 Hermes Agent 出圈的 Nous Research 团队发布 Token Superposition Training(TST)预训练技术。该方法无需修改模型架构、优化器或训练数据,仅通过调整预训练早期的学习路径实现提效:训练前期将连续多个 token 叠加为 "粗粒度词元" 让模型快速学习语义分布,后期切回标准自回归训练补全精度。实验显示,在 10B-A1B MoE 模型上,TST 仅用基线 38.7% 的 B200 GPU 时间,就完成了近 2 倍的 token 训练量,最终损失更低且 HellaSwag 等 0-shot 评测指标同步提升,整体预训练提速约 2.5 倍、算力成本下降约 60%。与 DeepSeek 的系统级重构路线不同,TST 作为 "即插即用" 方案落地门槛更低,将显著降低中小团队大模型训练的试错成本。
15、高通AI研究院提出MELT架构,共享KV缓存使深度推理内存消耗恒定
高通AI研究院提出MELT架构,通过可学习门控机制使循环Transformer共享单一KV缓存,将AI深度推理的内存消耗由随循环数线性增长转为恒定,并在多项基准测试中性能超越同规模普通模型。实验表明该架构在保持约9.5GB内存占用的同时,数学推理与通用推理能力均优于对比模型,且通过两阶段训练验证了核心组件的必要性。该研究建议将该路径用于轻量级后处理训练实现架构升级,以降低内存瓶颈对AI深度推理的限制。
16、南洋理工大学等研发δ-mem轻量化在线记忆机制,解决LLM“失忆”
南洋理工大学等多所高校及研究机构联合研发了一种名为δ-mem的轻量化在线记忆机制,通过在冻结大模型旁添加小型联想记忆矩阵,为大型语言模型提供动态记忆,解决了现有大模型易“失忆”的问题。该机制在记忆密集型任务上性能提升超30%,参数量仅占骨干模型的0.12%,具有轻量、高效等特点,且在跨骨干模型上验证了泛化性,为提升AI记忆能力提供了新途径。
17、香港中文大学与华为联合研发FOCUSFT框架,解决LLM长文本“注意力稀释”
香港中文大学与华为联合研发了名为FOCUSFT的双层优化训练框架,通过内循环参数化记忆与双向注意力机制,有效解决了大型语言模型在处理长文本时“注意力稀释”的核心问题。该框架显著提升了模型对长文本的理解能力,并在多项长文本理解测试中取得了优异表现,为未来智能体处理复杂任务提供了重要技术支撑。
18、香港科技大学等提出MemLens多模态长期记忆基准
港科大等机构提出MemLens基准,包含789道需图文证据的多会话记忆题。系统评测27个长上下文视觉语言模型和7个记忆增强Agent。发现前者在长历史中易丢失图像证据,后者虽检索稳定却在写入时损失图片细节。现有AI多模态长期记忆存在显著短板。
19、MemTensor与HONOR联合研究提出MemPrivacy框架
MemPrivacy框架通过在边缘设备用带类型标签的占位符替换隐私信息、云端处理后本地还原,设计PL1-PL4四级隐私分类体系。实验表明在隐私识别准确率上优于通用大模型及专用过滤器,在多个AI记忆系统中将服务质量损失控制在约1.6%。可保护隐私的同时维持AI助手高质量服务。
20、阿里巴巴:Qwen团队提出SlimQwen框架,大模型压缩后内存节省超70%
阿里巴巴Qwen团队联合多所高校提出SlimQwen框架,运用结构化剪枝、知识蒸馏及渐进式压缩等系统性方法,将800亿参数MoE大模型压缩至230亿,内存节省超70%且保持竞争力表现。结果显示该方案在多项知识、代码与数学测试中接近原模型水平,推理吞吐量和部署成本显著改善。建议在大模型压缩实践中采用剪枝初始化、部分保留合并专家、混合蒸馏目标并结合渐进式策略,以实现高效MoE模型轻量化。
21、字节跳动:提出生成精炼网络GRN,开辟视觉生成第三条路线
字节跳动商业化技术团队提出生成精炼网络GRN,作为区别于扩散与自回归模型的第三种视觉生成路线,可在生成过程中边画边改并依据复杂度动态分配计算步数。实测表明,在相同参数量下GRN于图像重建、类别-图像生成、文生图及文生视频等多项任务中显著超越主流扩散与自回归模型,并能高效生成高保真视频。
22、UTD等:提出HAGE记忆检索,用强化学习让Agent记忆从检索变成找路
HAGE将Agent记忆组织为带权多关系图,通过强化学习训练路由器和边特征,使智能体能按问题意图在记忆图中动态找路。在长期对话记忆和多跳问答任务中显著提升证据命中率,消融验证边特征与路由联合优化收益最大。建议未来Agent记忆系统应存事件节点并带丰富元数据。
23、清华大学:提出DECO稀疏MoE架构,20%激活比例匹配密集模型性能
DECO架构在参数总量和训练数据量与密集模型完全相同前提下,仅以20%激活比例即匹配密集模型性能。核心创新包括ReLU路由、可学习专家缩放因子、NormSiLU激活函数和自适应稀疏度正则化。在边缘设备上实现约3倍推理速度提升,适合手机等设备部署。
24、MusubiAI:Mela模型仿人类记忆巩固,突破Transformer上下文限制
Mela模型通过引入分层记忆模块(HMM),在仅用4K训练窗口情况下,可稳定处理32K超长文本。通过低层情节记忆与高层语义记忆模块协同,实现记忆的“遗忘与升华”,在长文本语言建模任务中显著优于标准Transformer。
四、政策导向与行业治理
1、白宫计划建立自愿框架审查AI模型发布前安全
据报道,白宫网络总监办公室主办简报会,向OpenAI、Anthropic、Reflection AI等公司通报计划签署行政令,建立自愿框架要求前沿模型开发者提前告知政府新模型发布计划,最多提前90天向政府共享模型,由政府多部门界定需审查的模型并制定评估流程。AI实验室正推动将共享时间缩短至发布前约14天。内部分歧在于商务部等主张轻监管,而国家安全导向部门要求更严格。该行政令最早于2026年5月签署。
2、美国将AI数据中心纳入基础设施快速审批通道
美国政府宣布将AI数据中心纳入基础设施快速审批通道,以加速其建设和部署,满足日益增长的算力需求。这一政策旨在简化环评、许可等流程,确保美国在AI基础设施竞赛中保持领先。同时该政策也引发了对能源消耗和环境影响的新一轮讨论。此举反映了美国联邦层面对AI作为国家战略资产的认知提升,并将推动数据中心投资进一步加速。
3、中美同意开展AI政府间对话
据相关报道,何立峰副总理会见AMD CEO苏姿丰时指出中美元首达成重要共识。同日外交部确认中美同意开展AI政府间对话,产业深度合作获得政策确定性,中美在AI治理维度开启了新的制度化交流。
4、欧盟委员会与OpenAI就Daybreak模型访问权限进行磋商
OpenAI发布Daybreak网络安全平台,其模型访问权限正在与欧盟委员会进行磋商。该平台计划通过三个阶段提升安全分析效率,并可用于漏洞识别,体现了政府部门对前沿AI网络安全能力的审慎引入与管理。
5、谷歌更新垃圾内容政策,将操纵AI搜索结果行为明确列为违规
谷歌更新垃圾内容政策,将试图操纵其AI搜索结果(包括AI概览与AI搜索模式)的行为明确列为违规,涵盖利用偏向性榜单或“推荐投毒”等手法影响AI回复并催生“生成式引擎优化(GEO)”行业的做法。依据新规,涉事网站将被降权或从搜索结果中彻底移除,直接影响曝光与流量。建议网站运营者避免使用任何意图干扰AI模型回复的策略,以符合更新后的合规要求并维持搜索可见性。
6、算力网:国家公共基础设施统一调度,实现AI按需付费降低成本
算力网是国家将其与水、电等并列建设的公共基础设施,通过统一调度全国数据中心实现按需付费以降低AI使用成本。国家多层级部署及预计超7万亿元投资的推动下,将产生类似高铁、5G的乘数效应,带动全产业链升级。
7、欧洲主权云:仍依赖英特尔/AMD处理器,管理引擎构成潜在后门
欧洲投入超20亿欧元建设“主权云”以减少受美国法律管辖,但云服务仍普遍依赖英特尔和AMD处理器。这些处理器内含管理引擎可独立联网、不受主机安全软件控制,可能受美国法律强制访问,暴露了数字主权时的硬件安全漏洞。
8、arXiv:对AI生成内容推出新规,违规禁用一年并须同行评审
arXiv针对AI生成内容推新规:若发现作者未检查LLM生成结果且存在不可辩驳证据(如幻觉参考文献),将对其实施一年禁用并后续需经同行评审接收方可提交。政策并非禁止LLM,但要求作者承担全部内容责任,可申诉。
五、其他
1、微软GitHub遭黑客入侵,内部代码泄露
微软旗下的代码托管平台GitHub发生安全事件,黑客成功入侵并泄露了部分内部代码库。该事件发生在2026年5月,引发业界对软件开发供应链安全的关注。微软立即展开调查并采取措施加强安全防护。GitHub是全球最大的代码托管平台,此次泄露暴露了集中化平台面临的潜在风险,也促使更多开发者考虑分散化的代码托管策略。
2、初创公司Bolt Graphics推出Zeus GPU,称性能远超英伟达旗舰
初创公司Bolt Graphics推出Zeus GPU,宣称其250W功耗下光线追踪性能是英伟达RTX 5090的五倍,FP64性能达20 TFLOPs,电磁波仿真速度比英伟达B200快300倍。该GPU还具备384GB内存及原生支持400GbE/800GbE以太网特性,面向影视工作室、高性能计算与游戏玩家市场。分析师认为其在工程与专业创作领域更具优势。Zeus基于台积电12nm工艺,已完成流片,预计2027年第四季度投产。
3、谷歌高级副总裁Manyika:AI对就业影响将慢于预期
谷歌高级副总裁Manyika在与Casey Newton的专访中指出AI虽提升自动化程度,但因任务耦合和薄弱环节,大多数职业难以被整体取代。当前完全可自动化职业占比仍低于10%,劳动力市场变化慢于技术演进。建议劳动者拓展跨领域知识与算法设计等综合能力,以应对工作形态变化。
4、NextEra Energy拟670亿美元收购Dominion Energy布局AI数据中心供电
NextEra Energy宣布计划以约670亿美元的全股票交易收购Dominion Energy,旨在打造全球最大的受监管电力公用事业公司。此次合并的核心动因是抢占AI数据中心供电市场,因为Dominion Energy位于弗吉尼亚“数据中心走廊”的核心区域并拥有400万用户。合并后的企业价值预计约4140亿美元,总装机容量达1100亿瓦,新实体将沿用NextEra名称在纽交所交易。此举意在通过整合资源发挥规模优势,提高资本与运营效率,为用户提供可负担且稳定的电力,以应对数据中心等高耗能领域日益增长的电力需求及项目复杂度提升的挑战。
5、Google I/O 前夕密集发布 AI 新品 覆盖健康、智能体与芯片三大领域
在 2025 年 Google I/O 开发者大会开幕前夕,谷歌密集发布了一系列重磅 AI 相关产品与技术,全面推进其 "AI 优先" 战略。
健康领域,谷歌推出新款 Fitbit Air 追踪器及整合 Gemini AI 的 Google Health 应用,后者包含付费订阅 AI 健康教练服务。该组合为即将发布的谷歌智能眼镜提供独特优势,用户可在眼镜端直接获取健身数据摘要和 AI 建议。相比之下,Meta 与 Oakley 合作的智能眼镜虽主打运动场景,但与 Garmin 的健身数据同步尚未深度整合 AI 能力。
AI 能力方面,谷歌发布 Gemini 智能自动化功能及 Gemini Spark 智能体功能。Gemini Spark 将 AI 智能体能力直接集成到应用中,使用户能通过自然语言完成复杂任务,进一步提升了 Gemini 在智能体领域的竞争力。
硬件基础上,谷歌新一代自研 Tensor G6 芯片详细规格曝光。该芯片内部代号包括 Malibu、Dwarf 与 Clementine,采用台积电 N2 2 纳米工艺,配备七核 CPU、双 TPU 架构及 Titan M3 安全芯片,支持 LPDDR5X 内存。设计侧重成本管控,在存储价格上涨背景下仍有望打造优质移动端 SoC,预计 2026 年 8 月随 Pixel 11 系列正式发布。
6、OpenAI将桌面AI编程工具Codex集成至ChatGPT手机应用
OpenAI将旗下桌面AI编程工具Codex集成到ChatGPT手机应用,用户可通过iOS或Android设备远程控制电脑端Codex执行任务,并支持管理对话线程、审批命令、切换模型等操作,文件与权限保留在本地且实时同步至手机。此举是OpenAI为应对Anthropic Claude Code竞争、推进打造桌面“超级应用”战略的重要举措,目前功能已向所有ChatGPT套餐用户包括免费版开放预览。建议用户利用该跨设备协作能力提升编程与任务管理效率。
7、OpenAI为ChatGPT Pro推出个人财务管理新功能
OpenAI面向美国ChatGPT Pro订阅用户(月费100美元)推出个人财务管理工具预览版。该功能通过与Plaid合作,允许用户安全连接逾12,000家金融机构,查看支出、订阅、付款及投资组合等财务数据,并向ChatGPT咨询个人财务问题。用户可在Web及iOS端使用,数据安全可控,可随时删除财务信息。未来计划接入Intuit以提供税务与信贷审批预测功能。该产品距离OpenAI收购个人理财初创公司Hiro团队仅一个月。
8、马斯克诉OpenAI案败诉,陪审团裁定起诉超时效
埃隆·马斯克对OpenAI及其CEO萨姆·奥特曼提起的诉讼被陪审团驳回,裁定起诉时机过迟。马斯克指控OpenAI违背创立时的非营利承诺,挪用原属慈善使命的成果。陪审团一致认定不存在违反慈善信托或不正当得利行为。庭审披露微软对OpenAI投资超130亿美元,OpenAI高管股权估值高达数百亿至上千亿美元。马斯克方表示将就此向第九巡回法庭上诉。同时,OpenAI与马斯克之间尚有其他多起诉讼在进行。
9、华为支持的蜂群智能体JiuwenSwarm开源
openJiuwen社区在华为支持下发布并开源蜂群智能体JiuwenSwarm。基于Coordination Engineering范式,通过Agent Swarm、Swarm Skills、Swarm Skills Hub与自演进机制实现多Agent高效协作、经验沉淀共享及持续进化。平台提供HOTS与HITS人机协作模式。在PinchBench与LOCOMO评测中分别取得94.2%综合得分与85%记忆准确率。
10、腾讯推出AI设计智能体平台Ardot
腾讯上线由云CodeBuddy团队开发的AI设计智能体协作平台Ardot。该平台支持多人实时协作,覆盖UI/UX设计全流程,能以自然语言生成可编辑设计稿并一键转代码,且具备与多种智能体兼容的代码友好特性。该产品瞄准企业级高需求协作场景,结合腾讯高层对AI向Agent范式跃迁的判断,旨在解决产品设计中的重复劳动与协作摩擦。
11、OpenAI:CEO山姆·奥特曼持股Cerebras等企业引发利益冲突质疑
OpenAI扶持的AI芯片企业Cerebras Systems在纳斯达克成功上市,成为今年迄今规模最大的科技IPO。作为早期投资人,OpenAI CEO山姆·奥特曼因持股Cerebras及多家与OpenAI有商业往来的公司,其总持股价值已超20亿美元,引发了关于利益冲突的质疑。市场数据显示投资者愿意为非英伟达路线的AI芯片支付高溢价,这也预示着AI领域的IPO浪潮或将加速到来。
夜雨聆风