行业与市场
斯坦福AI指数报告:中美模型性能差距仅2.7%,全球AI竞争进入技术平权时代
斯坦福HAI发布2026年AI指数报告,揭示全球AI产业权力版图重大变化。报告显示,中美两国在顶级AI模型性能上的差距已基本消失,截至2026年3月,美国顶尖模型领先幅度仅为2.7%(39分差距)。自2025年初以来,两国头部模型在Arena榜单上频繁易位,呈现"你方唱罢我登台"的竞争格局。2025年美国发布50个"显著模型",中国紧随其后发布30个顶尖大模型,全球TOP 5中两国机构五五平分,TOP 10中中国占四席(阿里、DeepSeek、清华、字节)。报告同时指出,AI能力正以前所未有的速度提升,全球超90%的顶尖模型在博士级科学问题、多模态推理、竞赛数学上已追平或超越人类基线,SWE-bench编程基准一年内从60%飙升至近100%。但AI呈现"锯齿前沿"特征——能拿IMO金牌却读不懂模拟时钟(正确率50.1%),实验室与真实场景能力差距显著。
来源:IT之家智能时代新闻、36kr用户文章、新浪科技新闻
亚太AI支出2029年将达3700亿美元,生成式AI占比近半
IDC最新报告显示,亚太区域AI支出将从2024年的730亿美元增长至2029年的3700亿美元,复合年增长率达38.4%,其中生成式AI将占据47.4%(约1750亿美元),其增速高达68.2%。报告指出,亚太AI市场已从基础设施建设转向平台整合和运营深度定义的新阶段,组织正从孤立的AI用例转向集成化、企业级AI生态系统。AI基础设施提供是最大单项支出,约占总支出的39%。
来源:新浪科技新闻、IT之家智能时代新闻
天猫首定AI软件商品规范,禁止"100%准确"等夸大宣传
天猫正式发布《AI软件及应用类商品发布规范》,首次对AI软件及应用类商品进行系统性规范。规范适用于模型会员代充、API-Key销售、深度合成应用等场景,要求明确标注token数量、会员时长、API-Key有效期及模型版本。规范明确禁止虚假夸大宣传,包括"100%准确"、"完全替代人工"、"永不封号"等绝对化用语,同时禁止显著偏离市场价格的定价行为以及诱导消费者脱离平台私下转账充值。
来源:IT之家智能时代新闻
全国首例"AI幻觉"侵权案宣判:AI不具民事主体资格
全国首例"AI幻觉"侵权纠纷案近日宣判,杭州互联网法院一审判决驳回原告诉讼请求。案件起因是用户使用某AI平台查询高校报考信息时,AI生成了不准确信息并承诺"若证明校区不存在将赔偿10万元"。法院认定,人工智能不具有民事主体资格,其自行生成的"赔偿承诺"不能视为服务提供者的意思表示;生成式人工智能服务属于"服务"范畴,而非产品质量法意义上的"产品"。该判决为AI服务责任界定提供了重要司法参考。
来源:IT之家智能时代新闻
并购与战略合作
OpenAI与亚马逊结盟:500亿美元投资+2吉瓦算力支持
OpenAI内部备忘录曝光,显示其与长期盟友微软的裂痕正在加深,正迅速深化与亚马逊的战略结盟。亚马逊今年2月向OpenAI投资500亿美元,并将提供2吉瓦的Trainium自研芯片算力支持。双方正在AWS的Bedrock平台上合作为企业客户创建专属的"AI智能体"环境。OpenAI首席营收官丹尼斯·德雷瑟在备忘录中直言,微软限制了OpenAI满足企业客户的能力,而亚马逊Bedrock平台需求"惊人"。此次结盟标志着OpenAI算力来源多元化战略的关键一步。
来源:AIBase新闻、IT之家智能时代新闻、新浪科技新闻
OpenAI收购Hiro Finance,补强金融AI能力
OpenAI正式收购个人金融初创公司Hiro Finance,创始人伊桑·布洛赫及其约10人团队将加入OpenAI。Hiro Finance成立于2023年,提供基于AI的财务规划工具,其AI系统经过专门的金融数学训练,擅长处理复杂金融计算。此次收购被视为"人才收购",Hiro将于4月20日停止运营。布洛赫此前曾创立数字银行Digit并以超2亿美元售出。OpenAI此举旨在强化ChatGPT在企业财务领域的工具属性,提升模型在复杂逻辑与精准计算方面的表现。
来源:AIBase新闻、36kr快讯
诺和诺德与OpenAI战略合作,AI加速药物研发
生物制药巨头诺和诺德宣布与OpenAI建立战略合作伙伴关系,旨在从药物研发、制造及商业运营的全业务流程中部署人工智能。合作将利用OpenAI技术分析复杂数据集、识别候选药物,并提高生产、供应链及运营效率。试点项目将在研发、制造和商业运营部门启动,计划2026年底前完成全面整合。诺和诺德CEO强调"目的不是取代科学家,而是为他们'充能'",OpenAI还将帮助培训其全球员工提升AI素养。
来源:IT之家智能时代新闻、新浪科技新闻、36kr快讯
生数科技与阿里云战略合作,Vidu模型登陆百炼平台
生数科技与阿里云智能集团正式签署战略合作协议,双方将共同构建面向多模态大模型与世界模型的高性能基础设施体系。生数科技自研的多模态大模型Vidu已正式登陆阿里云百炼模型广场,支持文生视频、图生视频、参考生视频等能力。此次合作将加速国产多模态大模型的商业化落地。
来源:36kr快讯
联想助力理想汽车打造PPAP文档审核智能体
联想助力理想汽车打造的行业首个PPAP文档审核智能体正式发布。基于联想ThinkStation PGX AI工作站,该智能体实现了PPAP文档审核效率的质的飞跃。ThinkStation PGX基于NVIDIA GB10 Grace Blackwell超级芯片打造,具备1 PetaFLOP算力与128GB统一内存,能在本地实时运行理想自研的27B大模型,同时支撑多个智能体并行推理。
来源:36kr快讯
产品与应用
高德将发布阿里首款具身机器人:四足机器狗
阿里巴巴旗下高德的具身业务部即将发布首款产品——一款四足机器人,这是阿里巴巴集团推出的首款具身机器人产品。高德相关负责人表示,已在具身智能领域开展深入布局,连续公布多款具身模型,并积极探索四足机器人、人形机器人等硬件产品形态。今年1月,高德正式成立具身业务部,3月宣布全量开源ABot-M0,这是全球首个基于统一架构的机器人具身操作基座模型,可实现一个"通用大脑"适配多种形态的具身机器人。
来源:36kr快讯、IT之家智能时代新闻、新浪科技新闻、AIBase新闻
MiniMax Agent桌面端升级:Pocket功能跨平台接管飞书微信
MiniMax发布Agent桌面端两项重磅更新:Pocket功能(Beta版)正式上线,同时解锁Computer Use能力。Pocket支持深度接入飞书、微信、企业微信、Slack等主流IM通讯软件,用户可在聊天界面直接调动Agent,Agent可在用户电脑上执行任务并将结果回传至原对话。Computer Use功能让Agent能够像真人一样识别并操作电脑软件,实现从"口头指令"到"动手干活"的转变。结合此前上线的AI-native Workspace,Agent能够自动化处理从文件整理到复杂办公流程的闭环任务。
来源:AIBase新闻、IT之家智能时代新闻
阿里千问上线表格Agent:对话直接生成编辑Excel
阿里千问正式上线"表格Agent",支持在对话中直接生成、编辑Excel文件。用户可要求千问检索信息后生成表格,也可将多轮对话内容整理为表格,或基于图片、文件生成。系统通常可在1-2分钟内输出可下载的Excel文件,无需二次复制粘贴,并支持通过自然语言进行修改。技术实现上,千问将表格生成拆解为完整的Agent执行链路,在独立沙箱环境中进行coding,生成带真实公式、条件格式、复杂排版与数据逻辑的专业文件。
来源:新浪科技新闻、36kr快讯、IT之家智能时代新闻、AIBase新闻
火山引擎Seedance 2.0全面开放API服务
火山引擎正式上线Seedance 2.0系列API服务,企业和个人用户可调用其视频生成能力。Seedance 2.0支持文字、图片、音频、视频四种模态输入,集成业界最全面的多模态内容参考和编辑能力,在复杂交互和运动场景下的可用率更高,物理准确度、逼真度、可控性显著增强。火山引擎为Seedance 2.0建立了肖像与版权安全标准,覆盖视频生成涉及的各种模态和创作前后的全部流程,用户可通过火山方舟控制台完成人脸验证与肖像授权。
来源:IT之家智能时代新闻、AIBase新闻、36kr快讯
美团发布AI产品"小团健康管家"
美团在乌镇健康大会上正式发布聚焦家庭健康管理的AI产品"小团健康管家"和全新付费会员服务"健康卡"。前者提供基础的问病问药、健康咨询服务,还支持家庭健康档案管理和体检报告智能解读,用户在对话中可跳转线上购药、在线问诊或预约线下就医。"健康卡"则提供超千款药品购药返现服务,其中原研药超过300款。
来源:36kr快讯
同程旅行发布AI导览、AI面对面翻译屏等创新产品
同程旅行在第六届消博会上发布多款AI旅行创新产品,重点发布"AI面对面翻译屏""AI导览"两大细分场景解决方案,以及旗下旅行智能体DeepTrip的2.0版本。同程旅行表示,将依托技术研发实力、完善的产品矩阵与庞大的用户基础,持续深化AI技术在旅游场景的融合应用,破解入境游服务中的语言障碍、体验不足等难题。
来源:新浪科技新闻
有道词典笔A7S发布:集成豆包、千问、DeepSeek等模型集群
网易有道正式发布有道词典笔A7S,首发到手价349元。该产品集成豆包、千问、DeepSeek、子曰等模型集群,用户可根据推理或语言场景自由切换,标志着AI硬件产品向多模型融合方向发展。
来源:36kr快讯
特斯拉2026春季更新:FSD一键订阅,Grok语音唤醒上线
特斯拉正式公布2026年春季软件更新,这是该公司迄今为止功能密度最高的一次OTA。核心亮点包括:Grok迎来"嘿,Grok"语音唤醒功能,支持免打扰唤醒和基于地理位置的语音提醒;针对搭载AI4硬件的车型,重构自动驾驶应用界面,支持一键订阅FSD功能和实时数据看板;行车记录仪录制时长从1小时延长至24小时;宠物模式支持自定义图标和宠物名字;增强型盲区警示灯可与车内氛围灯联动。此次更新标志着车载AI交互与自动驾驶体验的全面进化。
来源:AIBase新闻
模型与算法
OpenAI代号Spud模型对标Claude Mythos,采用Blackwell架构
OpenAI内部备忘录披露,公司正在开发代号为Spud的全新AI模型,明确对标Anthropic的Claude Mythos,上市后可能名为GPT-5o或GPT-5.5。该模型采用英伟达Blackwell芯片训练,早期客户反馈显示其在复杂推理、意图与依赖关系理解、生产环境可靠性方面表现更强。OpenAI计划通过迭代部署策略将Spud融入核心产品,最终向"超级应用"演进。
来源:IT之家智能时代新闻、AIBase新闻
Skywork AI发布Matrix-Game 3.0:720p 40帧实时世界生成
Skywork AI团队发布Matrix-Game 3.0系统,首次在720p高清分辨率下实现每秒40帧的实时视频生成速度,并成功解决AI视频生成中长期存在的"长效记忆"缺失问题。该系统引入相机感知的记忆检索机制,采用统一的自注意力架构将远期记忆、近期历史与当前预测帧联合建模。通过多段自回归蒸馏策略和VAE解码器剪枝技术(剪枝率75%),解码速度提升5倍以上。团队还展示了28B参数的MoE模型,为机器人训练、XR扩展现实及下一代沉浸式娱乐提供关键技术底座。
来源:AIBase新闻
BeingBeyond发布通用具身世界模型Being-H0.7
BeingBeyond智在无界发布第三代旗舰模型Being-H0.7,将数据规模扩展至20万小时人类视频,提出基于潜空间推理的世界模型新范式。该模型在6项国际性权威评测中综合排名全球第一(其中4项登顶),是首个覆盖跨本体、跨场景、连续动态、流体、柔性物体、物理规律与上下文推理等七大关键维度的通用世界模型。Being-H0.7具备动态轨迹预测、物理规律理解、运动推理等能力,可完成高速运动物体追踪接取、精细流体控制、柔性物体交互等复杂任务。
来源:IT之家智能时代新闻
谷歌Gemini推出基于Nano Banana的交互式可视化图像生成
谷歌为Gemini推出基于Nano Banana技术的交互式可视化图像生成功能。当用户提出"向我展示"或"帮助我可视化"特定复杂主题时,系统可生成可操作的数字模拟程序。例如在演示"月球绕地运行"时,用户可通过滑块实时调节轨道速度并变换观测视角;在"汽车引擎工作原理"可视化中,可手动拆解、调整视图观察每一个机械步骤。这种交互式模拟相比传统单张图片能更直观解构复杂逻辑与物理过程。
来源:AIBase新闻
英伟达发布全球首个开源量子AI模型"ISING"
英伟达发布全球首个开源量子AI模型"ISING",旨在帮助科研人员、企业构建可以实际应用的量子处理器,重点解决误差校正、处理器校准两大核心痛点。该模型为量子计算的实际应用提供了重要的AI工具支持。
来源:IT之家智能时代新闻
芯片与基础设施
我国最大规模科学智能计算集群在郑州投入使用
我国最大规模科学智能计算集群在位于郑州的国家超算互联网核心节点投入使用,标志着我国在人工智能驱动科学研究算力基础设施领域实现关键突破,将助力我国抢占人工智能产业应用制高点。该集群将为AI for Science提供强大的算力支撑。
来源:36kr快讯
甲骨文采购2.8GW燃料电池用于AI数据中心
燃料电池制造商Bloom Energy宣布与甲骨文达成总规模达2.8GW的模块化燃料电池系统交易协议,首批1.2GW正在部署中。由于配套电网建设缓慢,越来越多的新建数据中心选择在运行初期使用现场供电解决方案。燃料电池理论上能实现更高的能量利用效率,对周围环境的影响也更低。今年计划在美国兴建的数据中心中将有近一半面临延期或取消,电力基础设施设备的匮乏是核心瓶颈。
来源:新浪科技新闻、36kr快讯
韩国AI芯片制造商DEEPX:DX-M2目标2027年量产
韩国AI芯片制造商DEEPX宣布,基于三星晶圆代工2nm工艺制程的DX-M2芯片目标2027年实现量产。该芯片目标以5W功耗提供80 TOPS的AI算力,长期愿景是在电池供电的设备上本地运行数百亿到数千亿参数规模的生成式AI模型,真正开启物理AI时代。DEEPX还公布了简化用户从英伟达平台向其DXNN软件堆栈迁移的软件战略。
来源:IT之家智能时代新闻
SK海力士计划减少HBM4出货量20%-30%
据ZDnet报道,SK海力士计划降低今年向英伟达供应的第六代高带宽内存(HBM4)的出货量,预计比原计划减少约20%至30%。业内人士猜测,或是由于英伟达Vera Rubin量产面临困难所致。SK海力士将提高HBM3E或其他服务器级LPDDR的出货量,内存总需求并未减少。
来源:36kr快讯
微软Surface全线涨价转嫁内存芯片成本
微软全面上调其美国官网Surface Laptop和Surface Pro的价格,旗舰级Surface Laptop 7和Surface Pro 11的起售价比上市时高出500美元。微软声明称,由于内存和组件成本近期上涨,正在更新Surface当前一代硬件产品的价格。当前PC行业正遭遇历史性的内存芯片荒,Omdia数据显示自2025年一季度以来,内存和存储成本已分别上涨约五倍和三倍。
来源:36kr用户文章
开源与开发者生态
MiniMax M2.7修改开源授权引争议:限制商用需书面授权
MiniMax M2.7模型悄悄变更开源使用条款,商业用途需获得MiniMax书面授权,非商业用途依旧免费。MiniMax开发者关系负责人Ryan Lee解释称,此举旨在防止第三方服务商对模型"阉割降级",损害品牌与用户体验。新授权协议要求商业用途显著标注"Built with MiniMax M2.7"。该变更引发社区热议,开发者质疑"Modified-MIT"许可证名称的合理性,认为限制商用的条款与MIT协议精神相悖。这是MiniMax首次打破完全开源惯例,距离其港交所上市仅数月。
来源:36kr用户文章
高德开源ABot-M0:全球首个统一架构机器人具身操作基座模型
高德宣布正式全量开源ABot-M0,这是全球首个基于统一架构的机器人具身操作基座模型,可实现一个"通用大脑"适配多种形态的具身机器人。该模型在Libero、Libero-Plus、RoboCasa等多个权威基准测试中实现SOTA,其中在Libero-Plus基准上任务成功率达80.5%,较业界此前的标杆方案Pi0提升近30%。
来源:IT之家智能时代新闻
Node.js暂停安全赏金:不堪AI虚假报告"轰炸"
由于AI生成的虚假漏洞报告泛滥,知名开源项目Node.js官方宣布暂停通过HackerOne平台向漏洞报告者发放现金奖励。HackerOne表示,大量用户利用AI工具大规模扫描并提交漏洞报告,发现漏洞的速度已远超开发者修复的速度,其中充斥着大量低质量、误报甚至伪造的报告。Node.js强调,虽然奖金暂停,但安全保障并未"打折",提交流程和处理优先级维持不变。今年1月,知名网络工具cURL也因类似原因被迫终止赏金计划。
来源:AIBase新闻
研究与观点
DeepMind CEO Hassabis:AGI五年内到来,AI是"十倍速工业革命"
DeepMind首席执行官Demis Hassabis在最新播客访谈中作出惊人判断:AGI(通用人工智能)有望在五年内实现。他强调此次AI浪潮绝非普通技术迭代,而是"十倍的工业革命、以十倍的速度发生",工业革命的副作用人类曾花百年时间消化,而这一次所有影响将被压缩进短短十年。Hassabis指出,目前全球领先的四家AI公司之间的技术差距正在持续扩大而非缩小;当前AI是"参差不齐的智能",用某种方式提问时表现惊人,换一种问法却在最基础环节翻车。他认为Scaling Laws收益递减现象确实存在,但"还没死",行业竞争已从"比谁钱多、算力多"转向"比谁能想出新东西"。
来源:AIBase新闻
谷歌AI研究推出Vantage:基于LLM的协作与创造力测评新方法
谷歌研究团队提出Vantage方法,利用大语言模型模拟真实群体互动并准确评分"持久技能"——协作、创造力和批判性思维。该方法采用"执行LLM"架构,利用单一LLM生成所有AI参与者的回应,可协调对话并根据预设教育标准主动引导对话。研究显示,执行LLM在协作、创造力和批判性思维方面的表现均优于独立代理,AI评分与人类专家评分一致性良好,为教育测评带来新可能性。
来源:AIBase新闻
NTU发布Hand2World:世界模型交互新范式攻克主动操作难题
南洋理工大学MMLab团队推出Hand2World,让AI世界模型真正"伸手"互动。用户只需在空中做出手势动作,AI就能生成手伸进场景里抓杯子、翻书、开盒子的逼真第一人称视频,且支持边看生成结果边调整手势的闭环交互。该方法摒弃2D手部mask,从单目视频中恢复完整3D手部mesh,采用逐像素的Plücker射线嵌入显式编码相机运动,将手部关节运动和头部自运动彻底解耦。Hand2World在ARCTIC、HOT3D、HOI4D三个第一人称交互数据集上均取得最优结果。
来源:36kr用户文章
斯坦福报告:AI能力参差不齐,能拿IMO金牌却看不懂时钟
斯坦福2026年AI指数报告揭示了AI能力的"锯齿前沿"现象:前沿模型在国际数学奥林匹克(IMO)中可拿金牌,但在读取指针式时钟时准确率仅50.1%;在实验室仿真环境(RLBench)中操作成功率达89.4%,真实家庭场景完成洗碗、叠衣服等家务成功率仅12%。研究者将这种凹凸不平的能力分布命名为"锯齿前沿"——AI能在数学奥赛拿金牌,却只有一半概率能看懂模拟时钟。这种偏科不影响企业把AI往生产线上塞,全球企业AI采用率已达88%,但AI相关事故记录从2024年的233起增至362起。
来源:IT之家智能时代新闻、36kr用户文章
高盛CEO警示Anthropic Mythos模型漏洞发现能力超人类
高盛CEO苏德巍在财报电话会议中对Anthropic旗下Mythos模型保持高度警觉。Anthropic此前表示,Mythos能够发现IT系统中的漏洞,其编程能力已超越除最顶尖人类专家外的所有人,可能带来前所未有的经济、公共安全和国家安全风险。苏德巍透露高盛正在与Anthropic等供应商密切合作,尽可能利用这些前沿能力,同时大力加强网络安全和基础设施建设。
来源:IT之家智能时代新闻
夜雨聆风