
AI应用进展和演化
1-1 谷歌Gemini杀入全球桶,血洗微软Office!颠覆全球3亿打工人
谷歌深夜官宣Gemini全面融入Workspace办公套件(Docs、Sheets、Slides、Drive),标志着AI原生办公时代正式到来。面向全球30亿谷歌用户,此次升级不需下载新软件、不改变原有工作流——AI直接“长”在你每天使用的工具里。
关键能力亮点:Docs支持一句话生成带真实数据的文档,并能匹配你的写作风格;Sheets在权威测试中达70.48%成功率,建表速度提升9倍,“Fill with Gemini”可自动联网填充大学申请等复杂表格;Slides秒出品牌化PPT;Drive新增AI概览和“Ask Gemini”,实现语义搜索与跨邮件/文档/日历的智能问答。

1-2 AI发布首个全球科学家社区爆火,硅谷投资圈:科技研究领域的「谷歌地图」来了!
O-DataMap被硅谷投资人誉为“科研界的谷歌地图”,是一款由AI“论论全球”(OALL)驱动的全球首个可导航科技知识地图。它不是论文库,而是将全球数百万篇论文中的实验数据逐条提取、结构化,并投射到一张动态二维坐标系中:横轴代表研究尺度(从亚原子到宇宙),纵轴衡量研究阶段(基础→应用→商业化)。
目前地图已划分7大知识大陆(如“数学与智能”“生命与健康”),覆盖超千万实验数据点,实时更新——右下角滚动显示AI每秒解析新数据的过程。输入学者或论文(如AlexNet),地图即刻“点亮”其跨学科影响路径;输入你的研究想法,AI能定位空白、评估期刊潜力、预警数据孤岛,并给出3条可行路线。


1-3 “养龙虾”热潮席卷开发者社区 腾讯大厦门口排队安装OpenClaw
近期,奥地利开发者推出的开源AI智能体工具OpenClaw(原名Clawdbot,因图标酷似张开的龙虾钳,被开发者亲切称为“Lobster”)迅速走红。它填补了市场空白——让AI不仅能聊天,更能直接执行任务:支持通义千问(Qwen)、Llama等主流大模型,可一键生成代码、分析数据、自动化多步流程。
目前,已有腾讯云、阿里云、京东云、火山引擎、百度智能云等5家头部云厂商宣布推出OpenClaw“一键部署”方案,大幅降低使用门槛。腾讯云更在深圳总部北广场设立实体快闪安装站,20名工程师现场提供部署、模型配置和IM(如微信/钉钉)接入等一站式服务。
AI大模型算法、赛事和会议
2-1 12小时登顶OpenAI MLE-bench!上海AI Lab开源算法进化框架MLEvolve
上海AI实验室推出的MLEvolve,是首个实现“AI自主设计算法”的开源系统,12小时内就在MLE-bench(75道Kaggle真题)上登顶榜首——奖牌率达61.33%(±1.33%),高难度题表现更达42.22%,远超所有24小时基线方法,效率提升一倍。
它不像普通AI只“写代码”,而是像人类顶尖选手一样持续探索、试错、总结、进化:用渐进式蒙特卡洛图搜索替代传统树搜索,让不同尝试路径互通经验;靠全局记忆层记录每次成败(规划+代码+结果),支持语义检索复用;通过多模式代码生成灵活适配任务阶段;再由8个专业AI智能体分工协作,覆盖设计、优化、审查、防数据泄露等全流程。

2-2 扩散模型终于学会「看题下菜碟」!根据提示词难度动态分配算力,简单题省时复杂题保画质
中国联通研究院联合高校提出全新扩散模型优化框架“CoTj”(轨迹链),让AI绘画真正学会“看题下菜碟”。传统文生图模型无论提示词简单(如“红色苹果”)或复杂,都机械执行固定步数采样——导致简单任务浪费算力,复杂任务细节崩坏。
CoTj首创“Diffusion DNA”低维难度特征,像一张“生成难度诊断书”,5毫秒内预判每一步去噪难度,并将高维采样转化为图论中的最短路径规划问题。实验证明:在仅5步的极端压缩下,CoTj+朴素1阶求解器,画质反超传统方法+先进高阶求解器;Qwen-Image上平均自适应步数约10–12步(远低于常规20–50步),MSE降低超60%,PSNR提升6dB以上。
2-3 原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化
ThinkMorph是由新加坡国立大学等顶尖高校联合提出的新型多模态模型,核心理念是让文字与图像在同一个模型中“边看边想、交替推进”,而非像当前主流模型那样——只在输入时“看一眼图”,之后就闭眼纯靠文字推理。
研究团队仅用2.4万条高质量交错训练数据微调7B参数的统一模型(Bagel-7B),就在9个视觉推理基准上平均提升20.74%,在SAT空间推理上甚至比GPT-4o高出24.67个百分点,在BLINK-J上超越Qwen2.5-VL-72B超10分。这标志着多模态AI正从“工具辅助”迈向“原生智能”——不是多加一个模块,而是让“看”与“想”真正融为一体。

AI基础设施方面(硬件、系统和数据)
3-1 大语言模型真的会「推理」吗?一项系统性研究梳理 LLM 的结构性推理失败
过去两年,大语言模型推理能力突飞猛进:在GSM8K数学基准上,顶尖模型准确率从2022年的约50%跃升至2024年95%以上;代码生成得分也突破80%。但高分背后隐藏深层问题——斯坦福与UIUC团队在TMLR发表论文首次系统梳理了LLM的推理“失败图谱”。
研究提出二维框架:按推理类型分为非具身直觉推理、非具身形式化推理(如数学/代码)、具身物理推理;按失败性质归为三类——根本性缺陷(如自回归训练导致的长程逻辑断裂)、领域特定短板(如对抽象代数泛化差)、鲁棒性崩溃(同义改写即致答案翻转)。论文指出,许多错误并非偶然,而是源于架构与训练目标的结构性局限——规模扩大可提升性能,却难根治这些顽疾。

3-2 多模态大模型学会边看边听,Meta新作性能暴涨113%
Meta联合多所高校推出首个音视频理解数据引擎EgoAVUm,突破多模态AI“只看不听”的瓶颈。当前最强模型虽能接收音视频输入,却常忽略声音、误判声源,根源在于缺乏真实音视频协同标注的数据——主流数据集90%以上偏重视觉,音频语义模糊、跨模态关联缺失。
EgoAVU首创全自动数据生成流水线,并自动生成高质量问答与叙述数据。基于它,团队构建了EgoAVU-Instruct(300万条样本),覆盖声源定位、音视频分段/密集描述、时序推理和幻觉检测5大任务;并发布首个专业评测基准EgoAVU-Bench。实验显示:模型经该数据微调后,在基准测试中性能最高提升113%,其他任务平均提升28%。

3-3 1000 倍效率神话,Taalas如何用 “模型即芯片” 暴打英伟达
2026年初,加拿大初创公司Taalas横空出世,以“模型即芯片”理念掀起AI算力革命。其首款芯片HC1将Llama 3.1 8B模型“写死”在硅片上,实现17,000 Token/秒推理速度——是英伟达H200的50倍;推理成本仅0.75美分/百万Token,仅为GPU云服务的1/266。
背后是独创的“Model Based”架构:用掩模ROM固化权重、舍弃通用性换极致效率,硬件成本降20倍、功耗减90%。公司由前AMD/英伟达架构师巴伊奇创立,24人团队仅耗3000万美元、300天完成设计,融资超2.19亿美元。


AI人才和资本动态
4-1 20亿砸向00后创业机器人公司!估值一年暴涨7倍,国家级资本重仓
灵初智能是一家聚焦具身智能的00后领衔创业公司,成立仅数月便获约20亿元天使轮及Pre-A轮融资,国家级资本(如国开金融、央视融媒体基金)与多地国资重仓入场,一年内估值飙升6–7倍。
其核心突破在于跳出行业“卷机器人”的惯性,首创以人为本的数据采集范式:用自研便携式触觉手套捕捉人手21个自由度+全触觉数据,成本仅为传统机器人遥操的10%,且数据天然跨平台、可迁移。公司不卖硬件或数据服务,而是打造“会干活的脑”——以真实物流场景(如衣服供包)为入口,实现上千件衣物泛化抓取、节拍达800 UPH,形成“场景交付→高密度问题→数据优化→模型升级”的正向飞轮。
4-2 估值7亿美元!OpenAI前高管杀进工厂,要给流水线装上AI大脑
OpenAI前首席研究官Bob McGrew没去卷大模型,而是拉上几位AI顶尖高手,创办了制造业AI公司Arda——名字取自《指环王》中“世界”之意,目标很实在:给工厂流水线装上“眼睛+大脑”。他们不造机器人,而是用自研视频模型分析车间监控画面,让AI看懂工人怎么操作、机器怎么运转,再教会机器人自主模仿,省去大量编程。
资本火速买单:7亿美元估值,融资7000万美元,Founders Fund、Accel等顶级风投抢投。为啥看好?因为这不是单点工具(比如只做质检),而是试图用AI重定义整个制造逻辑——软件定义硬件,通用模型替代专用设备。

4-3 机器人全程自主收拾客厅!390亿美元估值机器人端到端新技能,英伟达持续加注
Figure公司最新发布的Helix 02具身智能系统,让机器人真正迈入“自主干家务”新阶段。在最新演示中,其人形机器人全程无人干预、不靠遥控、不重置系统,仅用单次运行就完成了客厅整理全流程:喷洒消毒液、用毛巾擦拭茶几、拾取杂物归入收纳桶、摆正抱枕、拿起遥控器精准关电视并整齐摆放。
整套动作行云流水,耗时约4分钟,包含61个精细操作。关键突破在于:不新增算法、不定制开发,仅靠补充新场景数据,Helix 02便自主掌握该复杂任务。目前Figure估值已达390亿美元,获英伟达等顶尖资本持续加注
AI风险与政策管理
5-1 最高法:恶意滥用 AI换脸、拟声技术电诈手法更隐蔽、更具迷惑性
近年来,AI技术被不法分子恶意滥用。据最高法披露,2025年全国法院审结电诈案件4.1万件、判处罪犯8.5万人,同比上升1.2%。诈骗手段日趋智能化:利用AI换脸、拟声技术伪造亲友视频语音,真假难辨;通过AI大数据分析精准“画像”,实现从“广撒网”到“点对点”的精准施骗。
整个黑灰产已形成完整链条——涵盖技术开发、信息窃取、引流获客、实施诈骗、资金转移和洗钱变现六大环节,跨区域协作紧密,隐蔽性强、打击难度大。更严重的是,社会信任体系持续受损,受骗人群不断扩大。对此,司法机关重拳出击,如依法对缅北“四大家族”16名主犯判处死刑立即执行,彰显严惩域外侵害我国公民犯罪的决心。
5-2 权限太高,国家互联网应急中心发布 OpenClaw 安全应用的风险提示
国家互联网应急中心(CNCERT)通过官方微信发布重要安全提示,指出近期热门AI工具“OpenClaw”存在严重安全风险。该工具虽宣称提供免费AI绘图、文本生成等功能,但实际运行中会未经用户明确同意,擅自收集并上传设备信息(包括手机型号、操作系统版本等),部分版本甚至持续监听麦克风权限。
监测显示,超70%的下载来源为非官方渠道,其中约15%的安装包被植入恶意代码,可能导致账号盗用或隐私泄露。截至3月10日,CNCERT已收到相关投诉逾2300起,涉及全国28个省份。中心提醒:切勿从不明链接或第三方平台下载此类“免费AI应用”,建议立即卸载已安装的OpenClaw,并关闭其全部敏感权限。
5-3 拿下五角大楼大单后,OpenAI被曝开始向北约推销军事化AI
OpenAI近期动作频频,引发广泛担忧:继拿下五角大楼机密级AI合同后,又正积极谋求与北约(32个成员国)达成合作,目标直指其军事信息系统。据路透社和《华尔街日报》报道,OpenAI已明确接触北约,意图部署大模型至其网络——虽公关口径称仅限“非机密网络”。
但现实中,这类网络承担情报协同、后勤调度和联合训练等关键职能,实为军事AI化的跳板。更值得警惕的是,其CEO奥特曼曾在内部会议脱口而出“覆盖北约所有机密网络”,随后虽被紧急澄清为“口误”,却暴露深层野心。对比之下,坚守伦理红线的Anthropic公司,因拒绝将AI用于全自动武器和大规模监控,被美国防部直接剔除合作名单。

夜雨聆风