前沿创投站 | 谷歌Gemini杀入Office全球桶、OpenAI前高管杀进工厂估值7亿美元、灵初智能获20亿元融资

AI应用进展和演化

1-1 谷歌Gemini杀入全球桶，血洗微软Office！颠覆全球3亿打工人

谷歌深夜官宣Gemini全面融入Workspace办公套件（Docs、Sheets、Slides、Drive），标志着AI原生办公时代正式到来。面向全球30亿谷歌用户，此次升级不需下载新软件、不改变原有工作流——AI直接“长”在你每天使用的工具里。

关键能力亮点：Docs支持一句话生成带真实数据的文档，并能匹配你的写作风格；Sheets在权威测试中达70.48%成功率，建表速度提升9倍，“Fill with Gemini”可自动联网填充大学申请等复杂表格；Slides秒出品牌化PPT；Drive新增AI概览和“Ask Gemini”，实现语义搜索与跨邮件/文档/日历的智能问答。

1-2 AI发布首个全球科学家社区爆火，硅谷投资圈：科技研究领域的「谷歌地图」来了！

O-DataMap被硅谷投资人誉为“科研界的谷歌地图”，是一款由AI“论论全球”（OALL）驱动的全球首个可导航科技知识地图。它不是论文库，而是将全球数百万篇论文中的实验数据逐条提取、结构化，并投射到一张动态二维坐标系中：横轴代表研究尺度（从亚原子到宇宙），纵轴衡量研究阶段（基础→应用→商业化）。

目前地图已划分7大知识大陆（如“数学与智能”“生命与健康”），覆盖超千万实验数据点，实时更新——右下角滚动显示AI每秒解析新数据的过程。输入学者或论文（如AlexNet），地图即刻“点亮”其跨学科影响路径；输入你的研究想法，AI能定位空白、评估期刊潜力、预警数据孤岛，并给出3条可行路线。

1-3 “养龙虾”热潮席卷开发者社区腾讯大厦门口排队安装OpenClaw

近期，奥地利开发者推出的开源AI智能体工具OpenClaw（原名Clawdbot，因图标酷似张开的龙虾钳，被开发者亲切称为“Lobster”）迅速走红。它填补了市场空白——让AI不仅能聊天，更能直接执行任务：支持通义千问（Qwen）、Llama等主流大模型，可一键生成代码、分析数据、自动化多步流程。

目前，已有腾讯云、阿里云、京东云、火山引擎、百度智能云等5家头部云厂商宣布推出OpenClaw“一键部署”方案，大幅降低使用门槛。腾讯云更在深圳总部北广场设立实体快闪安装站，20名工程师现场提供部署、模型配置和IM（如微信/钉钉）接入等一站式服务。

AI大模型算法、赛事和会议

2-1 12小时登顶OpenAI MLE-bench！上海AI Lab开源算法进化框架MLEvolve

上海AI实验室推出的MLEvolve，是首个实现“AI自主设计算法”的开源系统，12小时内就在MLE-bench（75道Kaggle真题）上登顶榜首——奖牌率达61.33%（±1.33%），高难度题表现更达42.22%，远超所有24小时基线方法，效率提升一倍。

它不像普通AI只“写代码”，而是像人类顶尖选手一样持续探索、试错、总结、进化：用渐进式蒙特卡洛图搜索替代传统树搜索，让不同尝试路径互通经验；靠全局记忆层记录每次成败（规划+代码+结果），支持语义检索复用；通过多模式代码生成灵活适配任务阶段；再由8个专业AI智能体分工协作，覆盖设计、优化、审查、防数据泄露等全流程。

2-2 扩散模型终于学会「看题下菜碟」！根据提示词难度动态分配算力，简单题省时复杂题保画质

中国联通研究院联合高校提出全新扩散模型优化框架“CoTj”（轨迹链），让AI绘画真正学会“看题下菜碟”。传统文生图模型无论提示词简单（如“红色苹果”）或复杂，都机械执行固定步数采样——导致简单任务浪费算力，复杂任务细节崩坏。

CoTj首创“Diffusion DNA”低维难度特征，像一张“生成难度诊断书”，5毫秒内预判每一步去噪难度，并将高维采样转化为图论中的最短路径规划问题。实验证明：在仅5步的极端压缩下，CoTj+朴素1阶求解器，画质反超传统方法+先进高阶求解器；Qwen-Image上平均自适应步数约10–12步（远低于常规20–50步），MSE降低超60%，PSNR提升6dB以上。

2-3 原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

ThinkMorph是由新加坡国立大学等顶尖高校联合提出的新型多模态模型，核心理念是让文字与图像在同一个模型中“边看边想、交替推进”，而非像当前主流模型那样——只在输入时“看一眼图”，之后就闭眼纯靠文字推理。

研究团队仅用2.4万条高质量交错训练数据微调7B参数的统一模型（Bagel-7B），就在9个视觉推理基准上平均提升20.74%，在SAT空间推理上甚至比GPT-4o高出24.67个百分点，在BLINK-J上超越Qwen2.5-VL-72B超10分。这标志着多模态AI正从“工具辅助”迈向“原生智能”——不是多加一个模块，而是让“看”与“想”真正融为一体。

AI基础设施方面（硬件、系统和数据）

3-1 大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

过去两年，大语言模型推理能力突飞猛进：在GSM8K数学基准上，顶尖模型准确率从2022年的约50%跃升至2024年95%以上；代码生成得分也突破80%。但高分背后隐藏深层问题——斯坦福与UIUC团队在TMLR发表论文首次系统梳理了LLM的推理“失败图谱”。

研究提出二维框架：按推理类型分为非具身直觉推理、非具身形式化推理（如数学/代码）、具身物理推理；按失败性质归为三类——根本性缺陷（如自回归训练导致的长程逻辑断裂）、领域特定短板（如对抽象代数泛化差）、鲁棒性崩溃（同义改写即致答案翻转）。论文指出，许多错误并非偶然，而是源于架构与训练目标的结构性局限——规模扩大可提升性能，却难根治这些顽疾。

3-2 多模态大模型学会边看边听，Meta新作性能暴涨113%

Meta联合多所高校推出首个音视频理解数据引擎EgoAVUm，突破多模态AI“只看不听”的瓶颈。当前最强模型虽能接收音视频输入，却常忽略声音、误判声源，根源在于缺乏真实音视频协同标注的数据——主流数据集90%以上偏重视觉，音频语义模糊、跨模态关联缺失。

EgoAVU首创全自动数据生成流水线，并自动生成高质量问答与叙述数据。基于它，团队构建了EgoAVU-Instruct（300万条样本），覆盖声源定位、音视频分段/密集描述、时序推理和幻觉检测5大任务；并发布首个专业评测基准EgoAVU-Bench。实验显示：模型经该数据微调后，在基准测试中性能最高提升113%，其他任务平均提升28%。

3-3 1000 倍效率神话，Taalas如何用 “模型即芯片” 暴打英伟达

2026年初，加拿大初创公司Taalas横空出世，以“模型即芯片”理念掀起AI算力革命。其首款芯片HC1将Llama 3.1 8B模型“写死”在硅片上，实现17,000 Token/秒推理速度——是英伟达H200的50倍；推理成本仅0.75美分/百万Token，仅为GPU云服务的1/266。

背后是独创的“Model Based”架构：用掩模ROM固化权重、舍弃通用性换极致效率，硬件成本降20倍、功耗减90%。公司由前AMD/英伟达架构师巴伊奇创立，24人团队仅耗3000万美元、300天完成设计，融资超2.19亿美元。

AI人才和资本动态

4-1 20亿砸向00后创业机器人公司！估值一年暴涨7倍，国家级资本重仓

灵初智能是一家聚焦具身智能的00后领衔创业公司，成立仅数月便获约20亿元天使轮及Pre-A轮融资，国家级资本（如国开金融、央视融媒体基金）与多地国资重仓入场，一年内估值飙升6–7倍。

其核心突破在于跳出行业“卷机器人”的惯性，首创以人为本的数据采集范式：用自研便携式触觉手套捕捉人手21个自由度+全触觉数据，成本仅为传统机器人遥操的10%，且数据天然跨平台、可迁移。公司不卖硬件或数据服务，而是打造“会干活的脑”——以真实物流场景（如衣服供包）为入口，实现上千件衣物泛化抓取、节拍达800 UPH，形成“场景交付→高密度问题→数据优化→模型升级”的正向飞轮。

4-2 估值7亿美元！OpenAI前高管杀进工厂，要给流水线装上AI大脑

OpenAI前首席研究官Bob McGrew没去卷大模型，而是拉上几位AI顶尖高手，创办了制造业AI公司Arda——名字取自《指环王》中“世界”之意，目标很实在：给工厂流水线装上“眼睛+大脑”。他们不造机器人，而是用自研视频模型分析车间监控画面，让AI看懂工人怎么操作、机器怎么运转，再教会机器人自主模仿，省去大量编程。

资本火速买单：7亿美元估值，融资7000万美元，Founders Fund、Accel等顶级风投抢投。为啥看好？因为这不是单点工具（比如只做质检），而是试图用AI重定义整个制造逻辑——软件定义硬件，通用模型替代专用设备。

4-3 机器人全程自主收拾客厅！390亿美元估值机器人端到端新技能，英伟达持续加注

Figure公司最新发布的Helix 02具身智能系统，让机器人真正迈入“自主干家务”新阶段。在最新演示中，其人形机器人全程无人干预、不靠遥控、不重置系统，仅用单次运行就完成了客厅整理全流程：喷洒消毒液、用毛巾擦拭茶几、拾取杂物归入收纳桶、摆正抱枕、拿起遥控器精准关电视并整齐摆放。

整套动作行云流水，耗时约4分钟，包含61个精细操作。关键突破在于：不新增算法、不定制开发，仅靠补充新场景数据，Helix 02便自主掌握该复杂任务。目前Figure估值已达390亿美元，获英伟达等顶尖资本持续加注

AI风险与政策管理

5-1 最高法：恶意滥用 AI换脸、拟声技术电诈手法更隐蔽、更具迷惑性

近年来，AI技术被不法分子恶意滥用。据最高法披露，2025年全国法院审结电诈案件4.1万件、判处罪犯8.5万人，同比上升1.2%。诈骗手段日趋智能化：利用AI换脸、拟声技术伪造亲友视频语音，真假难辨；通过AI大数据分析精准“画像”，实现从“广撒网”到“点对点”的精准施骗。

整个黑灰产已形成完整链条——涵盖技术开发、信息窃取、引流获客、实施诈骗、资金转移和洗钱变现六大环节，跨区域协作紧密，隐蔽性强、打击难度大。更严重的是，社会信任体系持续受损，受骗人群不断扩大。对此，司法机关重拳出击，如依法对缅北“四大家族”16名主犯判处死刑立即执行，彰显严惩域外侵害我国公民犯罪的决心。

5-2 权限太高，国家互联网应急中心发布 OpenClaw 安全应用的风险提示

国家互联网应急中心（CNCERT）通过官方微信发布重要安全提示，指出近期热门AI工具“OpenClaw”存在严重安全风险。该工具虽宣称提供免费AI绘图、文本生成等功能，但实际运行中会未经用户明确同意，擅自收集并上传设备信息（包括手机型号、操作系统版本等），部分版本甚至持续监听麦克风权限。

监测显示，超70%的下载来源为非官方渠道，其中约15%的安装包被植入恶意代码，可能导致账号盗用或隐私泄露。截至3月10日，CNCERT已收到相关投诉逾2300起，涉及全国28个省份。中心提醒：切勿从不明链接或第三方平台下载此类“免费AI应用”，建议立即卸载已安装的OpenClaw，并关闭其全部敏感权限。

5-3 拿下五角大楼大单后，OpenAI被曝开始向北约推销军事化AI

OpenAI近期动作频频，引发广泛担忧：继拿下五角大楼机密级AI合同后，又正积极谋求与北约（32个成员国）达成合作，目标直指其军事信息系统。据路透社和《华尔街日报》报道，OpenAI已明确接触北约，意图部署大模型至其网络——虽公关口径称仅限“非机密网络”。

但现实中，这类网络承担情报协同、后勤调度和联合训练等关键职能，实为军事AI化的跳板。更值得警惕的是，其CEO奥特曼曾在内部会议脱口而出“覆盖北约所有机密网络”，随后虽被紧急澄清为“口误”，却暴露深层野心。对比之下，坚守伦理红线的Anthropic公司，因拒绝将AI用于全自动武器和大规模监控，被美国防部直接剔除合作名单。