乐于分享
好东西不私藏

AI情报助手日报04-21

AI情报助手日报04-21

具身智能进展

  • FluxVLA:全栈端到端VLA工程平台。
    FluxVLA正式发布,旨在通过统一配置与模块解耦,降低具身智能研发的工程门槛,同时还包括流式VLA模型和AI记忆框架MIA等新项目。
  • DexWorldModel斩获榜首。
    跨维智能的DexWorldModel在具身世界模型榜单RoboTwin上斩获榜首,平均成功率达94%,其核心在于将世界模型的考场从视频生成转向机器人任务执行。
  • 自变量机器人完成近20亿元B轮融资。
    自变量机器人于三月底至四月初完成近20亿元B轮融资,小米战投和红杉中国领投,该公司是国内唯一同时获字节、美团、阿里、小米投资的具身智能企业。
  • 牛建伟提出具身智能“大模型派”新路线。
    地平线前高管牛建伟认为VLA是弯路,主张通过万亿参数空间智能大模型做“大脑”,结合VA小模型执行,实现机器人自主学习与进化。
  • 智元发布四大机器人新品。
    智元发布四大机器人新品、六大AI模型和七大解决方案,宣布具身智能进入“部署态”元年,其人形机器人已实现量产,推动规模化落地。
  • 苏度科技具身机器人Sudo R1发布。
    苏度科技发布具身机器人Sudo R1,在无真机数据、纯仿真训练下,实现98%首次抓取成功率,打破行业对Sim2Real路径的质疑。
  • AniGen:单图生成可动画3D资产。
    VAST与香港大学联合发布AniGen,提出S^3 Fields统一表示,可从单张图片直接生成带骨架与蒙皮权重的可动画3D资产,推动AIGC在动画、游戏、仿真等领域应用。

人形机器人赛事

  • 荣耀“闪电”机器人半马夺冠。
    北京亦庄人形机器人半马赛中,荣耀“闪电”机器人以50分26秒夺冠,打破人类世界纪录,其背后是人形机器人行业资本狂欢,但需警惕资本泡沫。
  • 人形机器人超越人类半马纪录。
    2026北京亦庄人形机器人半程马拉松赛落幕,荣耀“闪电”以50分26秒夺冠,超越人类半马世界纪录,标志着人形机器人从“高级遥控玩具”向自主智能转变。
  • 荣耀机器人半马夺冠引热议。
    在亦庄人形机器人半程马拉松中,手机厂商荣耀的自研机器人“闪电”以50分26秒的成绩夺冠,刷新历史最好成绩并包揽前六名,引发网友热议。
  • 机器人半马赛事规则升级。
    2026北京亦庄半程马拉松首次实现机器人与人类同场竞技,荣耀“闪电”机器人夺冠,赛事规则升级,引入自主导航和精细化换电机制,推动人形机器人技术快速发展。

大模型技术突破

  • 大模型潜在空间系统综述发布。
    新加坡国立大学、复旦大学等发布大模型潜在空间系统综述,提出大模型设计正从人类可读的显式符号空间转向机器原生的连续潜在空间。
  • PersonaVLM实现长期个性化记忆。
    南京大学与字节跳动团队提出PersonaVLM框架,通过记忆、推理与对齐三大能力,实现多模态大模型的长期个性化记忆,并发布新评测基准Persona-MME。
  • QuatRoPE突破3D空间推理瓶颈。
    北大联合南科大团队提出QuatRoPE,显著改善大语言模型3D空间推理中物体关系编码痛点,该方法以四元数旋转为基础,高效捕捉物体间相对空间关联。
  • OpenMythos开源Claude Mythos架构。
    22岁天才Kye Gomez开源OpenMythos项目,复现了Claude Mythos的核心架构“循环深度Transformer”,该架构不堆参数,通过循环思考实现推理深度。
  • DataFlex登顶HuggingFace月榜。
    北大等团队联合推出DataFlex,一个基于LLaMA-Factory的动态训练框架,通过智能化数据调度,提升大模型性能与训练效率,并已登顶HuggingFace月榜。

AI Agent 应用

  • Google DeepMind推出Gemma 4。
    Google DeepMind推出Gemma 4,重塑端侧AI可能性,支持多步规划、自主行动、离线代码生成及音视频处理,并通过AICore和Google AI Edge开放体验。
  • OpenAI开发Codex驱动数据智能体。
    OpenAI开发出由Codex驱动的数据智能体,通过六层上下文架构,将数据查询从天数级缩短至分钟级,该智能体能自主思考、推理并自我进化。
  • Kimi K2.6发布并开源。
    月之暗面发布并开源Kimi K2.6模型,全面提升代码、长程任务执行和Agent集群能力,在多项基准测试中表现领先,支持300个子Agent并行协作。
  • 蚂蚁灵光推出「灵光圈」社区产品。
    蚂蚁灵光推出「灵光圈」社区产品,并升级闪应用核心功能,旨在将AI Coding Agent交到普通人手中,通过“Wish Coding”范式实现“想到即得到”。
  • ThinkingAI发布企业级AI Agent平台。
    ThinkingAI在硅谷发布企业级AI Agent平台Agentic Engine,并与MiniMax达成战略合作,其核心竞争力在于将十年行业方法论编码为Skill,解决Agent落地企业业务的“Know-how”难题。
  • Anthropic更新Claude Opus 4.7提示词。
    Claude Opus 4.7系统提示词更新,Anthropic针对模型过往“坏毛病”进行大改,新规则强调尊重用户意愿、主动解决问题,提升了用户体验和模型效率。
  • AI Agent Skills推荐。
    文章推荐了20个实用的AI Agent Skills,涵盖安装、查找、内容创作、代码审查等多个领域,能帮助用户提升工作效率,实现自动化操作。
  • AiScientist实现长程记忆。
    中国人民大学团队推出AiScientist系统,旨在解决长程机器学习研究工程的持续性难题,通过File-as-Bus机制,实现23小时、74轮实验的长程记忆。

大模型商业化

  • 世界模型赛道迈向商业化。
    阿里云、腾讯相继发布世界模型,群核科技上市,标志世界模型赛道正从技术探索迈向商业化临界点,但其商业化仍面临多重挑战。
  • DeepSeek寻求首次外部融资。
    外媒报道称,DeepSeek正寻求首次外部融资,估值或超100亿美元。文章拆解了五家国产大模型企业的战略重心与商业化路径。
  • 国产大模型集体转向卖Token。
    国内大模型公司集体转向卖Token和订阅服务,因C端市场难盈利、融资环境变化及海外成功案例,但国内市场存在多重挑战。
  • Anthropic CFO一年内扭亏为盈。
    Anthropic首席财务官Krishna Rao在一年内将公司毛利率从负94%提升至正40%,年化收入从不足10亿美元增至90亿美元,并为IPO做准备。
  • Sora因成本问题关停。
    Sora因算力成本与商业回报严重倒挂而关停,其核心负责人也已离职。中国AI视频赛道却呈现截然不同的沸腾景象,巨头加速布局,探索商业化路径。

AI 产业动态

  • 英特尔大规模应用AI技术。
    英特尔在半导体先进制造中大规模应用AI技术,将AI融入缺陷检测、良品预测等环节,以端到端视角推动AI部署,支撑晶圆厂持续运行。
  • IBM助力赛力斯打造视觉检测平台。
    赛力斯携手IBM,基于IBM Maximo Visual Inspection打造“通用AI视觉检测平台”,赋能技术人员自主落地AI场景,实现AI应用规模化。
  • 商汤医疗再获超5亿元融资。
    商汤医疗于年初完成超5亿元战略融资,估值突破10亿美元,正式迈入独角兽行列,公司正推进全球医疗世界模型赛道最大融资。
  • AI发展引发人类角色担忧。
    文章指出,AI正以惊人速度发展,在执行任务、自我进化、组织协作及社交等多个层面实现自主化,人类在AI世界中的位置正从中心滑向边缘。
  • 本体论、知识图谱与大模型融合研讨会。
    OpenKG与柯基数据联合举办“本体论、知识图谱与大模型融合技术研讨会”,探讨了动态本体、知识工程在大模型中的应用。
  • 中科院提出晶圆级芯片方案。
    中科院计算所发表Ouroboros晶圆级芯片方案,通过SRAM存算一体设计,彻底消除数据搬运,实现15万tokens/s大模型推理速度。
  • 新烛时代将AI应用于可控核聚变。
    新烛时代CTO汪跃表示,公司已完成6000万元天使轮融资,致力于将AI应用于可控核聚变领域,开发聚变装置的“AI操作系统”。
  • 马斯克高调宣称Grok 5将是AGI。
    马斯克高调宣称Grok 5将是AGI,并公布了激进的Grok模型路线图:5月将连发1T和1.5T参数模型,终极目标Grok 5正以6万亿参数规模训练。
  • MiniMax布局AI Agent生态。
    MiniMax通过深度优化M2.7模型,并推出MaxHermes、MaxClaw产品,卡位两大AI Agent生态入口,实现模型与Agent框架的协同进化。
  • ChatGPT Pro用户发现模型升级。
    ChatGPT Pro用户发现模型速度和视觉理解能力显著提升,OpenAI正悄然进行模型升级,代号“Spud”的GPT-5.5也已完成预训练。
  • 阿里发布Fun-ASR1.5语音识别大模型。
    阿里发布Fun-ASR1.5语音识别大模型,可识别30种语言及七大中文方言体系,在多语言和方言识别准确率上超越字节、腾讯等竞品。
  • Vercel遭遇安全事件。
    开发Next.js的Vercel公司遭遇安全事件,因员工使用第三方AI工具Context.ai被攻破,导致内部系统遭未授权访问,黑客在暗网叫卖Vercel数据。
  • Anthropic封禁Belo公司账号。
    Anthropic公司无预警封禁金融科技公司Belo的60多个Claude账号,导致其业务瞬间瘫痪,揭示了过度依赖单一AI供应商的巨大风险。
  • 白宫计划部署Anthropic的AI模型。
    白宫计划向多个联邦机构部署Anthropic的AI模型Mythos的“修改版”,以应对网络安全挑战,尽管此前五角大楼禁用Claude。

其他

  • 华为Pura 90系列成本上涨。
    华为今日发布Pura 90系列手机等新品,余承东透露Pura 90系列因内存等供应链涨价,成本上涨1000-1500元,定价压力大。
  • 苹果WWDC 26海报暗示Siri新界面。
    苹果WWDC 26海报暗示Siri新界面;华为乾崑智驾累计里程破百亿;华人女数学家斩获“数学奥斯卡”;OpenAI三高管离职。
  • 阿里发布Qwen3.6-Max预览版。
    阿里今日发布千问系列性能最强的大模型Qwen3.6-Max-Preview,该预览版在智能体编程、世界知识和指令遵循方面均有提升。
  • Figma被Claude Design跨维打击。
    文章揭示AI时代“硅基复利”的残酷三层模型,设计巨头Figma被Anthropic的Claude Design跨维打击,预示着大模型厂商正向下吞噬应用层。
  • 剑桥发布长期个性化记忆基准ATM-Bench。
    剑桥大学发布ATM-Bench,评估AI个人助理在面对多年真实生活数据时能否“记住你”,测试结果显示专用记忆系统和通用智能体表现均不佳。