乐于分享
好东西不私藏

AI情报助手日报04-28

AI情报助手日报04-28

大模型进展

  • GPT-5.5性能强劲,奥特曼发布五大宣言。
    GPT-5.5模型在编码、推理等测试中超越Opus 4.7,OpenAI CEO奥特曼发布五大原则,强调AI权力不应集中,财富需广泛分享。
  • DeepSeek V4压轴登场,优化国产算力。
    4月AI大模型市场竞争激烈,DeepSeek V4全面支持百万字超长上下文,定价维持业内较低水平,并深度优化国产算力芯片。
  • OpenAI发布GPT Image 2,登顶文生图榜单。
    OpenAI发布GPT Image 2,上线12小时即登顶Arena文生图榜单,以241分断层领先,该模型具备原生思考能力,重新定义图像生成赛道规则。
  • OpenAI全新GPT-5.5驱动Codex。
    OpenAI全新前沿模型GPT-5.5已在NVIDIA Grace Blackwell系统上运行,并驱动其代理式编码应用Codex,超1万名NVIDIA员工提前体验后称其效果“令人惊叹”。
  • Anthropic商业策略趋近苹果微软。
    Anthropic的Claude服务被指通过模型更新、额度限制、切断第三方工具等方式变相涨价,其商业策略旨在弥补高昂的算力亏损。
  • 全球AI竞争演变为OpenAI与Anthropic双雄对决。
    全球AI竞争已演变为OpenAI和Anthropic的双雄对决,两者均展现指数级跃迁,算力与能源成为决定性因素。

AI Agent 应用

  • 谷歌发布AI Agent开发指南。
    谷歌发布AI Agent开发指南,介绍六大开放协议及五条架构法则,旨在帮助开发者构建工业级AI应用,通过模块化架构和标准化通信协议提升智能体性能与稳定性。
  • OpenClaw开源自托管AI代理。
    OpenClaw是一款开源自托管AI代理,能执行操作、自动完成任务并集成本地应用,文章展示了15个OpenClaw应用案例,涵盖个人效率至团队协作。
  • OpenAI推出企业级workspace agents。
    OpenAI推出workspace agents,取代GPTs,旨在将ChatGPT触手伸向企业工作流核心,国内厂商如钉钉、飞书、企业微信已深耕企业AI Agent市场。
  • 剪映AI助手实现视频创作Skill化Agent。
    剪映AI助手上线,通过自然语言交互重构传统GUI,实现视频创作的“Skill化Agent”,能深度接管专业工作流,让用户动口不动手完成复杂剪辑任务。
  • Anthropic工程师开发AI桌宠硬件。
    Anthropic工程师发起开源项目Claude-Desktop-Buddy,其首款AI桌宠硬件采用深圳M5Stack的M5StickC Plus开发板制造,可显示Claude工作状态并进行一键审批。

具身智能

  • 深谋科技发布智能带电作业人形机器人。
    深谋科技研发的业界首个智能带电作业人形机器人“伏安”即将交付国网电力,专为电力行业中高压变电站和配电室设计,旨在提升运维效率与安全。
  • 无界动力获5亿元海外订单。
    通用具身智能机器人公司无界动力完成天使++轮融资,累计融资超2亿美元,并与远景科技集团签署超5亿元全球市场订单,用于风光储及AIDC数据中心智能化升级。
  • 具身智能产业的“GPT时刻”与“iPhone时刻”。
    具身智能产业正从技术突破迈向规模化商业化,物流与工业是主要应用场景。“GPT时刻”解决技术可行性,预计2026-2028年到来。
  • 《具身智能安全技术白皮书》揭示安全隐患。
    《具身智能安全技术白皮书》揭示,具身智能机器人存在严重安全隐患,专业团队在8小时内攻破市售机器人,可致设备被远程劫持。
  • Manifold AI Worldscape 0.2模型斩获全球第一。
    Manifold AI 流形空间研发的 Worldscape 0.2 模型,在具身世界模型权威评测WorldArena榜单中力压谷歌、英伟达等巨头,斩获全球第一。

多模态AI

  • CVPR 2026揭示多模态视觉智能范式重写。
    CVPR 2026论文揭示多模态视觉智能正经历范式重写,从单一感知扩展为融合感知、认知与行动的一体化智能形态,视觉被重新定位为服务推理、决策与交互的中介能力。
  • 谷歌DeepMind开源多模态TIPSv2模型。
    谷歌DeepMind推出TIPSv2多模态大模型,解决密集“图像块”与“文本嵌入”对齐难题,该模型在9项任务和20个数据集上表现优异,已被CVPR 2026接收并全面开源。
  • 阿里HappyHorse 1.0开启灰度测试。
    阿里AI视频模型HappyHorse-1.0正式开启灰度测试,提供电影级叙事质感与“一句话改视频”功能,其720P视频生成价格低至0.44元/秒。
  • 千问HappyHorse 1.0视频生成模型开启灰度测试。
    千问HappyHorse 1.0视频生成模型开启灰度测试,提供免费体验,该模型采用150亿参数统一Transformer架构,显著提升视频叙事连贯性、空间感及影视风格复刻能力。

3D AI

  • 李飞飞引爆3DGS技术移动端流式传输。
    李飞飞宣布3DGS技术可在移动端流式传输,引发业界对3D内容“MP4时刻”的讨论,然而深圳其域创新两年前已推出相关产品。
  • 蚂蚁灵光App上线“体验世界模型”功能。
    蚂蚁灵光App上线“体验世界模型”功能,成为业界首个可在移动端体验世界模型的智能助手,实现分钟级一致性和实时可交互体验。
  • Meshy AI实现雕塑级3D模型生成。
    胡渊鸣创立的Meshy AI,通过其新一代模型Meshy 6,实现了雕塑级3D模型生成,将传统建模成本从两周1000美元降至几分钟1美元。
  • Meshy用户破千万,ARR年翻14倍。
    计算机图形学大神胡渊鸣创立的AI 3D公司Meshy,用户数已破千万,ARR年翻14倍,公司与头部3D打印厂商合作,推出创意工坊,打通AI创意到实体交付。

其他

  • 谷歌开源TIPSv2模型,覆盖零样本分类。
    谷歌开源了TIPSv2视觉语言模型,同时多个AI项目同期发布,涵盖图像文本特征对齐、智能体轨迹诊断、LLM技能编译等前沿领域。
  • DeepSeek V4发布后市场关注度降低。
    DeepSeek V4模型在145天等待后发布,性能提升并强调Agent能力,但市场对其技术优势、商业化路径及与国产芯片深度适配的成效产生疑问和争议。
  • Springer Nature直播预告无人系统集群协同。
    施普林格·自然将于5月14日举办在线直播,聚焦“无人系统的边界:复杂环境下的集群协同与工程挑战”,探讨无人系统研究进展。
  • STReasoner:首个时空时序推理框架。
    研究团队提出STReasoner,这是首个结合时间序列、空间结构和自然语言的推理框架,能识别异常源、追踪影响路径并预测未来发展,计算成本极低。
  • OpenAI与微软修订合作协议。
    OpenAI与微软修订合作协议,微软不再独家享有OpenAI授权,也不再向OpenAI支付收入分成,OpenAI可向任何云服务商提供产品,双方合作关系更具灵活性。
  • 移远通信推出软硬一体AI解决方案。
    移远通信推出软硬一体AI解决方案,旨在解决智能家居行业“AI进家”难题,通过端云协同、多模态感知和Matter协议,帮助厂商实现从被动响应到主动智能的体验质变。
  • 苹果新论文揭示Logits泄露隐私信息。
    苹果AI研究团队论文揭示,大模型在回答简单问题时,其最终Logits可能泄露用户未提及的隐私信息,对用户隐私和数据安全构成潜在风险。
  • AI算力集中与社会影响。
    文章探讨了AI算力集中、智能与权力混淆、科学验证周期长等问题,作者认为AI的进步可能导致普通人被排除在AI利益之外,并质疑AI在科学突破中的作用。
  • 英伟达通过软件升级提升GB200性能。
    英伟达通过软件升级,将Blackwell架构GB200的MoE模型推理吞吐量提升2.8倍,程序化依赖启动、底层内核优化及全对全通信革新是关键。
  • OpenAI与联发科、高通合作开发手机处理器。
    分析师郭明錤爆料,OpenAI正与联发科、高通合作开发手机处理器,由立讯精密独家制造,预计2028年量产,旨在构建AI原生硬件生态。
  • Anthropic和OpenAI监控智能体行为策略。
    文章系统梳理Anthropic和OpenAI在智能体行为监控及不当行为缓解上的策略,两家公司均强调从训练到部署全流程监控模型轨迹。
  • 阿里通义实验室提出EAPO强化学习框架。
    阿里通义实验室提出EAPO强化学习框架,引入“证据奖励”机制,将监督下沉到“找证据”过程,该框架让大模型在长文本推理上反超GPT-OSS和Claude-Sonnet-4。
  • B站首届AI造物大赛《硅碳合战》强调公开创造。
    B站首届AI造物大赛《硅碳合战》未采用传统黑客马拉松模式,而是强调Build in Public(公开创造),旨在降低AI创新门槛。
  • 华为联合中国科大发布“灵境造物”智能科研工具。
    中国科大与华为联合发布“灵境造物”智能科研工具,旨在推动科研模式向“一人造物”的普惠阶段迈进,该工具基于华为智慧科研解决方案。
  • “万相皆可 Skill”快闪赛探索AI影像模型应用。
    WaytoAGI与万相举办“万相皆可 Skill”快闪赛,旨在探索AI影像模型落地应用,谭轶骅的《毛孩子的日记站》利用万相2.7为猫生成日记,获一等奖。
  • Google Play发布2026年4月政策更新。
    Google Play发布2026年4月政策更新,新增通讯录权限和账号转移政策,新规要求开发者使用最小范围替代方案保护用户隐私。
  • Token经济:智能定价革命。
    Token正成为AI经济形态的关键入口,中国AI大模型Token调用量占比全球36%,Token兼具基础设施、流量商品等特征,预示着一种新经济形态的开端。
  • Anthropic将产品迭代周期缩短至1天。
    Anthropic将产品迭代周期从6个月缩短至1天,产品经理的价值从“写需求文档”转变为“判断什么值得做”,这要求PM锚定目标、搭建发布机制。
  • 中数睿智完成数亿元B轮融资。
    “中国版Palantir”中数睿智完成数亿元B轮融资,由清华控金信资本等联合领投,中数睿智在技术路线、产品体系、业务模式上与Palantir高度相似。
  • AI行业面临物理安全威胁。
    AI行业面临物理安全威胁,奥特曼住宅遭燃烧弹袭击,黄仁勋出行配备多名保镖,AI高管已从技术领导者转变为社会情绪的靶心。
  • Google Play Games推出Sidekick功能。
    Google Play Games推出Sidekick功能,作为游戏内悬浮窗口提升玩家沉浸感,Play管理中心新增预注册设备细分数据和实时反馈,优化用户触达与游戏运营。