AI情报助手日报04-28-夜雨聆风

AI情报助手日报04-28

大模型进展

GPT-5.5性能强劲，奥特曼发布五大宣言。
GPT-5.5模型在编码、推理等测试中超越Opus 4.7，OpenAI CEO奥特曼发布五大原则，强调AI权力不应集中，财富需广泛分享。
DeepSeek V4压轴登场，优化国产算力。
4月AI大模型市场竞争激烈，DeepSeek V4全面支持百万字超长上下文，定价维持业内较低水平，并深度优化国产算力芯片。
OpenAI发布GPT Image 2，登顶文生图榜单。
OpenAI发布GPT Image 2，上线12小时即登顶Arena文生图榜单，以241分断层领先，该模型具备原生思考能力，重新定义图像生成赛道规则。
OpenAI全新GPT-5.5驱动Codex。
OpenAI全新前沿模型GPT-5.5已在NVIDIA Grace Blackwell系统上运行，并驱动其代理式编码应用Codex，超1万名NVIDIA员工提前体验后称其效果“令人惊叹”。
Anthropic商业策略趋近苹果微软。
Anthropic的Claude服务被指通过模型更新、额度限制、切断第三方工具等方式变相涨价，其商业策略旨在弥补高昂的算力亏损。
全球AI竞争演变为OpenAI与Anthropic双雄对决。
全球AI竞争已演变为OpenAI和Anthropic的双雄对决，两者均展现指数级跃迁，算力与能源成为决定性因素。

AI Agent 应用

谷歌发布AI Agent开发指南。
谷歌发布AI Agent开发指南，介绍六大开放协议及五条架构法则，旨在帮助开发者构建工业级AI应用，通过模块化架构和标准化通信协议提升智能体性能与稳定性。
OpenClaw开源自托管AI代理。
OpenClaw是一款开源自托管AI代理，能执行操作、自动完成任务并集成本地应用，文章展示了15个OpenClaw应用案例，涵盖个人效率至团队协作。
OpenAI推出企业级workspace agents。
OpenAI推出workspace agents，取代GPTs，旨在将ChatGPT触手伸向企业工作流核心，国内厂商如钉钉、飞书、企业微信已深耕企业AI Agent市场。
剪映AI助手实现视频创作Skill化Agent。
剪映AI助手上线，通过自然语言交互重构传统GUI，实现视频创作的“Skill化Agent”，能深度接管专业工作流，让用户动口不动手完成复杂剪辑任务。
Anthropic工程师开发AI桌宠硬件。
Anthropic工程师发起开源项目Claude-Desktop-Buddy，其首款AI桌宠硬件采用深圳M5Stack的M5StickC Plus开发板制造，可显示Claude工作状态并进行一键审批。

具身智能

深谋科技发布智能带电作业人形机器人。
深谋科技研发的业界首个智能带电作业人形机器人“伏安”即将交付国网电力，专为电力行业中高压变电站和配电室设计，旨在提升运维效率与安全。
无界动力获5亿元海外订单。
通用具身智能机器人公司无界动力完成天使++轮融资，累计融资超2亿美元，并与远景科技集团签署超5亿元全球市场订单，用于风光储及AIDC数据中心智能化升级。
具身智能产业的“GPT时刻”与“iPhone时刻”。
具身智能产业正从技术突破迈向规模化商业化，物流与工业是主要应用场景。“GPT时刻”解决技术可行性，预计2026-2028年到来。
《具身智能安全技术白皮书》揭示安全隐患。
《具身智能安全技术白皮书》揭示，具身智能机器人存在严重安全隐患，专业团队在8小时内攻破市售机器人，可致设备被远程劫持。
Manifold AI Worldscape 0.2模型斩获全球第一。
Manifold AI 流形空间研发的 Worldscape 0.2 模型，在具身世界模型权威评测WorldArena榜单中力压谷歌、英伟达等巨头，斩获全球第一。

多模态AI

CVPR 2026揭示多模态视觉智能范式重写。
CVPR 2026论文揭示多模态视觉智能正经历范式重写，从单一感知扩展为融合感知、认知与行动的一体化智能形态，视觉被重新定位为服务推理、决策与交互的中介能力。
谷歌DeepMind开源多模态TIPSv2模型。
谷歌DeepMind推出TIPSv2多模态大模型，解决密集“图像块”与“文本嵌入”对齐难题，该模型在9项任务和20个数据集上表现优异，已被CVPR 2026接收并全面开源。
阿里HappyHorse 1.0开启灰度测试。
阿里AI视频模型HappyHorse-1.0正式开启灰度测试，提供电影级叙事质感与“一句话改视频”功能，其720P视频生成价格低至0.44元/秒。
千问HappyHorse 1.0视频生成模型开启灰度测试。
千问HappyHorse 1.0视频生成模型开启灰度测试，提供免费体验，该模型采用150亿参数统一Transformer架构，显著提升视频叙事连贯性、空间感及影视风格复刻能力。

3D AI

李飞飞引爆3DGS技术移动端流式传输。
李飞飞宣布3DGS技术可在移动端流式传输，引发业界对3D内容“MP4时刻”的讨论，然而深圳其域创新两年前已推出相关产品。
蚂蚁灵光App上线“体验世界模型”功能。
蚂蚁灵光App上线“体验世界模型”功能，成为业界首个可在移动端体验世界模型的智能助手，实现分钟级一致性和实时可交互体验。
Meshy AI实现雕塑级3D模型生成。
胡渊鸣创立的Meshy AI，通过其新一代模型Meshy 6，实现了雕塑级3D模型生成，将传统建模成本从两周1000美元降至几分钟1美元。
Meshy用户破千万，ARR年翻14倍。
计算机图形学大神胡渊鸣创立的AI 3D公司Meshy，用户数已破千万，ARR年翻14倍，公司与头部3D打印厂商合作，推出创意工坊，打通AI创意到实体交付。

其他

谷歌开源TIPSv2模型，覆盖零样本分类。
谷歌开源了TIPSv2视觉语言模型，同时多个AI项目同期发布，涵盖图像文本特征对齐、智能体轨迹诊断、LLM技能编译等前沿领域。
DeepSeek V4发布后市场关注度降低。
DeepSeek V4模型在145天等待后发布，性能提升并强调Agent能力，但市场对其技术优势、商业化路径及与国产芯片深度适配的成效产生疑问和争议。
Springer Nature直播预告无人系统集群协同。
施普林格·自然将于5月14日举办在线直播，聚焦“无人系统的边界：复杂环境下的集群协同与工程挑战”，探讨无人系统研究进展。
STReasoner：首个时空时序推理框架。
研究团队提出STReasoner，这是首个结合时间序列、空间结构和自然语言的推理框架，能识别异常源、追踪影响路径并预测未来发展，计算成本极低。
OpenAI与微软修订合作协议。
OpenAI与微软修订合作协议，微软不再独家享有OpenAI授权，也不再向OpenAI支付收入分成，OpenAI可向任何云服务商提供产品，双方合作关系更具灵活性。
移远通信推出软硬一体AI解决方案。
移远通信推出软硬一体AI解决方案，旨在解决智能家居行业“AI进家”难题，通过端云协同、多模态感知和Matter协议，帮助厂商实现从被动响应到主动智能的体验质变。
苹果新论文揭示Logits泄露隐私信息。
苹果AI研究团队论文揭示，大模型在回答简单问题时，其最终Logits可能泄露用户未提及的隐私信息，对用户隐私和数据安全构成潜在风险。
AI算力集中与社会影响。
文章探讨了AI算力集中、智能与权力混淆、科学验证周期长等问题，作者认为AI的进步可能导致普通人被排除在AI利益之外，并质疑AI在科学突破中的作用。
英伟达通过软件升级提升GB200性能。
英伟达通过软件升级，将Blackwell架构GB200的MoE模型推理吞吐量提升2.8倍，程序化依赖启动、底层内核优化及全对全通信革新是关键。
OpenAI与联发科、高通合作开发手机处理器。
分析师郭明錤爆料，OpenAI正与联发科、高通合作开发手机处理器，由立讯精密独家制造，预计2028年量产，旨在构建AI原生硬件生态。
Anthropic和OpenAI监控智能体行为策略。
文章系统梳理Anthropic和OpenAI在智能体行为监控及不当行为缓解上的策略，两家公司均强调从训练到部署全流程监控模型轨迹。
阿里通义实验室提出EAPO强化学习框架。
阿里通义实验室提出EAPO强化学习框架，引入“证据奖励”机制，将监督下沉到“找证据”过程，该框架让大模型在长文本推理上反超GPT-OSS和Claude-Sonnet-4。
B站首届AI造物大赛《硅碳合战》强调公开创造。
B站首届AI造物大赛《硅碳合战》未采用传统黑客马拉松模式，而是强调Build in Public（公开创造），旨在降低AI创新门槛。
华为联合中国科大发布“灵境造物”智能科研工具。
中国科大与华为联合发布“灵境造物”智能科研工具，旨在推动科研模式向“一人造物”的普惠阶段迈进，该工具基于华为智慧科研解决方案。
“万相皆可 Skill”快闪赛探索AI影像模型应用。
WaytoAGI与万相举办“万相皆可 Skill”快闪赛，旨在探索AI影像模型落地应用，谭轶骅的《毛孩子的日记站》利用万相2.7为猫生成日记，获一等奖。
Google Play发布2026年4月政策更新。
Google Play发布2026年4月政策更新，新增通讯录权限和账号转移政策，新规要求开发者使用最小范围替代方案保护用户隐私。
Token经济：智能定价革命。
Token正成为AI经济形态的关键入口，中国AI大模型Token调用量占比全球36%，Token兼具基础设施、流量商品等特征，预示着一种新经济形态的开端。
Anthropic将产品迭代周期缩短至1天。
Anthropic将产品迭代周期从6个月缩短至1天，产品经理的价值从“写需求文档”转变为“判断什么值得做”，这要求PM锚定目标、搭建发布机制。
中数睿智完成数亿元B轮融资。
“中国版Palantir”中数睿智完成数亿元B轮融资，由清华控金信资本等联合领投，中数睿智在技术路线、产品体系、业务模式上与Palantir高度相似。
AI行业面临物理安全威胁。
AI行业面临物理安全威胁，奥特曼住宅遭燃烧弹袭击，黄仁勋出行配备多名保镖，AI高管已从技术领导者转变为社会情绪的靶心。
Google Play Games推出Sidekick功能。
Google Play Games推出Sidekick功能，作为游戏内悬浮窗口提升玩家沉浸感，Play管理中心新增预注册设备细分数据和实时反馈，优化用户触达与游戏运营。