AI情报助手日报04-28
大模型进展
-
GPT-5.5性能强劲,奥特曼发布五大宣言。
GPT-5.5模型在编码、推理等测试中超越Opus 4.7,OpenAI CEO奥特曼发布五大原则,强调AI权力不应集中,财富需广泛分享。 -
DeepSeek V4压轴登场,优化国产算力。
4月AI大模型市场竞争激烈,DeepSeek V4全面支持百万字超长上下文,定价维持业内较低水平,并深度优化国产算力芯片。 -
OpenAI发布GPT Image 2,登顶文生图榜单。
OpenAI发布GPT Image 2,上线12小时即登顶Arena文生图榜单,以241分断层领先,该模型具备原生思考能力,重新定义图像生成赛道规则。 -
OpenAI全新GPT-5.5驱动Codex。
OpenAI全新前沿模型GPT-5.5已在NVIDIA Grace Blackwell系统上运行,并驱动其代理式编码应用Codex,超1万名NVIDIA员工提前体验后称其效果“令人惊叹”。 -
Anthropic商业策略趋近苹果微软。
Anthropic的Claude服务被指通过模型更新、额度限制、切断第三方工具等方式变相涨价,其商业策略旨在弥补高昂的算力亏损。 -
全球AI竞争演变为OpenAI与Anthropic双雄对决。
全球AI竞争已演变为OpenAI和Anthropic的双雄对决,两者均展现指数级跃迁,算力与能源成为决定性因素。
AI Agent 应用
-
谷歌发布AI Agent开发指南。
谷歌发布AI Agent开发指南,介绍六大开放协议及五条架构法则,旨在帮助开发者构建工业级AI应用,通过模块化架构和标准化通信协议提升智能体性能与稳定性。 -
OpenClaw开源自托管AI代理。
OpenClaw是一款开源自托管AI代理,能执行操作、自动完成任务并集成本地应用,文章展示了15个OpenClaw应用案例,涵盖个人效率至团队协作。 -
OpenAI推出企业级workspace agents。
OpenAI推出workspace agents,取代GPTs,旨在将ChatGPT触手伸向企业工作流核心,国内厂商如钉钉、飞书、企业微信已深耕企业AI Agent市场。 -
剪映AI助手实现视频创作Skill化Agent。
剪映AI助手上线,通过自然语言交互重构传统GUI,实现视频创作的“Skill化Agent”,能深度接管专业工作流,让用户动口不动手完成复杂剪辑任务。 -
Anthropic工程师开发AI桌宠硬件。
Anthropic工程师发起开源项目Claude-Desktop-Buddy,其首款AI桌宠硬件采用深圳M5Stack的M5StickC Plus开发板制造,可显示Claude工作状态并进行一键审批。
具身智能
-
深谋科技发布智能带电作业人形机器人。
深谋科技研发的业界首个智能带电作业人形机器人“伏安”即将交付国网电力,专为电力行业中高压变电站和配电室设计,旨在提升运维效率与安全。 -
无界动力获5亿元海外订单。
通用具身智能机器人公司无界动力完成天使++轮融资,累计融资超2亿美元,并与远景科技集团签署超5亿元全球市场订单,用于风光储及AIDC数据中心智能化升级。 -
具身智能产业的“GPT时刻”与“iPhone时刻”。
具身智能产业正从技术突破迈向规模化商业化,物流与工业是主要应用场景。“GPT时刻”解决技术可行性,预计2026-2028年到来。 -
《具身智能安全技术白皮书》揭示安全隐患。
《具身智能安全技术白皮书》揭示,具身智能机器人存在严重安全隐患,专业团队在8小时内攻破市售机器人,可致设备被远程劫持。 -
Manifold AI Worldscape 0.2模型斩获全球第一。
Manifold AI 流形空间研发的 Worldscape 0.2 模型,在具身世界模型权威评测WorldArena榜单中力压谷歌、英伟达等巨头,斩获全球第一。
多模态AI
-
CVPR 2026揭示多模态视觉智能范式重写。
CVPR 2026论文揭示多模态视觉智能正经历范式重写,从单一感知扩展为融合感知、认知与行动的一体化智能形态,视觉被重新定位为服务推理、决策与交互的中介能力。 -
谷歌DeepMind开源多模态TIPSv2模型。
谷歌DeepMind推出TIPSv2多模态大模型,解决密集“图像块”与“文本嵌入”对齐难题,该模型在9项任务和20个数据集上表现优异,已被CVPR 2026接收并全面开源。 -
阿里HappyHorse 1.0开启灰度测试。
阿里AI视频模型HappyHorse-1.0正式开启灰度测试,提供电影级叙事质感与“一句话改视频”功能,其720P视频生成价格低至0.44元/秒。 -
千问HappyHorse 1.0视频生成模型开启灰度测试。
千问HappyHorse 1.0视频生成模型开启灰度测试,提供免费体验,该模型采用150亿参数统一Transformer架构,显著提升视频叙事连贯性、空间感及影视风格复刻能力。
3D AI
-
李飞飞引爆3DGS技术移动端流式传输。
李飞飞宣布3DGS技术可在移动端流式传输,引发业界对3D内容“MP4时刻”的讨论,然而深圳其域创新两年前已推出相关产品。 -
蚂蚁灵光App上线“体验世界模型”功能。
蚂蚁灵光App上线“体验世界模型”功能,成为业界首个可在移动端体验世界模型的智能助手,实现分钟级一致性和实时可交互体验。 -
Meshy AI实现雕塑级3D模型生成。
胡渊鸣创立的Meshy AI,通过其新一代模型Meshy 6,实现了雕塑级3D模型生成,将传统建模成本从两周1000美元降至几分钟1美元。 -
Meshy用户破千万,ARR年翻14倍。
计算机图形学大神胡渊鸣创立的AI 3D公司Meshy,用户数已破千万,ARR年翻14倍,公司与头部3D打印厂商合作,推出创意工坊,打通AI创意到实体交付。
其他
-
谷歌开源TIPSv2模型,覆盖零样本分类。
谷歌开源了TIPSv2视觉语言模型,同时多个AI项目同期发布,涵盖图像文本特征对齐、智能体轨迹诊断、LLM技能编译等前沿领域。 -
DeepSeek V4发布后市场关注度降低。
DeepSeek V4模型在145天等待后发布,性能提升并强调Agent能力,但市场对其技术优势、商业化路径及与国产芯片深度适配的成效产生疑问和争议。 -
Springer Nature直播预告无人系统集群协同。
施普林格·自然将于5月14日举办在线直播,聚焦“无人系统的边界:复杂环境下的集群协同与工程挑战”,探讨无人系统研究进展。 -
STReasoner:首个时空时序推理框架。
研究团队提出STReasoner,这是首个结合时间序列、空间结构和自然语言的推理框架,能识别异常源、追踪影响路径并预测未来发展,计算成本极低。 -
OpenAI与微软修订合作协议。
OpenAI与微软修订合作协议,微软不再独家享有OpenAI授权,也不再向OpenAI支付收入分成,OpenAI可向任何云服务商提供产品,双方合作关系更具灵活性。 -
移远通信推出软硬一体AI解决方案。
移远通信推出软硬一体AI解决方案,旨在解决智能家居行业“AI进家”难题,通过端云协同、多模态感知和Matter协议,帮助厂商实现从被动响应到主动智能的体验质变。 -
苹果新论文揭示Logits泄露隐私信息。
苹果AI研究团队论文揭示,大模型在回答简单问题时,其最终Logits可能泄露用户未提及的隐私信息,对用户隐私和数据安全构成潜在风险。 -
AI算力集中与社会影响。
文章探讨了AI算力集中、智能与权力混淆、科学验证周期长等问题,作者认为AI的进步可能导致普通人被排除在AI利益之外,并质疑AI在科学突破中的作用。 -
英伟达通过软件升级提升GB200性能。
英伟达通过软件升级,将Blackwell架构GB200的MoE模型推理吞吐量提升2.8倍,程序化依赖启动、底层内核优化及全对全通信革新是关键。 -
OpenAI与联发科、高通合作开发手机处理器。
分析师郭明錤爆料,OpenAI正与联发科、高通合作开发手机处理器,由立讯精密独家制造,预计2028年量产,旨在构建AI原生硬件生态。 -
Anthropic和OpenAI监控智能体行为策略。
文章系统梳理Anthropic和OpenAI在智能体行为监控及不当行为缓解上的策略,两家公司均强调从训练到部署全流程监控模型轨迹。 -
阿里通义实验室提出EAPO强化学习框架。
阿里通义实验室提出EAPO强化学习框架,引入“证据奖励”机制,将监督下沉到“找证据”过程,该框架让大模型在长文本推理上反超GPT-OSS和Claude-Sonnet-4。 -
B站首届AI造物大赛《硅碳合战》强调公开创造。
B站首届AI造物大赛《硅碳合战》未采用传统黑客马拉松模式,而是强调Build in Public(公开创造),旨在降低AI创新门槛。 -
华为联合中国科大发布“灵境造物”智能科研工具。
中国科大与华为联合发布“灵境造物”智能科研工具,旨在推动科研模式向“一人造物”的普惠阶段迈进,该工具基于华为智慧科研解决方案。 -
“万相皆可 Skill”快闪赛探索AI影像模型应用。
WaytoAGI与万相举办“万相皆可 Skill”快闪赛,旨在探索AI影像模型落地应用,谭轶骅的《毛孩子的日记站》利用万相2.7为猫生成日记,获一等奖。 -
Google Play发布2026年4月政策更新。
Google Play发布2026年4月政策更新,新增通讯录权限和账号转移政策,新规要求开发者使用最小范围替代方案保护用户隐私。 -
Token经济:智能定价革命。
Token正成为AI经济形态的关键入口,中国AI大模型Token调用量占比全球36%,Token兼具基础设施、流量商品等特征,预示着一种新经济形态的开端。 -
Anthropic将产品迭代周期缩短至1天。
Anthropic将产品迭代周期从6个月缩短至1天,产品经理的价值从“写需求文档”转变为“判断什么值得做”,这要求PM锚定目标、搭建发布机制。 -
中数睿智完成数亿元B轮融资。
“中国版Palantir”中数睿智完成数亿元B轮融资,由清华控金信资本等联合领投,中数睿智在技术路线、产品体系、业务模式上与Palantir高度相似。 -
AI行业面临物理安全威胁。
AI行业面临物理安全威胁,奥特曼住宅遭燃烧弹袭击,黄仁勋出行配备多名保镖,AI高管已从技术领导者转变为社会情绪的靶心。 -
Google Play Games推出Sidekick功能。
Google Play Games推出Sidekick功能,作为游戏内悬浮窗口提升玩家沉浸感,Play管理中心新增预注册设备细分数据和实时反馈,优化用户触达与游戏运营。
夜雨聆风