

4月2日,千问AI眼镜发布后首次进行OTA升级,上线首批“AI办事”能力,接入淘宝闪购、支付宝,支持话费充值、扫码骑车、停车缴费、语音点外卖等功能。
在出行场景中,千问AI眼镜可调用支付宝完成单车解锁、停车场缴费,并支持话费充值,实现“说句话充话费”等高频操作;在外卖场景中,依托淘宝闪购打通选品、下单、支付全链路;面对一道习题,可以直接拍照获取解题思路;跨语言沟通时,支持实时翻译,并通过模型能力还原语气与情感表达。
此次OTA覆盖千问AI眼镜G1、夸克AI眼镜G1两款产品,相关更新将于4月2日起陆续推送。据了解,千问AI眼镜S1将于本月推出,后续S1系列也将进行OTA升级。


大厂AI战局升温,转型几乎成为共识。模型在进化,Agent在落地,但成本高、落地难、数据不够,行业还在补课。
而京东在AI上的布局已然聚焦清晰:围绕供应链优势,推进具身智能,让AI真正进入物理世界。此次推出的一体化图像模型——JoyAI-Image-Edit,高度适用于生成电商、具身智能训练图片。
近日,京东开源图像模型JoyAI-Image-Edit,将空间智能纳入图像理解与编辑,让AI开始处理真实世界中的空间关系,让模型真正“理解空间,编辑空间”。
简单解释,这是一个以空间智能为核心的图像生成与编辑模型,让AI真正“看懂”三维空间,从而让生成更合理、编辑更精准。

从公开评测来看,JoyAI-Image-Edit各项指标显著领先,迈进了国际第一梯队:空间理解刷新同量级开源模型SOTA,达到世界一流水平,大部分指标媲美或超越闭源模型 Gemini 2.5 Pro。长文本生成中英文双语领先,图像编辑能力全面覆盖,空间编辑精度甚至超过部分视频世界模型。从公开评测来看,JoyAI-Image-Edit各项指标显著领先,迈进了国际第一梯队:空间理解刷新同量级开源模型SOTA,达到世界一流水平,大部分指标媲美或超越闭源模型 Gemini 2.5 Pro。长文本生成中英文双语领先,图像编辑能力全面覆盖,空间编辑精度甚至超过部分视频世界模型。

4月3日,腾讯云发布Agent Memory服务(TencentDB Agent Memory ,简称Agent Memory ),为 OpenClaw等AI应用补充长期记忆能力,使智能体在跨会话、长任务中持续记录用户偏好与任务进度,减少重复确认。评测显示,接入后整体准确率较原生OpenClaw提升59%。
该服务以插件的形式已无缝集成至腾讯云Lighthouse 、 ClawPro等龙虾产品,支持一键启用。用户也可通过复制配置命令,在自己的“龙虾”中快速激活这项记忆增强能力。
腾讯云披露的PersonaMem评测结果显示,接入Agent Memory后,OpenClaw总体准确率达到76.10%。其中,在用户事实召回等关键指标上,表现由原生不足30%提升至79%以上,显示出记忆稳定性在复杂场景下的提升。

4月3日,美图旗下AI Agent产品RoboNeo宣布接入Seedance2.0,提供“生成即成片”的高效创作体验。RoboNeo视频创作实现三大能力升级,包括连续镜头一键生成能力、声画同步输出能力、素材一致性智能控制能力,保障生成品质更稳定。输入角色设定、分镜图及场景参考后,模型可自动保持光影、构图、风格的前后统一,角色姿态稳定、动作流畅,多人互动、高张力剧情也能保持连贯不“跳戏”。
RoboNeo提供文生视频、图生视频、首尾帧生成、视频参考生成等多元创作能力。用户可根据需求自由组合创作流程,实现更高自由度的视频生成效果。此外,RoboNeo构建Agent驱动的工作流,内置创作方案,用户可直接套用官方提供的模板或预设工作流,RoboNeo会按照标准步骤帮你完成从素材准备到镜头生成、音效匹配的整个流程。
RoboNeo于2025年上线,首月MAU即突破百万,并成功进入多个国家应用商店榜单前10名,累计登顶全球26个国家和地区的应用商店总榜及分类榜。此次升级是美图“模型容器”策略的典型落地,RoboNeo作为影像AI Agent,通过标准化架构整合优质视觉模型能力,将连续叙事、声画同步、角色场景一致性等核心能力封装为可复用工作流,实现从需求理解到自动执行的全链路智能调度,助力AI视频生成从“片段生成”走向“完整成片”。
以上内容由凌美芯整理自智东西等媒体




夜雨聆风