


AIGC周报
Weekly AI NewsExpress
数字未来事务所
DIGITAL FUTURE AGENCY
2026.06.06-2026.06.12
本周AI行业前沿速递

PART.01
谷歌Gemma 4量化版发布
手机轻薄本可本地运行
DFA
谷歌正式发布Gemma 4 12B多模态模型,该模型采用无编码器统一架构,支持文本、图像和原生音频输入,仅需16GB显存即可在消费级笔记本电脑本地运行,性能接近26B参数模型。



PART.02
腾讯文档联手WorkBuddy
推出AI原生"人机双写"
DFA
腾讯文档发布行业首创AI原生编辑能力"人机双写",AI从旁挂助手变为"文档里的同事",与用户在同一文件实时协同操作;腾讯文档与WorkBuddy深度融合,原生接入Agent内核并叠加自研编辑引擎与专业Skill,覆盖文档、表格、PPT、智能表全品类,产出可自动归档回写、沉淀为团队上下文。



PART.03
腾讯发布WorkBuddy企业版
提供AI办公统一入口
DFA
腾讯云推出WorkBuddy企业版,构建专家、助理、团队三层AI能力,解决企业AI应用脱节问题。产品整合CodeBuddy、Managed Agents等能力,支持多种部署方式。依托SkillHub生态,已收录超7万个技能,两月下载量突破3000万,联动腾讯多款办公产品形成一体化底座。



PART.04
京东开源
长视频框架JoyAI-Echo
DFA
京东开源JoyAI-Echo,解决长视频角色一致性、声音稳定、生成速度三大难题。跨模态记忆库保角色一致、记忆驱动后训练提速7.5倍、Director Agent支持局部重绘与实时超分;全开源,赋能虚拟动漫/数字人直播等场景。



PART.05
美图设计室推出AI拆分图层
一键智能分层修图
DFA
美图设计室新增免费AI拆分图层工具,3秒即可将图片自动拆分为背景、主体、文字、装饰四大独立图层,无需手动抠图。工具支持手机、电脑双端使用,可导出高清图或透明底文件,兼容Photoshop精修。广泛应用于电商改图、自媒体封面、人像修图、文创制作等场景,大幅简化基础设计流程。


PART.06
谷歌发布Gemini 3.5实时翻译
免费同传支持70语言
DFA
谷歌翻译App推出Gemini 3.5 Live Translate实时翻译功能,翻译延迟仅数秒,可保留说话人语气语调,支持自动语种识别,适配安卓与iOS全平台。该功能兼容各类有线、蓝牙耳机,安卓额外配备听筒模式,使用门槛更低。谷歌Meet同步升级,支持70余种语言、2000余种语言组合,Grab平台已完成接入,相关开发者API也开启公开预览。


FUTURE

PART.07
Meshy发布全球首个
3D创作AI Agent
DFA
胡渊鸣创立的Meshy推出全球首个3D创作AI Agent,多轮对话完成从概念探索到模型导出全流程;打通生成、编辑、风格统一、打印检查与多格式导出,把单点生成工具升级为3D资产生产工作流入口。







夜雨聆风