AI观察周报:从“生成素材”走向“生成工作流”

最近一周的 AI 设计动态分享，对设计师和游戏团队来说，下一阶段不是单纯比谁出图快，而是比谁能把生成、编辑、一致性、审查和交付串成可靠流程。

截至北京时间 2026-05-20

01｜Gemini Omni：视频生成开始进入“可多轮导演”的阶段

事件：

Google 发布 Gemini Omni Flash，可用文本、图像、视频、音频作为输入生成视频，并支持自然语言多轮编辑；同时 Google Flow 加入 Omni、Flow Agent 和自定义 Tools，用于创意规划、批量变体、资产整理和流程自动化。

为什么值得关注：

视频生成不再只是“出一段片”，而是开始靠近导演式工作流：角色一致性、镜头调整、风格迁移、批量修改、资产组织，这些都直接影响游戏宣传片、剧情分镜、技能演出和世界观短片的制作方式。

建议：

设计师可用它做动态 moodboard 和广告视觉探索；游戏设计师可测试剧情分镜、过场动画和技能表现；研发人员要关注 API、资产版本和水印信息；独立游戏作者适合先做 trailer 草案和 Steam 页面动效，不建议直接当最终商用素材。

02｜Project Genie 接入 Street View：真实地点生成互动世界

事件：

Google DeepMind 将 Project Genie 与 Street View 结合，用户可以用真实地点作为起点，生成带风格化变化的互动世界。当前仍是实验性质，Street View 能力先支持美国地点，并逐步面向 Google AI Ultra 用户开放。

为什么值得关注：

这对游戏研发很有想象力：真实地点、风格化世界、互动环境三者开始融合。它暂时还不是严肃关卡编辑器，但很适合做城市探索、教育体验、沉浸式原型和氛围验证。

建议：

UX/UI 设计师要先把组件命名、状态和 token 整干净；游戏 UI 设计师可用它快速探索 HUD、背包、结算页、角色面板；研发人员应要求 AI 生成内容遵守组件库；独立开发者可以用它做可点原型，但最后仍要人工检查可用性和信息层级。

03 | Google Pics：图像生成从“重抽”变成“可局部编辑”

事件：

Google 在 Workspace 中推出 Google Pics，基于 Nano Banana 模型，支持对象分割、局部移动/缩放/变换、图片中文字编辑与翻译，并计划集成到 Slides 和 Drive。

为什么值得关注：

它瞄准的是设计师最常见的痛点：图已经接近可用，但小改要重新抽卡。对象级编辑、文字保真和协作画布，会影响视觉提案、社媒图、运营图、商店素材和轻量宣传资产。

建议：

设计师可用它处理日常物料和多语言版本；游戏美术可试做道具、icon、KV 小改和活动图；研发人员应保留原始文件、提示词、版本和来源；独立开发者可用它提速宣发素材，但上线前必须人工检查文字、手部、边缘、版权和品牌一致性。

一句话建议

AI 生成正在从单点工具升级为创作管线。真正的竞争点会变成一致性、可编辑性、设计系统接入、资产溯源和团队治理。

感谢大家的阅读，本篇内容至此。

如果这篇内容对你有帮助，别忘了点赞、收藏和分享。

AI时代的游戏创作交流群

加我微信，申请入群

交流群现已聚集了3600多名游戏同行

- 你的分享，是我分享的动力 -