最近一周的 AI 设计动态分享,对设计师和游戏团队来说,下一阶段不是单纯比谁出图快,而是比谁能把生成、编辑、一致性、审查和交付串成可靠流程。
截至北京时间 2026-05-20
01|Gemini Omni:视频生成开始进入“可多轮导演”的阶段

事件:
Google 发布 Gemini Omni Flash,可用文本、图像、视频、音频作为输入生成视频,并支持自然语言多轮编辑;同时 Google Flow 加入 Omni、Flow Agent 和自定义 Tools,用于创意规划、批量变体、资产整理和流程自动化。
为什么值得关注:
视频生成不再只是“出一段片”,而是开始靠近导演式工作流:角色一致性、镜头调整、风格迁移、批量修改、资产组织,这些都直接影响游戏宣传片、剧情分镜、技能演出和世界观短片的制作方式。
建议:
设计师可用它做动态 moodboard 和广告视觉探索;游戏设计师可测试剧情分镜、过场动画和技能表现;研发人员要关注 API、资产版本和水印信息;独立游戏作者适合先做 trailer 草案和 Steam 页面动效,不建议直接当最终商用素材。
02|Project Genie 接入 Street View:真实地点生成互动世界

事件:
Google DeepMind 将 Project Genie 与 Street View 结合,用户可以用真实地点作为起点,生成带风格化变化的互动世界。当前仍是实验性质,Street View 能力先支持美国地点,并逐步面向 Google AI Ultra 用户开放。
为什么值得关注:
这对游戏研发很有想象力:真实地点、风格化世界、互动环境三者开始融合。它暂时还不是严肃关卡编辑器,但很适合做城市探索、教育体验、沉浸式原型和氛围验证。
建议:
UX/UI 设计师要先把组件命名、状态和 token 整干净;游戏 UI 设计师可用它快速探索 HUD、背包、结算页、角色面板;研发人员应要求 AI 生成内容遵守组件库;独立开发者可以用它做可点原型,但最后仍要人工检查可用性和信息层级。
03 | Google Pics:图像生成从“重抽”变成“可局部编辑”

事件:
Google 在 Workspace 中推出 Google Pics,基于 Nano Banana 模型,支持对象分割、局部移动/缩放/变换、图片中文字编辑与翻译,并计划集成到 Slides 和 Drive。
为什么值得关注:
它瞄准的是设计师最常见的痛点:图已经接近可用,但小改要重新抽卡。对象级编辑、文字保真和协作画布,会影响视觉提案、社媒图、运营图、商店素材和轻量宣传资产。
建议:
设计师可用它处理日常物料和多语言版本;游戏美术可试做道具、icon、KV 小改和活动图;研发人员应保留原始文件、提示词、版本和来源;独立开发者可用它提速宣发素材,但上线前必须人工检查文字、手部、边缘、版权和品牌一致性。
一句话建议
AI 生成正在从单点工具升级为创作管线。真正的竞争点会变成一致性、可编辑性、设计系统接入、资产溯源和团队治理。
感谢大家的阅读,本篇内容至此。
如果这篇内容对你有帮助,别忘了点赞、收藏和分享。

AI时代的游戏创作交流群
加我微信,申请入群
交流群现已聚集了3600多名游戏同行

- 你的分享,是我分享的动力 -
夜雨聆风