国知局专利复审无效典型案例⑦:AI“捏脸”也有专利?从虚拟数字人首案看模型训练阶段的创造性保护

在“万物皆可AI”的时代，我们早已习惯让人工智能根据一段文字生成图片，或是让照片里的人随着音频张嘴说话。但在专利法的世界里，这类“AI+应用”的技术方案长期面临一个尴尬：是不是只要套用了一个已知的神经网络模型，剩下来的就都是“常规技术手段”了？

国家知识产权局发布的“2025年度专利复审无效典型案例”之案例七，直接回应了这个问题。这就是国内虚拟数字人领域专利无效请求首案——“基于音频生成动态图像的方法、装置、设备及存储介质”发明专利权无效案。

案件基本面：让照片“活”过来的专利之战

涉案专利：ZL202410022841.6，名称为“基于音频生成动态图像的方法、装置、设备及存储介质”，专利权人为南京硅基智能科技有限公司。

无效请求人：深圳市趣推科技有限公司。

技术场景：虚拟数字人（如口播视频生成）。该技术能让用户上传一张静态人物图片和一段音频，AI会自动生成该人物随音频变化面部表情和口型的动态视频。

审理结果：国家知识产权局作出第584244号决定，维持专利权有效。

本案的争议焦点高度集中：在判断涉及人工智能的专利创造性时，模型训练阶段的特定方法，能否构成与现有技术的“实质区别”？

核心焦点：AI专利的“三步法”不能再“偷懒”

在专利审查的“创造性三步法”中，通常需要找到权利要求与最接近现有技术之间的“区别特征”，然后判断该区别是否是显而易见的。

在过往很多AI专利无效案件中，请求人往往主张：“你只不过是把通用的神经网络模型拿过来，用在图像生成这个已知场景里，模型训练本身都是常规算法，没任何创造性。” 如果按这种逻辑，绝大多数“AI+垂直场景”的专利都会被轻易无效。

但本案中国知局的裁判思路，为AI专利的创造性评判增加了关键的“新维度”：

AI方案需拆分阶段看待

涉及人工智能应用的技术方案，通常包含模型设计、模型训练、模型应用三个阶段。不能一锅炖，必须站位本领域技术人员，从神经网络模型的处理目的、处理对象、处理结果、结果使用等方面，准确判断权利要求中的模型究竟处在哪个阶段。

模型训练方法本身可构成立法区别

如果权利要求与最接近现有技术的区别恰恰在于采用了不同的模型训练方法，那么需要进一步判断：

现有技术整体上是否给出了“改进该模型训练方法”的技术启示？
这种不同的训练方法是否带来了模型输出结果更精确（如表情更自然、唇形更同步）或模型训练成本更低等有益的技术效果？

结论

如果现有技术没有给出改进启示，且特定训练方法带来了不可预期的技术效果，那么该权利要求具备创造性，不能被简单归为“常规算法的简单应用”。

在本案中，涉案专利权利要求既包含了基于参考图像对生成网络模型进行调整（模型训练/微调阶段），也包含了利用调整后的模型对待处理图像进行驱动输出动态图像（模型应用阶段）。国知局认定，其特定的模型调整（训练）手段并非现有技术所启示，且使得生成的动态图像（如人脸表情驱动）更加精准，因此具备创造性。

为什么这个案例典型？——为“AI+”专利正名

随着AIGC和虚拟数字人的爆发，大量创新集中在“如何将AI模型更好地适配到具体产业和场景”上。本案的典型意义在于，国知局明确了“人工智能+”细分领域专利的审查标尺：

打破“通用算法偏见”

不能因为底层神经网络是已知的，就自动认为它在特定场景下的训练方式、应用方式是显而易见的。AI模型在特定数据对象、特定输出目标下的微调（Fine-tuning）与训练策略，往往凝聚了实质性的研发贡献。

训练阶段与应用阶段并重

过去很多审查或无效决定更关注“模型应用”（推理）时的创新，而本案明确：模型训练阶段的改进同样可承载创造性。只要这种训练方法的改变带来了具体的、更好的技术效果（更准、更快、更省），它就应当受到专利法的保护。

场景特殊性纳入考量

传统“三步法”容易在AI面前“失灵”，因为AI算法的通用性容易让人忽略其在特定场景（如人脸表情驱动、唇形同步）下的非显而易见性。本案要求审查员综合考量应用场景、模型训练方法、处理结果等多因素，避免把AI专利简单等同于“通用算法+已知计算机执行”的堆叠。

给企业及AI从业者的实务启示

专利申请：训练方法要“写细”、效果要“证细”

如果你研发了一款AI+行业的应用（如AI绘画、AI换脸、AI医疗影像），不要只笼统写“采用神经网络模型进行处理”。务必在说明书和权利要求中，把模型的训练过程、参数调整方式、特征提取对象（即本案中的“目标头部动作特征和目标表情系数特征”的确定方式）写清楚；同时，提供实验数据或具体用例，证明你的训练方法如何让输出结果更精准/成本更低。

无效挑战：别只盯“应用”，要挖“训练”

如果你想无效掉竞争对手的AI专利，不能只停留在“这个场景大家都知道，那个模型是通用的”。你需要具体比对：对方的模型训练阶段是否真的被现有技术（如公开的论文、开源代码）完整披露？对方宣称的“更好效果”是否有数据支撑？如果对方的训练步骤其实已被公开，这才是撬动创造性的支点。

AI创新的护城河在“适配”，而不只在“底层”

对于大多数中国企业而言，颠覆Transformer或Diffusion底层架构很难，但将AI模型高效、低成本、高精度地适配到千行百业，本身就是极高价值的创新。案例七传递了一个积极信号：专利法认这个账。

结语

人工智能的专利保护，不能陷入“算法固有化”的窠臼。案例七告诉我们：在AI应用方案里，模型怎么学（训练）、学了以后怎么用（应用）、用在具体场景里好在哪（效果），三者环环相扣；只有把这三环的技术贡献说清、定准，才能让“AI+”专利从一触即碎的泡沫，变成扛得住无效、挡得住侵权的真壁垒。