百万人看过我的AI视频后,我却更焦虑了

Hi，我是冬青。

不久前，我在抖音做了一个账号，专门用 AI 帮人修复已故亲人的老照片。一共发了 4 条视频，总播放量突破了 100 万，其中最火的一条，单条就占了 80 万。

刚开始，我以为大家是被这种技术震撼到了。评论区里也确实有很多类似的声音：

这根本不像 AI 做出来的。太真实了。

但后来我慢慢发现——

真正让一个视频被反复观看、转发、留言的，从来都不是技术。

而是评论区里，那一张张被网友亲手贴出来的照片。

视频里是一位藏族女孩。她穿着传统的藏族服饰，戴着厚重的蜜蜡和玛瑙，整个人神圣又庄严。原图其实非常模糊，五官只能勉强辨认。

我做的事情很简单：把她的照片修复清晰，让她在镜头里轻轻笑了一下，眨了眨眼，又朝镜头挥了挥手。

但视频发出去之后，评论区开始不断有人贴照片。

爷爷奶奶的，爸爸妈妈的，还有那些已经走了很多年的人的。有些照片已经模糊得快散掉了，有些一看就是几十年前的旧影。

在那个年代，拍照绝不是一件随手而为的小事。很多人这一辈子，可能就只留下了那么几张念想。

那一刻，评论区不再是评论区——

它更像一座临时的属于普通人的纪念馆。

有一条评论，我反反复复看了很多遍：

妈妈走了很多年了，我已经快要忘记她的样子了。

私信也越来越多。很多人会发来很长很长的话，讲他们的故事。亲人已经走了很久，记忆开始褪色，照片也开始发黄。他们问我：能不能帮帮我，让我再看一眼她的样子。

有一个女孩，跟我聊了很长时间。她说她很想把照片发给我，但她是少数民族，按照当地习俗，不能把逝者的照片发给外人做这种处理。

所以她最后还是忍住了。

她说，她只能在脑子里拼命去想象那张脸，一个人哭到天亮。那张照片，至今还留在她的手机里。

我只能安慰她一句：

只要你还记得，他就还在。

那一刻我才意识到——

技术能实现的事和一个人真正需要的宽慰并不是同一件事

如果只是让一张照片动起来，这在技术层面确实已经不难。

但如果我们追求的不是让照片动一下，而是真实地还原一个人

——那它的背后，其实是一整套数字人技术链路。

影视飓风出品的短片《再见亲人》，就把这件事呈现得非常完整。当照片、声音、语料、动作和大模型组合在一起，一个人，确实可以以某种"数字形态"被重新模拟出来。

这个过程，大致分成三层。

第一层：还原他"长什么样"

通过照片和视频资料，重塑一个人的数字外观。现在的技术已经可以基于少量图像，完成面部特征提取、高清修复、三维重建、数字人建模和表情驱动。

简单说，就是先让这个人"看起来像"——脸型、五官、神态、年龄感、身形，甚至穿着，都可以无限逼近。

第二层：还原他"听起来的声音"

如果生前留下过音频或视频，就可以通过声音克隆技术，提取他的音色、语速、咬字方式和语气习惯。这一步解决的是：他"听起来像不像"。

因为很多时候，我们想念一个人，不只是想念他的脸。还有：他喊你名字的方式、他停顿、笑场、叹气的瞬间、他念叨你的那种语气。

第三层：还原他"会怎么回应你"

这是最难的一层。

一个人之所以是他，不只因为脸像、声音像。更重要的是——他说什么、怎么说、为什么这么说。

这就需要整理他生前留下的所有文字资料：微信聊天记录、朋友圈、日记、文章、短信、语音转文字、工作文档，甚至亲友对他的描述。

这些会组成一个人的"个人语料库"。再通过大模型进行长期记忆、人格画像、说话风格学习，去模拟他的表达习惯、价值判断、情绪反应。*

前两层在还原"长什么样、什么声音"。而第三层，才是在尝试还原：他会怎么回应你。

当这一切结合在一起，一个数字人就不再只是一张会动的照片。

它可以实时说话，可以根据上下文回应，可以用接近原本的语气跟你对话。

真正的 AI 复原——

复原的不是一张脸而是复原一个人的真实但又虚拟存在感

因为技术越真实，它带来的安慰感就越强。

与此同时，它可能带来的依赖、混淆和二次伤害，也会变得越强。

更准确地说——它是在用外形、声音、语料和大模型，去模拟一个人留在世上的数字痕迹。

它可以让我们重新看见某些东西。但它永远不能真正把一个人，带回来。

怕太像了，接受不了。

也怕不像，会更难过。

老一辈的人，很多都不太会拍照，更没有随手录视频的习惯。

很多人离开后，家里翻来覆去——最后只剩下一张证件照、一张合影，或者几张模糊的生活照。

而那寥寥几张——就是他们曾经在这个世界上存在过的最后证据。

所以——

趁我们爱的人还在，请多拍一点吧。

不用拍得多专业。不用挑节日，也不用摆姿势。

就拍下他们现在的样子

也许随手记下的这十几秒——

也许在未来的某一天会成为你这辈子最舍不得的东西。

我是冬青，我们下期见。