Hi,我是冬青。
不久前,我在抖音做了一个账号,专门用 AI 帮人修复已故亲人的老照片。一共发了 4 条视频,总播放量突破了 100 万,其中最火的一条,单条就占了 80 万。


刚开始,我以为大家是被这种技术震撼到了。评论区里也确实有很多类似的声音:
这根本不像 AI 做出来的。太真实了。
但后来我慢慢发现——
真正让一个视频被反复观看、转发、留言的,从来都不是技术。而是评论区里,那一张张被网友亲手贴出来的照片。

视频里是一位藏族女孩。她穿着传统的藏族服饰,戴着厚重的蜜蜡和玛瑙,整个人神圣又庄严。原图其实非常模糊,五官只能勉强辨认。

我做的事情很简单:把她的照片修复清晰,让她在镜头里轻轻笑了一下,眨了眨眼,又朝镜头挥了挥手。
但视频发出去之后,评论区开始不断有人贴照片。
爷爷奶奶的,爸爸妈妈的,还有那些已经走了很多年的人的。有些照片已经模糊得快散掉了,有些一看就是几十年前的旧影。

在那个年代,拍照绝不是一件随手而为的小事。很多人这一辈子,可能就只留下了那么几张念想。
那一刻,评论区不再是评论区——
它更像一座临时的属于普通人的纪念馆。
有一条评论,我反反复复看了很多遍:
妈妈走了很多年了,我已经快要忘记她的样子了。
私信也越来越多。很多人会发来很长很长的话,讲他们的故事。亲人已经走了很久,记忆开始褪色,照片也开始发黄。他们问我:能不能帮帮我,让我再看一眼她的样子。

有一个女孩,跟我聊了很长时间。她说她很想把照片发给我,但她是少数民族,按照当地习俗,不能把逝者的照片发给外人做这种处理。
所以她最后还是忍住了。
她说,她只能在脑子里拼命去想象那张脸,一个人哭到天亮。那张照片,至今还留在她的手机里。

我只能安慰她一句:
只要你还记得,他就还在。
那一刻我才意识到——
技术能实现的事和一个人真正需要的宽慰并不是同一件事
如果只是让一张照片动起来,这在技术层面确实已经不难。
但如果我们追求的不是让照片动一下,而是真实地还原一个人
——那它的背后,其实是一整套数字人技术链路。
影视飓风出品的短片《再见亲人》,就把这件事呈现得非常完整。当照片、声音、语料、动作和大模型组合在一起,一个人,确实可以以某种"数字形态"被重新模拟出来。

这个过程,大致分成三层。
第一层:还原他"长什么样"
通过照片和视频资料,重塑一个人的数字外观。现在的技术已经可以基于少量图像,完成面部特征提取、高清修复、三维重建、数字人建模和表情驱动。

简单说,就是先让这个人"看起来像"——脸型、五官、神态、年龄感、身形,甚至穿着,都可以无限逼近。
第二层:还原他"听起来的声音"
如果生前留下过音频或视频,就可以通过声音克隆技术,提取他的音色、语速、咬字方式和语气习惯。这一步解决的是:他"听起来像不像"。

因为很多时候,我们想念一个人,不只是想念他的脸。还有:他喊你名字的方式、他停顿、笑场、叹气的瞬间、他念叨你的那种语气。
第三层:还原他"会怎么回应你"
这是最难的一层。
一个人之所以是他,不只因为脸像、声音像。更重要的是——他说什么、怎么说、为什么这么说。
这就需要整理他生前留下的所有文字资料:微信聊天记录、朋友圈、日记、文章、短信、语音转文字、工作文档,甚至亲友对他的描述。

这些会组成一个人的"个人语料库"。再通过大模型进行长期记忆、人格画像、说话风格学习,去模拟他的表达习惯、价值判断、情绪反应。*
前两层在还原"长什么样、什么声音"。而第三层,才是在尝试还原:他会怎么回应你。
当这一切结合在一起,一个数字人就不再只是一张会动的照片。

它可以实时说话,可以根据上下文回应,可以用接近原本的语气跟你对话。
真正的 AI 复原——
复原的不是一张脸而是复原一个人的真实但又虚拟存在感
因为技术越真实,它带来的安慰感就越强。
与此同时,它可能带来的依赖、混淆和二次伤害,也会变得越强。
更准确地说——它是在用外形、声音、语料和大模型,去模拟一个人留在世上的数字痕迹。
它可以让我们重新看见某些东西。但它永远不能真正把一个人,带回来。
怕太像了,接受不了。
也怕不像,会更难过。
老一辈的人,很多都不太会拍照,更没有随手录视频的习惯。

很多人离开后,家里翻来覆去——最后只剩下一张证件照、一张合影,或者几张模糊的生活照。
而那寥寥几张——就是他们曾经在这个世界上存在过的最后证据。
所以——
趁我们爱的人还在,请多拍一点吧。
不用拍得多专业。不用挑节日,也不用摆姿势。
就拍下他们现在的样子
也许随手记下的这十几秒——
也许在未来的某一天会成为你这辈子最舍不得的东西。
我是冬青,我们下期见。
夜雨聆风