当前时间: 1970-01-01 08:00:00
分类:办公文件
评论(0)
砸了几百亿的AI虚拟人,为何在直播间沦为笑话?打开抖音,你很容易刷到一类直播间:画面里是一个长相精致、声音甜美、永远不知疲倦的虚拟主播,有人带货、有人陪聊、有人唱歌、有人讲知识,号称零工资、零休息、零情绪、全年无休。资本吹得天花乱坠:这是直播行业的终极形态,是真人主播的替代品,是普通人也能躺赚的未来。资本市场更是疯狂,做虚拟人技术的公司估值一路飙升,从大厂到小工作室,全都一窝蜂冲了进来。这几天抖音热榜上,AI虚拟人直播大规模翻车成了绝对顶流:答非所问、逻辑混乱、表情僵硬、脏话乱飙、甚至对着观众胡言乱语,大量直播间被举报、被限流、被平台强制下播。曾经被吹成“颠覆行业”的AI虚拟人,如今成了网友集体围观的大型尴尬现场。更讽刺的是:明明技术越来越强,模型越来越大,算力越来越足,可AI虚拟人,却越来越不像“人”了。2023年,第一个能实时互动的AI主播问世,瞬间引爆全网。大家惊叹于科技的进步,觉得未来已来,直播行业要变天了。无数公司砸钱进场,硬件厂商、算法团队、内容平台、MCN机构,全都把虚拟人当成下一个流量金矿。抖音、快手、视频号纷纷开放虚拟人直播权限,鼓励机构入局,甚至给出流量扶持。真人主播太贵、太累、太容易翻车,还会辞职、会罢工、会塌房。AI虚拟人完美解决所有问题:成本低、可控、听话、永不疲惫。只要把话术喂给模型,把形象捏好,就能一天24小时不间断开播,躺着赚流量、赚佣金、赚打赏。AI虚拟人直播翻成了什么样子?
虚拟人微笑着回答:“今天天气真好,适合出门散步。”虚拟人开始背诵提前写好的广告词,从头到尾念一遍,完全无视问题。一场直播下来,观众满屏问号,主播像个听不懂人话的机器人——没错,它就是机器人,但连最基本的交互都做不到。很多虚拟人长得非常精致,大眼睛高鼻梁,皮肤完美无瑕,可一说话就破功。嘴巴动了,声音慢半拍;声音停了,嘴巴还在一张一合。情绪更是诡异:讲到悲伤的事,它在微笑;说到开心的话题,它面无表情;被网友调侃,它眼神呆滞,像在发呆。人类看久了会产生强烈的“恐怖谷效应”:明明像人,却处处透着诡异和不适,只想赶紧划走。因为AI是学习全网数据而来,一旦没有做好严格的过滤与对齐,就会说出各种离谱内容。平台对此零容忍,只要出现一次,直播间直接封禁,账号扣分,严重者直接清空。很多小工作室花了几千几万做的虚拟人,开播半小时就被永久封停,血本无归。同样的商品、同样的场景、同样的流量,真人主播能卖10万,AI虚拟人可能只卖几百块。用户不愿意为一个冷冰冰的虚拟形象买单,没有信任、没有情绪、没有感染力,连最基本的说服力都没有。大量做虚拟人带货的机构,开播一个月,赚的钱还不够电费和算力费,最后只能默默停播,把模型丢在一边吃灰。曾经号称“替代真人”的AI主播,如今变成了直播行业的笑话。为什么技术越强,AI虚拟人越难用?
按道理说,这两年大模型飞速迭代,从GPT-4到Claude,再到国内一系列闭源开源模型,语言能力、理解能力、逻辑能力都有了质的飞跃。问题根本不在“模型不够强”,而在场景错配、逻辑错位、商业急功近利。第一个致命问题:直播需要的是“情绪”,而AI最缺的就是情绪。因为有情绪起伏,有喜怒哀乐,有临场反应,有共情能力。用户下单,很多时候不是因为产品多好,而是因为信任主播、喜欢主播、被主播的情绪感染。它所有的“开心”“感谢”“撒娇”“愤怒”,都是程序设定好的标签,是算法拟合出来的表情,是文字转语音的声调调整。它无法真正理解观众的语气,无法感知直播间的氛围,更无法做出自然的临场反应。这不是一个“人”在跟我聊天,这是一段程序在执行任务。第二个问题:实时互动要求极低延迟,而大模型天然做不到极致流畅。直播是强实时场景,观众发一句弹幕,最好在1秒内得到回应。但大模型的工作流程是:接收语音→转文字→送入模型推理→生成文字→转语音→驱动形象表情。每一步都需要时间,尤其在云端推理的模式下,网络波动、服务器拥挤、模型负载过高,都会导致明显延迟。结果就是:观众已经聊下一个话题了,虚拟人才刚回复上一句。有人说:那用本地推理、用端侧模型、用更高配的显卡不就行了?一张高端显卡几千上万,一台主机几万,再加上系统优化、驱动调试、专人维护,成本直接逼近甚至超过一个真人主播的工资。第三个问题:行业太浮躁,所有人都想赚快钱,没人愿意打磨细节。几百块一套形象,几千块一套系统,号称“一键开播”“傻瓜式操作”。很多小老板、小工作室,根本不懂技术,不懂AI,不懂直播,买一套工具就匆匆上场。没有做内容对齐,没有做话术训练,没有做风险过滤,没有做表情优化,甚至连基础的问答库都没填完。为了抢占市场,快速推出产品,把还在测试阶段的系统直接商用,把未完善的模型直接对外开放。产品逻辑没跑通,用户体验没验证,就忙着宣传、忙着招商、忙着割加盟商的韭菜。比谁上线快,比谁噱头足,比谁故事讲得好,唯独不比谁的虚拟人更像人、更好用、更能创造价值。第四个问题:平台规则收紧,AI直播的生存空间被不断压缩。要求虚拟人明显标注“AI虚拟形象”,禁止伪装真人;以前还能靠机器刷互动、堆流量混日子,现在平台一限流,瞬间原形毕露。没有真实内容,没有真实互动,没有真实价值,AI虚拟人直播间,连被人看到的机会都没有。三年前的美梦,为什么今天彻底破碎?
回到2023年,AI虚拟人刚出现时,整个行业都在描绘一个极度美好的未来:未来人人都有一个AI分身,代替自己直播、工作、社交虚拟偶像、虚拟主播、虚拟店员,全面接管线下线上服务场景大家默认了一个前提:真人可以被替代,效率可以取代一切。我们看直播,买东西,听聊天,本质上是在寻求一种陪伴、一种认同、一种情感交流。我们愿意为一个真实的、有缺点的、有温度的人买单,不愿意为一段完美却冰冷的代码停留。真人主播会犯错,会口误,会情绪化,会累,会哭,会笑,但正是这些不完美,让他们真实可信。AI虚拟人完美无缺,永远稳定,永远礼貌,却也永远空洞。就像微软的Copilot,拥有最强大的技术、最庞大的用户基础、最雄厚的资金,却因为脱离用户真实需求,产品体验一塌糊涂,最终被市场抛弃。AI虚拟人也是一样:技术堆得再高,模型跑得再快,脱离了“人”的需求,终究只是一个中看不中用的玩具。更残酷的是:AI虚拟人,不仅没替代真人,反而让优秀的真人更值钱。当满屏幕都是僵硬、冰冷、答非所问的虚拟人时,观众会更加珍惜那些真实、有趣、有料的真人主播。头部主播的议价能力更高,中腰部有特色的主播更容易脱颖而出,连素人直播都因为真实而获得更多好感。这个行业,到底还有没有未来?
AI虚拟人真正适合的场景,不是高强度实时互动直播,而是标准化、低情感、重复性的工作。在这些场景里,AI虚拟人效率高、成本低、稳定性强,优势非常明显。但一旦进入需要高情绪、高实时、高共情的直播场景,它就立刻暴露所有短板。可现在的行业参与者,几乎全都盯着最赚钱、最难啃的直播带货、娱乐直播这块肉。放弃自己的优势,非要用短板去跟真人硬碰硬,不输才怪。做一个能用的AI虚拟人,难度远超做一个普通大模型应用。它涉及计算机视觉、语音合成、自然语言处理、实时渲染、动作捕捉、情感计算、风控过滤等十几个技术模块。绝大多数公司,根本没有能力做全栈优化,只能买第三方模块拼接,系统卡顿、延迟、BUG不断是常态。就像微软,明明有极强的技术储备,却因为组织臃肿、决策缓慢、产品逻辑错位,做出的东西让用户难以忍受。AI虚拟人行业,同样犯了为了技术而技术、为了概念而概念的错误。泡沫破裂之后,剩下的是什么?
之前靠讲故事、靠噱头、靠信息差赚钱的公司,会陆续出局;一类是真正有技术能力,能把体验打磨到接近自然流畅的团队;另一类是清醒认知虚拟人边界,只把它用在合适场景,不夸大、不忽悠的务实玩家。虚拟人不会消失,但它会褪去光环,从“颠覆者”变回“工具人”。它会成为直播行业的一个补充,一个辅助,一个效率工具,而不是真人的替代品。就像AI没有干掉程序员、设计师、老师,反而让更优秀的人更强大一样,AI虚拟人也不会干掉主播,只会让那些只会念稿子、没有个人特色、依赖套路的低水平主播,更快被淘汰。这一波抖音AI虚拟人集体翻车,不是技术的失败,而是浮躁商业的失败,是违背人性需求的失败。资本总想用效率取代人心,用算法替代情感,用机器替代人与人的连接。
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-04-12 13:57:11 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/516737.html
- 运行时间 : 0.091244s [ 吞吐率:10.96req/s ] 内存消耗:4,704.77kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=fd366522007381be373c3083064dff28
- CONNECT:[ UseTime:0.000589s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.000929s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.000362s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000343s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.000491s ]
- SELECT * FROM `set` [ RunTime:0.000197s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.000657s ]
- SELECT * FROM `article` WHERE `id` = 516737 LIMIT 1 [ RunTime:0.000534s ]
- UPDATE `article` SET `lasttime` = 1775973431 WHERE `id` = 516737 [ RunTime:0.003321s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000273s ]
- SELECT * FROM `article` WHERE `id` < 516737 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000475s ]
- SELECT * FROM `article` WHERE `id` > 516737 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.001577s ]
- SELECT * FROM `article` WHERE `id` < 516737 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.000650s ]
- SELECT * FROM `article` WHERE `id` < 516737 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.001532s ]
- SELECT * FROM `article` WHERE `id` < 516737 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.000812s ]
0.093015s