微信原生AI助手小微灰度上线

微信原生 AI 助手「小微」灰度上线：13 亿月活入口的 AI 化，终于迈出第一步

2026 年 6 月 21 日，部分安卓和 iOS 用户发现，微信主界面左上角多了一个小眼睛式样的图标。点进去，是一个对话框，没有名字、没有欢迎页，只有顶部一行小字写着「微信小微」。这是腾讯客服首次对外确认的、由微信团队自研的原生 AI 助手。在此之前，腾讯的 AI 能力对外主要通过「腾讯混元」小程序、QQ 浏览器 AI 助手、ima 等独立入口呈现，与微信主端是分离的。

小微的特别之处，在于它是第一个直接嵌在微信一级入口的对话式 AI。这不是腾讯第一次在微信里试水智能对话——2023 年 9 月，「腾讯混元助手」以小程序形态上线；2024 年「问必答」以服务号形态灰度——但那些都停留在「微信生态内的第三方应用」层面。小微的入口则被放在了主聊天列表的左上角，与通讯录、发现栏同一权重。这是微信第一次把 AI 提到「产品形态级」的位置。

灰度的范围也透露出腾讯的克制态度。腾讯客服在回应中明确说明：灰度测试覆盖多个系统，但具体参与资格以实际页面显示为准。这意味着小微目前并不像混元小程序那样可以通过邀请码或申请制获取，而是由腾讯按设备号、用户标签、地区分层放量，逻辑更接近视频号、问必答的早期灰度策略。从最早一批曝光用户所在的城市分布看，安卓侧的灰度明显多于 iOS，海外用户则完全无法触发入口。

小微能做什么：从发消息到一句话生成小程序

从已曝光的截图和用户实测来看，小微的能力边界可以拆成三层。

第一层是微信原生操作。小微支持通过文字或语音对话，直接调用微信自带的设置项、消息发送、朋友圈发布、拨打电话、播放音乐、添加提醒、查询位置等。这些动作的本质，是把微信原本需要点 4 到 5 次菜单才能完成的操作，压缩成一句话。例如对对话框说「把张三置顶一下」「给李四发条语音说十分钟后到」「查一下明天的天气并设一个带伞的提醒」，小微会直接执行，而不是给出操作指引。在灰度测试中，对话式操作的成功率被部分早期用户描述为「十次里能成八次」，主要失败集中在涉及隐私权限判断的场景。

第二层是调起小程序完成服务。这是腾讯对小微最核心的定位——做小程序生态的 AI 入口。用户可以用自然语言完成挂号、订咖啡、查快递、买电影票等动作，背后是直接拉起对应小程序的 Deeplink，而不是跳转到浏览器或独立 App。腾讯这一步把微信积攒十余年的小程序服务，从「按名搜索 + 手动打开」升级为「语义拉起」。一个早期测试用户展示的样例是：说出「预约明天下午三点的协和医院消化科」这样的需求，小微会先反问具体医生偏好，再拉起对应的挂号小程序完成下单链路。整个过程不需要用户主动搜索「协和医院」「挂号」「消化科」三个关键词。

第三层是生成能力。小微目前支持搜索相关内容、生成图片、以及被外界最关注的「一句话生成小程序」能力。用户在对话中描述需求，例如「做一个记录每日喝水的工具，按周统计」或「做一个猫咪年龄换算的小工具」，小微会直接生成一个具备基本页面和功能的小程序雏形，并支持通过多轮对话调整风格与版式。

值得注意的是，当前生成的小程序仅限创建者本人使用，还不具备对外分享能力。这一点很关键。它意味着小程序的生成能力在现阶段还停留在「个人玩具」阶段，没有被打通到正式上架审核通道。这种「先内测能力、不开闸分发」的设计，明显是在为后续可能的合规、安全审核留出空间。一旦放开分享，腾讯需要面对生成内容合规、版权归属、未成年人保护等一整套新规则。

技术底座：多模型混部，而非单一大模型

腾讯客服在回应中专门提到：小微目前使用多个 AI 模型，其中包括自研及开源优质模型。这一句话透露了两个关键信息。

第一是「多模型」而非「单模型」架构。这与传统聊天助手一个底座模型打通所有任务的做法不同。合理的推测是，腾讯对小微的不同任务调用不同的模型——短指令、工具调用、长文本理解、图片生成可能对应不同的后端。腾讯目前自研模型谱系包括混元 Turbo、混元 large、混元 Embedding 等多个尺寸，开源侧则有 Hunyuan-A13B、混元 DiT 视频、混文生图等多个模块。多模型架构的好处是按任务调度成本更低、长尾任务延迟可控；代价是工程复杂度更高，模型间的 fallback 和一致性维护会更难。

一个开发者侧的间接证据是，腾讯云近期在混元 API 网关中上线了「模型路由」能力，允许调用方按 QPS、SLA、token 单价动态切流。这种基础设施极有可能就是为小微这类原生 AI 准备的。一个典型的伪代码示意如下：

# 混元 API 网关对小微的模型路由示例
def route_to_model(user_intent: str, context: dict) -> str:
    # 按任务类型选择最合适的模型
    if user_intent.startswith("小程序生成"):
        return "hunyuan-a13b-instruct"  # 长文本规划
    elif user_intent.startswith("图片"):
        return "hunyuan-dit-t2i"  # 图像生成
    elif "调用" in user_intent or context.get("tool_call"):
        return "hunyuan-turbo-toolcall"  # 工具调用专用
    else:
        return "hunyuan-turbo-default"  # 默认对话

第二是「自研 + 开源」混用。这是腾讯在大模型选型上一贯的策略：不押注单一路线。这与同期的字节豆包手机、阿里通义、百度文心思路一致，但在微信这样的核心入口里做混用，腾讯显然在底层做了更多隔离和路由。一个旁证是，腾讯近期内部把混元 API 网关做了大规模重构，支持按 QPS、SLA、token 单价动态切流，这种基础设施很可能就是为小微这类原生 AI 准备的。

至于小微背后的推理算力，腾讯并未披露具体规模。但可以参照一个数据：OpenAI 在 2025 年的收入预期被上调到约 300 亿美元，但同期 AI 推理成本同比增长约 4 倍，毛利率被压到 33%，2030 年前的累计现金消耗预计增加约 1110 亿美元。腾讯在小微上要做「原生深度整合」，意味着它必然要走一条比独立 AI 应用重得多的推理基础设施投入。这也是为什么小微选择先灰度、再放量，而不是直接全量上线。

双线作战：原生助手 + A2A 协议两手抓

如果只看小微，容易忽略腾讯在微信 AI 化上的另一条线——A2A 协议。

2026 年 6 月 22 日，有媒体报道微信与华为、小米、荣耀、OPPO 等国产手机厂商达成合作，将向手机端 AI 助手开放微信操作能力。技术路径是 Agent-to-Agent 协议：手机上的智能体（如荣耀 YOYO、小米超级小爱）通过标准接口调用微信内部的智能体，由微信智能体直接执行操作，而不是通过 OCR 读屏 + 模拟点击完成。早期测试机型为荣耀 500 Pro，实测可以完成「动动嘴发消息、打电话、打开扫一扫 / 收付款码」等动作。

A2A 与小微是两条平行、互补的路线。

• 小微是微信自己出的「官方 AI 助手」，面向普通用户的对话式入口；
• A2A 是微信开放给手机厂商的「AI 接口协议」，面向系统级智能体调用。

前者解决「微信里需要 AI」的体验升级，后者解决「手机系统级 AI 想操作微信」的能力补齐。两条路线如果同时跑通，腾讯可以在不与手机厂商直接竞争的前提下，把微信的 AI 入口同时拉到「应用内」和「系统层」两个层级。从国际上看，类似的尝试还有谷歌的 Gemini Spark、苹果的 AI Siri，但二者的开放程度目前都低于腾讯 A2A——苹果甚至完全不允许外部 Agent 调用 iMessage。

值得关注的是，A2A 当前的功能覆盖也很克制：支持文字消息、音视频通话和扫码付款，但不支持发送图片、转账等敏感操作。这种「先开通通信和支付入口，富媒体与金融功能暂缓」的策略，和小微对生成小程序的「先个人、再分发」策略异曲同工，反映出腾讯在 AI 化过程中把安全和合规放在速度前面的整体节奏。

算力与体验：腾讯绕不开的成本账

原生 AI 的真正成本，不在模型训练，而在推理侧。小微把入口放到一级菜单，意味着只要用户点开微信、看见左上角那个小眼睛图标，潜在的推理调用就被「打开」了。腾讯必须面对三个具体的算力问题。

第一个是 token 计费的实时化。小微的多模型架构意味着同一个用户对话里，可能在三轮之内调用过三个不同模型，token 单价、延迟、上下文长度都不一样。腾讯需要在网关侧做到按对话实时核算成本，而不是按月结算。一个对比指标是：在混元 Turbo 单价基础上，每次工具调用平均多消耗约 1500 token 的「思考开销」，这部分成本如何计入、如何分摊，目前没有公开方案。

第二个是「个人小程序」的算力归属。每个用户生成的「喝水记录器」「猫咪年龄换算」小程序，部署在哪里、由谁付算力钱、能不能迁移到云开发托管，目前都没有公开方案。如果只是「本地预览 + 个人服务器跑」，那它只是一个玩具；如果要支持分享、托管，腾讯就要重新设计一套面向 C 端的轻量小程序容器方案。考虑到腾讯云开发目前的最低包月费用在 9.9 元/月，是否会推出专门面向「AI 生成小程序」的 0 元体验档位，将直接影响小微对普通用户的吸引力。

第三个是嵌套 Agent 的算力放大。在 A2A 路线下，手机智能体调用微信智能体，微信智能体又可能调用小程序智能体，单次用户意图背后实际触发的推理次数可能是 2 到 3 次。A2A 路线下的 token 费用如何向用户、厂商、开发者分摊，目前微信团队没有给出方案，但这个问题必须在全量开放前解决。

行业意味：腾讯把 13 亿月活的入口让给 AI

把视角从产品本身拉远一些。微信在 2026 年初的月活跃账户已经稳定在 13 亿以上，其中小程序月活超过 7 亿，公众号月活超过 8 亿。把这样一个体量产品的「左上角」让给一个 AI 对话框，是腾讯在 AI 时代做的最大一次产品形态让步。

过去十年，腾讯把微信的每一次重大改版都做得极其克制——朋友圈从不需要 AI 推荐、视频号是抖音化倒逼出来的产物、问必答放在服务号里、混元助手放在小程序里。小微的灰度，意味着腾讯第一次主动在主界面为 AI 留出位置，且不是可选项、是默认入口。

这种让步背后的逻辑并不复杂：当所有竞争对手都已经把 AI 塞进一级入口时，微信如果继续把 AI 留在第三方入口，本身的体验优势会被反向稀释。小微不是一个新产品，它是腾讯为了保住微信的「体验护城河」而做的防御性升级。

与此同时，腾讯也在用 A2A 协议把微信的 AI 操作能力开放给外部手机厂商。这种「自研 + 开放」的双线推进，本质上是在告诉整个行业：微信愿意配合，但要按腾讯的协议走；微信也在做 AI，但 AI 不能绕开微信。

对普通用户来说，小微灰度带来的最直接变化，是微信开始变得「可以开口说话」了。这种变化是否会扩展到所有用户、何时扩展到小程序生态的全部场景，目前都是未知数。但可以确定的是，2026 年 6 月 21 日这个灰度节点，已经让腾讯在 AI 入口争夺战中，从「落后半步」变成了「重新在场」。