Shopify的AI相变

Shopify 2026年AI全面爆发：Token预算无上限+三大自研工具｜Latent Space: The AI Engineer Podcast

市值2000亿美元的电商巨头Shopify，已将AI深度嵌入全员日常工作：2025年底内部AI工具日活覆盖率近100%，内部Token使用量呈指数级暴涨，这是其AI转型的真正拐点。

本期内容来自AI工程师顶级播客《Latent Space: The AI Engineer Podcast》，嘉宾为Shopify首席技术官Mikhail Parakhin——他曾执掌微软Windows、Edge、Bing等核心业务单元。本次访谈完整拆解了Shopify的AI落地全链路，无论你是AI从业者、电商创业者还是企业技术管理者，都能从中窥见企业级AI落地的真实场景与核心挑战。

【全员AI化】2025年底覆盖率100%，Token预算无上限

Shopify内部AI工具的日活员工占比已接近100%，几乎所有员工都无法脱离AI工具完成日常工作。

Mikhail Parakhin透露：“我们为所有员工提供了不限额度的Token预算，要求至少使用Opus-4.6，不少资深员工会选择更高阶的模型版本。”这意味着Shopify彻底取消了内部AI使用的成本限制，不再让员工为Token额度纠结，倒逼全员主动拥抱AI工具。

2025年12月成为Shopify AI使用的爆发拐点，大模型性能的小幅积累最终带来了全面落地的质变。其中，CLI类轻量化AI工具的增速远超GitHub Copilot、Cursor这类IDE绑定工具，更适配电商团队快速迭代的工作场景。

内部Token使用呈现指数增长，且用户间消耗分布愈发倾斜，头部10%用户的增速远超普通用户。Mikhail坦言：“这确实有点反常，但早期由AI熟练用户主导是正常现象，后续通过内部培训可以逐步改善分布。”这也是企业AI落地初期的普遍现象，技能分布不均会导致资源倾斜，但Shopify已明确通过内部培训优化的路径。

【AI编码误区】真正的瓶颈不在生成，而在评审环节

很多人认为AI编码的核心瓶颈是生成速度，但Shopify的实践给出了完全不同的结论。

Mikhail Parakhin明确指出：AI编码的真正瓶颈不在生成，而在评审、CI/CD与部署稳定性。这打破了很多人的固有认知——大家总在追求更快的代码生成速度，但Shopify的实践证明，代码质量和落地效率才是真正的卡点。

单纯堆砌并行代理是典型的反模式，高效的做法是设置跨模型评审循环：让不同质量的模型互相校验优化，虽然单轮延迟升高，但能大幅减少后续测试回滚的整体成本。

Shopify目前没有使用第三方PR评审工具，而是自研了内部系统。Mikhail解释：“我们需要顶级模型轮流评审，而非一堆廉价并行代理，这反而能平衡效率与代码质量。”

Shopify的PR合并月增速已经从10%提升至30%，代码复杂度持续攀升，传统Git与CI/CD范式已经开始承压。你觉得现有的Git和PR协作模式，真的能适配机器快速写代码的时代吗？

【自研实验平台】Tangle+Tangent：把AI实验从混乱变量中解放

传统数据科学流程存在大量痛点：实验难以复现、版本混乱、协作割裂，开发到生产的过渡成本极高。

Mikhail介绍：“我们打造了第三代ML实验平台Tangle，专门解决团队协作下的实验管理难题。”Tangle基于内容哈希缓存，自动复用重复任务的结果，大幅提升效率；同时支持多语言、可视化编辑，一键从实验切换到生产环境，完整保留版本控制。

基于Tangle的Tangent则是自动研究循环工具，参考Andrej Karpathy推广的auto-research框架。Tangent让AI开发不再是ML工程师的专属，产品经理也能通过领域知识直接优化搜索、主题、存储等业务环节，无需依赖专业技术团队。

Shopify已经通过Tangent实现了多项业务突破：将索引服务QPS从800提升至4200，优化Liquid主题延迟，还自动识别并删除了大量冗余数据表。这大幅降低了电商AI落地的门槛，让非技术岗的业务人员也能参与到AI优化中，加速了业务迭代速度。

【电商AI护城河】SimGym：十年用户数据打造的真实客户模拟器

SimGym是Shopify最具辨识度的AI工具之一，核心是模拟真实的客户购物行为，为商家提供优化建议。

Mikhail强调：SimGym的核心护城河是Shopify十年积累的商家与用户行为数据，没有这份历史数据，客户模拟只会按照prompt重复内容，毫无实际价值。很多AI工具靠通用prompt就能做模拟，但Shopify的SimGym依托十年的真实交易数据，能精准还原用户购物行为，这是其他竞品抄不走的核心优势。

SimGym最初用于对比AB测试方案，内部目标是模拟结果与真实AB测试的相关性达到0.7，目前已经实现并落地。现在的SimGym已经升级为直接为新商家提供网站优化建议，比如纠正了“放大商品图片提升销量”的设计师直觉，模拟显示该操作实际会降低转化率。

模拟客户行为需要极高的成本，包括多模态模型、浏览器仿真、模型蒸馏等环节，Shopify正在持续优化这些环节以降低开销。SimGym还用到了中国餐馆过程（CRP）进行品类聚类，针对不同品类的客户行为差异做精细化优化。

【非Transformer实践】Liquid模型：兼顾速度与效果的电商AI新选择

目前主流的AI架构以Transformer为主，但Shopify正在测试并落地Liquid神经网络，这是一种非Transformer架构。

Mikhail解释：“Liquid是状态空间模型（SSM）的进阶版本，表达能力强于SSM，上下文长度为亚二次，兼具低延迟与高吞吐量优势。”这是他见过的第一个真正能打的非Transformer架构，在低延迟搜索和离线批量任务上表现远超Qwen等主流模型。

Liquid模型在Shopify有两大核心应用场景：一是300M参数的轻量模型，端到端延迟控制在30ms内，用于实时查询理解与个性化搜索；二是通过蒸馏大模型到Liquid架构，实现商品分类、属性提取等离线批量任务。

Liquid模型是Shopify当前最具性价比的非Transformer架构选择，团队会持续对比测试其他模型，始终以实际效果为选择标准。Shopify近期还发布了UCP统一目录平台，整合全平台商品搜索、批量查询、个性化搜索能力，优化身份链接以降低用户摩擦。

【彩蛋与招聘】从必应Sydney到Shopify的人才需求

访谈中还聊到了必应Chat早期的Sydney项目，Mikhail分享了不少细节。早期Sydney使用的是微软与NVIDIA合作的Megatron模型，而非GPT，团队特意投入大量精力进行人格塑造。

Mikhail提到：“Sydney早期在印度首发时，被不少用户当成人工假扮，因为当时公众对LLM的认知还很有限。”这段细节也能看出早期大模型落地的公众认知鸿沟，而现在Shopify的团队里还有当年Sydney的核心成员，算是技术团队的延续。

目前前Sydney的开发负责人Andrew McNamara正在Shopify负责Sidekick与Pulse项目，算是团队的再度集结。

Shopify当前的招聘需求集中在三个领域：机器学习、数据科学，以及分布式数据库。Mikhail补充：“我们正在探索用AI重构分布式数据库，这是一个极具潜力的方向，欢迎相关人才加入。”

总结与推荐

本期访谈完整展现了Shopify从电商工具平台到AI技术公司的转型路径：从全员无上限使用AI工具，到解决AI编码的真实瓶颈，再到自研实验平台、客户模拟器与非Transformer架构，三大自研工具+十年数据护城河，共同构建了Shopify难以复制的竞争优势。

内容适合AI从业者、电商创业者、企业技术管理者阅读，能帮助你跳出AI hype，看清企业级AI落地的真实场景与核心挑战。觉得有收获，欢迎点赞、在看或转发给身边的技术伙伴～