乐于分享
好东西不私藏

Shopify的AI相变

Shopify的AI相变

Shopify 2026年AI全面爆发:Token预算无上限+三大自研工具|Latent Space: The AI Engineer Podcast

市值2000亿美元的电商巨头Shopify,已将AI深度嵌入全员日常工作:2025年底内部AI工具日活覆盖率近100%,内部Token使用量呈指数级暴涨,这是其AI转型的真正拐点。

本期内容来自AI工程师顶级播客《Latent Space: The AI Engineer Podcast》,嘉宾为Shopify首席技术官Mikhail Parakhin——他曾执掌微软Windows、Edge、Bing等核心业务单元。本次访谈完整拆解了Shopify的AI落地全链路,无论你是AI从业者、电商创业者还是企业技术管理者,都能从中窥见企业级AI落地的真实场景与核心挑战。


【全员AI化】2025年底覆盖率100%,Token预算无上限

Shopify内部AI工具的日活员工占比已接近100%,几乎所有员工都无法脱离AI工具完成日常工作。

Mikhail Parakhin透露:“我们为所有员工提供了不限额度的Token预算,要求至少使用Opus-4.6,不少资深员工会选择更高阶的模型版本。”这意味着Shopify彻底取消了内部AI使用的成本限制,不再让员工为Token额度纠结,倒逼全员主动拥抱AI工具。

2025年12月成为Shopify AI使用的爆发拐点,大模型性能的小幅积累最终带来了全面落地的质变。其中,CLI类轻量化AI工具的增速远超GitHub Copilot、Cursor这类IDE绑定工具,更适配电商团队快速迭代的工作场景。

内部Token使用呈现指数增长,且用户间消耗分布愈发倾斜,头部10%用户的增速远超普通用户。Mikhail坦言:“这确实有点反常,但早期由AI熟练用户主导是正常现象,后续通过内部培训可以逐步改善分布。”这也是企业AI落地初期的普遍现象,技能分布不均会导致资源倾斜,但Shopify已明确通过内部培训优化的路径。


【AI编码误区】真正的瓶颈不在生成,而在评审环节

很多人认为AI编码的核心瓶颈是生成速度,但Shopify的实践给出了完全不同的结论。

Mikhail Parakhin明确指出:AI编码的真正瓶颈不在生成,而在评审、CI/CD与部署稳定性。这打破了很多人的固有认知——大家总在追求更快的代码生成速度,但Shopify的实践证明,代码质量和落地效率才是真正的卡点。

单纯堆砌并行代理是典型的反模式,高效的做法是设置跨模型评审循环:让不同质量的模型互相校验优化,虽然单轮延迟升高,但能大幅减少后续测试回滚的整体成本。

Shopify目前没有使用第三方PR评审工具,而是自研了内部系统。Mikhail解释:“我们需要顶级模型轮流评审,而非一堆廉价并行代理,这反而能平衡效率与代码质量。”

Shopify的PR合并月增速已经从10%提升至30%,代码复杂度持续攀升,传统Git与CI/CD范式已经开始承压。你觉得现有的Git和PR协作模式,真的能适配机器快速写代码的时代吗?


【自研实验平台】Tangle+Tangent:把AI实验从混乱变量中解放

传统数据科学流程存在大量痛点:实验难以复现、版本混乱、协作割裂,开发到生产的过渡成本极高。

Mikhail介绍:“我们打造了第三代ML实验平台Tangle,专门解决团队协作下的实验管理难题。”Tangle基于内容哈希缓存,自动复用重复任务的结果,大幅提升效率;同时支持多语言、可视化编辑,一键从实验切换到生产环境,完整保留版本控制。

基于Tangle的Tangent则是自动研究循环工具,参考Andrej Karpathy推广的auto-research框架。Tangent让AI开发不再是ML工程师的专属,产品经理也能通过领域知识直接优化搜索、主题、存储等业务环节,无需依赖专业技术团队。

Shopify已经通过Tangent实现了多项业务突破:将索引服务QPS从800提升至4200,优化Liquid主题延迟,还自动识别并删除了大量冗余数据表。这大幅降低了电商AI落地的门槛,让非技术岗的业务人员也能参与到AI优化中,加速了业务迭代速度。


【电商AI护城河】SimGym:十年用户数据打造的真实客户模拟器

SimGym是Shopify最具辨识度的AI工具之一,核心是模拟真实的客户购物行为,为商家提供优化建议。

Mikhail强调:SimGym的核心护城河是Shopify十年积累的商家与用户行为数据,没有这份历史数据,客户模拟只会按照prompt重复内容,毫无实际价值。很多AI工具靠通用prompt就能做模拟,但Shopify的SimGym依托十年的真实交易数据,能精准还原用户购物行为,这是其他竞品抄不走的核心优势。

SimGym最初用于对比AB测试方案,内部目标是模拟结果与真实AB测试的相关性达到0.7,目前已经实现并落地。现在的SimGym已经升级为直接为新商家提供网站优化建议,比如纠正了“放大商品图片提升销量”的设计师直觉,模拟显示该操作实际会降低转化率。

模拟客户行为需要极高的成本,包括多模态模型、浏览器仿真、模型蒸馏等环节,Shopify正在持续优化这些环节以降低开销。SimGym还用到了中国餐馆过程(CRP)进行品类聚类,针对不同品类的客户行为差异做精细化优化。


【非Transformer实践】Liquid模型:兼顾速度与效果的电商AI新选择

目前主流的AI架构以Transformer为主,但Shopify正在测试并落地Liquid神经网络,这是一种非Transformer架构。

Mikhail解释:“Liquid是状态空间模型(SSM)的进阶版本,表达能力强于SSM,上下文长度为亚二次,兼具低延迟与高吞吐量优势。”这是他见过的第一个真正能打的非Transformer架构,在低延迟搜索和离线批量任务上表现远超Qwen等主流模型。

Liquid模型在Shopify有两大核心应用场景:一是300M参数的轻量模型,端到端延迟控制在30ms内,用于实时查询理解与个性化搜索;二是通过蒸馏大模型到Liquid架构,实现商品分类、属性提取等离线批量任务。

Liquid模型是Shopify当前最具性价比的非Transformer架构选择,团队会持续对比测试其他模型,始终以实际效果为选择标准。Shopify近期还发布了UCP统一目录平台,整合全平台商品搜索、批量查询、个性化搜索能力,优化身份链接以降低用户摩擦。


【彩蛋与招聘】从必应Sydney到Shopify的人才需求

访谈中还聊到了必应Chat早期的Sydney项目,Mikhail分享了不少细节。早期Sydney使用的是微软与NVIDIA合作的Megatron模型,而非GPT,团队特意投入大量精力进行人格塑造。

Mikhail提到:“Sydney早期在印度首发时,被不少用户当成人工假扮,因为当时公众对LLM的认知还很有限。”这段细节也能看出早期大模型落地的公众认知鸿沟,而现在Shopify的团队里还有当年Sydney的核心成员,算是技术团队的延续。

目前前Sydney的开发负责人Andrew McNamara正在Shopify负责Sidekick与Pulse项目,算是团队的再度集结。

Shopify当前的招聘需求集中在三个领域:机器学习、数据科学,以及分布式数据库。Mikhail补充:“我们正在探索用AI重构分布式数据库,这是一个极具潜力的方向,欢迎相关人才加入。”


总结与推荐

本期访谈完整展现了Shopify从电商工具平台到AI技术公司的转型路径:从全员无上限使用AI工具,到解决AI编码的真实瓶颈,再到自研实验平台、客户模拟器与非Transformer架构,三大自研工具+十年数据护城河,共同构建了Shopify难以复制的竞争优势。

内容适合AI从业者、电商创业者、企业技术管理者阅读,能帮助你跳出AI hype,看清企业级AI落地的真实场景与核心挑战。觉得有收获,欢迎点赞、在看或转发给身边的技术伙伴~