美国AI科技博主中国之行

2026年4月26日到5月4日，来自美国的8名AI科技博主在中国参观了主要的AI实验室。他们走访北京、上海、杭州、深圳四座城市，和一线的研究人员进行了交流。组团成员包括行业名人Nathan Lambert和Matt White。

最让美国博主们感到吃惊的地方

研究人员年轻是所有博主都提到的印象。小米AI实验室成员平均年龄只有25岁，其中80%是博士生。他们多数没有海外经历，但英语能力普遍很好。企业方面解释说，这是基于实用主义的考虑。人工智能技术发展太快，过去企业常用到学术会议上寻找技术专家的办法已经行不通，只好直接从尚未毕业的博士中招募人员。尽管竞争激烈，如果不考虑创始人和高管，中国技术人员的工资比美国低得多。

学校方面也乐于合作，比如清华大学。学校无法提供充足的算力，不如让学生直接到企业去做研究。学校通过招生帮助企业筛选人才，学生在企业发表的论文可以署学校的名字。这就形成一种兼容的激励设计，有助于提高人才培养的效率。可能因为过于年轻，中国技术人员不大关心技术的商业方面，而美国技术人员对此考虑得比较多，从数据、算力到融资，往往都有一套想法。

第二个吃惊的地方是技术人员的态度极为友好，从他们的访谈氛围来看，似乎地缘政治紧张根本不存在。中国技术人员对美国研究进展很熟悉，他们都会浏览X和HuggingFace发布的最新消息，许多人和美国的研究人员保持着联系。中国研究社区内部关系也相对和谐，在美国，如果关闭录音机，同行之间的评论就会变得火爆，在中国没有这种情况。

所有的人都畏惧豆包（DeepMind姚顺宇在不久前的一期采访中说字节没有蒸馏），而他们最佩服的则是DeepSeek，以一家公司力量塑造中国人工智能研究的叙事。DeepSeek似乎在做基础工作，包括架构、效率和推理优化，现在是带头全面适配华为技术栈。另一方面，DeepSeek在市场方面并不占据优势。博主们很满意，他们拿到了对谈的技术人员微信，今后可以获得更接近一手的中国市场信息。

第三个吃惊的地方是中国技术人员拒绝当哲学家。在硅谷，每个技术人员都会准备好一套说辞，解释自己对AI安全性以及社会影响的立场。中国的技术人员显然不需要，博主们提问关于AI将如何影响人类社会的问题，通常情况没有反应。

两地研究人员的一项重要区别是对AI技术的所有者意识。在硅谷，人们谈论AI的哲学话题，也许不是因为他们更具备道德敏感性，而是因为他们认为对自己开发的技术拥有一定权力。

博主们认为，和硅谷同行相比，中国技术人员更虚心，不那么以自我为中心，更愿意解决具体的技术问题，对他们不了解的社会问题不发表见解。在中国，社会整体对AI呈现出更加友好的态度，技术人员没有道德压力，这和美国的情况不同。当然，还有一种解释是算力不足，因此没有资源可以分配在这一方向，也导致技术人员对此缺乏认识。

美国博主们事先已经知道的信息

资金方面，两地差距很大。2025年美国AI创业公司筹集了2850亿美元，中国同类企业是124亿美元。中国技术人员最大的困难是缺乏算力，主要是因为英伟达芯片的出口管制。华为芯片固然提供了部分替代，但华为芯片本身产量不足。一位博主为了表示友好，在对话中披露了OpenAI工程师平均享有的算力，让在场的中国技术人员感到震惊。

美国博主认为两地之间的算力落差是真实的。美国算力和中国算力的差距在2023年是3倍，2025年扩大到8倍。算力上中国落后美国两年，但大模型性能上却接近美国，答案是模型训练效率不同。

由于算力限制，中国企业走向极致优化的道路，努力提升开发效率，DeepSeek对此做出了极大的贡献。有博主提出效率乘数的概念，中国实验室每单位算力提取出来的智能是美国的4~7倍。相当于2到3年的效率收益。这是中国大模型能够紧追美国的原因之一。

成本方面，中国企业比美国普遍便宜数倍，并且MiniMax和智谱在这样的成本结构之下可以实现相当高的毛利率。随着人工智能技术从研究进入应用，成本的重要性提高。这有利于中国企业，特别是在消费级产品的端侧应用市场，偏好低成本工具的海外市场可能更欢迎中国企业产品。

一位博主认为，就像当年丰田汽车依靠效率优化和严格的成本控制崛起，中国企业正在学习丰田生产方式，与不那么介意成本的美国企业竞争。

在概念创造方面，中国技术人员落后于美国。Anthropic提出宪法式AI，OpenAI联合创始人安德烈·卡帕西提出氛围编码。中国企业注意学习硅谷的经验和逻辑，在演示中，他们不断引用美国AI名人对他们产品的评价，经常出现人物的有马斯克、黄仁勋和小龙虾开发者彼得·斯坦伯格。

美国博主们感到困惑的地方

在美国，只有5家企业坚持做大模型，Anthropic，Google，OpenAI，Meta和xAI，而且数量可能进一步减少。在中国，大模型企业数量相当多。他们对蚂蚁、美团和小米拥有自己的大模型感到奇怪。

博主们普遍认为，中国难以突破算力限制。中国大模型在参数和指标上保持着对美国大模型的追赶。可是因为机柜数量不足，算力不够，这些大模型要想直接提供服务已经不可能，不得不采取一些工程措施。如果美国大模型参数继续增加，中国企业在追赶时会遇到更大的困难。

阿里巴巴和字节跳动可以利用海外的芯片集群保持追赶，国内的企业可能需要整合。由于企业投资人利益难以协调，行业整合不太现实。还有一项选择是只做参数量有限的开放权重模型，可以发挥成本优势。

此外，美国大模型企业通常会购买训练环境，因此数据产业比较发达。而中国企业倾向于自建，字节和阿里巴巴甚至有内部的数据标注业务。为什么自建，而不采用标准化的通用训练数据？这可能和中国企业强调技术自有化有关。

另一方面，如果不能解释训练数据的来源，也就难以回应关于蒸馏的疑问。博主们也不确定中国企业在训练时使用华为芯片还是英伟达芯片。他们提到，中国企业会将部分模型训练转移至国外以解决芯片出口管制带来的困难。

所有的企业都在用Claude Code并且对其性能称赞不已，这类评论和硅谷是一样的。然而和美国不同的是，几乎没有人提到Codex。

闭门访谈和新京报的报道

博主们交流的对象包括DeepSeek、月之暗面、MiniMax、智谱、字节跳动、零一万物、阿里巴巴、蚂蚁集团、小米、创新奇智、银河通用、宇树科技、魔搭社区和RWKV。一些博主还拜访了小红书、美团和清华大学。

从这份名单来看，中国AI实验室之旅可谓实至名归。这次访问的曝光量并不高，西方媒体没有提到这次访问，中国媒体也不多，少数公众号刊载了博主们访谈感想的翻译稿。

媒体不关注博主们的中国行，有部分原因和这次访问本身的意图有关。访问有公关性质，但并非有关部门邀请，也不是受访企业组织的。组织方是一家名为SAIL的AI博主联盟，属于聚合信息服务商。

SAIL英文全称Substack Artificial Intelligence Library，将创作平台Substack上有关人工智能技术评论创作者的内容集合起来，面向对AI有兴趣的企业和个人打包销售。SAIL强调评论独立性，目前有9位作者，100多万订户。

本次访问缘起是一位成长于中国的AI博主，她提到多数AI博客在讨论中国技术，然而绝大多数人根本没有到过中国。SAIL的一名管理人员Caithrin Rintoul本身也是一名记者，他认为这是一个很有道理的批评。

Rintoul曾经在中国工作，可能和AI实验室的公关部门有联系。他知道中国AI模型希望在海外有更多报道，而SAIL有集群优势。Rintoul花了6个月时间与各家AI实验室联系，终于在4月底成行。

SAIL采取了低调的姿态，闭门访谈，将话题控制在行业和社区内部。只要求和一线工程师对话，不要求创始人和高管出面。每次访谈时各家实验室都会派出公关人员在场，阿里巴巴的公关阵容最强大。

根据美国市场对模型收入的重要性，接待的态度也会不一样，据说美团的接待就比较勉强。博主们都表达了对Caithrin Rintoul的感谢，在当前中美不可言说的形势下，他完成了Mission Impossible。

回到美国之后，博主们除了交出SAIL作业，也采用闭门交流的方式介绍见闻。据有的博主披露，很多人向他们了解前往中国交流的路径。大家对中国开放权重模型还是非常感兴趣的。随着AI研发人员出境管理加强，从美国来中国似乎更方便一些。

新京报在报道中援引接待方一家大模型项目负责人的话，“坦率地说，除了OpenAI、Anthropic等顶级美国AI公司，我们在技术实践方面的经验领先于这些来访学者，这次交流也是一个让中国AI大模型影响力向海外扩散的好机会。”被点名的海外扩散对象包括苹果和沃尔玛。一位博主在访问报告中注意到这篇报道，提醒读者不同主体对他们中国之行的多重理解。

在这批博主们之后来华的是AI领域中最知名的播客主播Lex Fridman，他和英国旅游博主Mike Okay在陕西安康搭便车差点被司机抓特务的故事上了美国新闻。Fridman在中国的采访还没有发布，值得期待。