Bittensor 是 AI 时代的比特币吗? - 译 Jacob 在清华大学的演讲

昨天有一篇英文文章叫做 Why TAO is the Bitcoin of AI 反响很高，讲的就是 Bittensor 是如何将 Bitcoin 的逻辑应用到 AI 上的。本来我也准备专门写写这个话题，那我就利用一段当时 Bittensor 创始人 Jacob 在清华大学的演讲来聊聊 Bittensor 和 Bitcoin 的关系是什么，以及为什么 AI 是非常好的应用场景。

去年 10 月份，Bittensor 创始人 Jacob 一行来到中国，我们和他们一起去了上海，北京，杭州，深圳，香港，并且在几个主要的高校都组织了演讲，包括上海交大，复旦，北大，清华，深圳，港科大。

我也是在听了不下 10 次 Jacob 的 presentation 之后才真正理解了 Bittensor 的本质，具体大家可以看我写的上一篇文章。

Jacob 有一个 80 多页的 PPT，但是他每次分享都不是固定的，会根据听众的情况来作出调整，同时每次分享完在回酒店的路上他都会和我们一起复盘今天的 pitch 怎么样，听众的反馈是怎样的，下次应该作出哪些调整。因此，虽然听了不下十次，基本每次的 presentation 都是不一样的。

其中我认为最好的一次应该是在北大的分享：虽然当时申请到的教室比较小，但是却难掩学生们的热情，大家听完 Jacob 的分享之后和他进行了很多高质量的思想碰撞和交流，Jacob 当时甚至专门发了一条推来纪念那一次的分享，我想这应该是他在整个校园行当中最难忘的一次。

只可惜那次我们没有专业的设备，没有将 Jacob 的演讲录下来，我们这次就以他在清华大学的演讲为蓝本，来讲讲到底 Bittensor 和 Bitcoin 的关系是什么。为了增强可读性，我并没有逐字进行翻译，主要是以达意为准。也强烈推荐大家去看下我们在 YouTube 上发的原视频：

https://www.youtube.com/watch?v=yRzc-WTyXXw&t=6s

要理解 Bittensor 是什么，先回到 2010 年看一眼。

那一年，AI 一点都不火，神经网络被认为是个走不通的方向。当时业内做手写数字识别（MNIST）的方法很"工程化"：先人为定义 "数字应该长什么样"——找曲线、找直线、计算线条数量和长度——再写一个数学函数把这些特征手工映射到 0 到 9。最好的论文做到了 97% 的准确率，但其实挺烂的。

转折点是 2012 年的 AlexNet。它的核心创新是：

不再事先定义"答案应该长什么样"，而是让模型自己在一个不断适应的过程里学出来。

搭一个神经网络，定一个目标函数（错误率），喂数据进去跑，得到 loss，用梯度更新权重——一个循环。让它跑下去，loss 慢慢下降，网络慢慢变好。

MNIST 被这套方法彻底打穿。从那之后，整个 AI 领域就再也没有停下来。

这套结构强在哪里？强在它普适。同样的 pattern 在很多地方都能看到：

强化学习：环境 → agent 做动作 → reward 回来更新参数。一个 feedback loop，能跑十亿次。
遗传算法：基因码 → 评估 → 选种群 → 越来越好。
生物界：黏菌放进迷宫，能顺着燕麦的蛋白质气味梯度生长，最后真能找到最短路径。这就是最朴素的"对奖励的适应"——也是生物界里最底层的"智能"。
物质世界本身：树怎么长、叶脉怎么铺、闪电是什么形状、河流三角洲怎么形成——本质上都是某种"获取能量、调整自己、维持自身结构"的体系。

把这些放在一起看，你会发现它们本质上是同一个东西：

state · objective · feedback · adaptation · loop

状态、目标、反馈、适应、循环——然后让它疯狂迭代。

这是世界结构最底层的一种 pattern。现代机器智能的所有突破，本质上都是在借力同一个 pattern。

我在 DARPA 做神经形态芯片的那几年，研究的就是这种"自适应"的行为。同一时期我在学 Bitcoin。然后我意识到一件事：

Bitcoin 也是这个 pattern 的一个例子——不是作为一种货币，而是作为一个网络。

Bitcoin 是一台自适应的计算机，是一个生产 hash 的网络。机制极其简单：

矿工产 hash → 网络发 BTC 作为奖励 → 验证 hash 看你产得多快 → 按速度结算

这就是 Bitcoin 的全部。它就是用这套结构来保护这个网络的——一个被设计成"按状态-目标-反馈-适应-循环来产 hash"的自适应系统。

Bitcoin 是世界上最大的超级计算机

为什么这件事值得重点讲？看几组数字：

Bitcoin 的算力是美国最大六家算力供应商加起来的 1,000 倍
它每秒产 10²¹ 次 hash——一个大到屏幕都写不下的数字
它持续耗电 23,000 兆瓦——和泰国整个国家的耗电量是一个量级，一个一亿多人口的国家

更值得拆解的是它的"效率"：

美国最大六家算力厂 Bitcoin 网络投入资本 ~1 万亿美元 500 亿 - 3,000 亿美元产出算力 ~1,000 exaflops ~450,000 exaflops

也就是说，在"产 hash"这件事上，Bitcoin 比那些标准化算力公司高效 700 到 9,000 倍。

而且这个网络是完美高效的——Bitcoin 价格涨，矿工立刻产更多 hash。

Bitcoin 凭什么这么能打？

把 Bitcoin 当成一台计算机来看，它的几个关键特征解释了为什么它能跑出这种规模：

没有国界。你在哪儿都行，一台笔记本就能挖。它能调动地球上每一个国家的资源。
永远在跑。没有开市收市，周末也不歇。7×24 不停，竞争激烈，永远在自我优化。
完全自治。没有人在中间发号施令。
不需要许可。不用问任何人就能进。它就只是从电网里拼命拉电。

最后这条尤其关键。一家正常公司做不到这种效率——它要养 HR、要审身份、必然带偏见——你哪个学校毕业的、哪个国家来的，公司都会问。Bitcoin 不在乎。它只在乎你能不能产 hash。

这是它高效的根本原因。它是一个纯粹的市场——你产 hash 越多，赚得越多，能投多少算力、回报多少，全部算得清清楚楚。

把上面这些拼起来，可以给这种新现象起一个名字：激励计算（incentive computing）。

机器学习是一种计算，强化学习是一种学习，遗传算法是一种计算——激励计算也是一种计算。它和前面这些方法本质上是同一个 pattern：定义状态、定义目标、给反馈、让系统自适应。区别在于，激励计算把"反馈"换成了真金白银的激励。

这个区别看起来小，但它是整件事跑得猛的关键——传统机器学习里的 reward 是计算机里的一个数字，你不能用它去推动地球上 200 个国家的人替你做事。Bitcoin 把这个 reward 换成了真钱，于是整个地球都被变成了挖矿网络。

但我们其实根本不需要 hash——hash 在 Bitcoin 之外是没用的。我们想要的是任何东西。

如果能把"造出全世界最大超级计算机"那一套机制，搬去做存储、做算力、甚至做机器学习本身——会怎么样？

这就是我们想回答的问题。

我们把 Bitcoin 拆开看：矿工产 hash · 验证者验 hash · 网络给矿工发币。

把它通用化：

矿工做任何工作 · 验证者验任何工作 · 网络给矿工铸造数字货币

这就是我们做的 Bittensor。它本质上是一个平台——你可以在上面构造任何形式的激励计算。它就像一个 PyTorch、一种语言——一种用来构造激励计算的语言。

具体怎么跑？跟 Bitcoin 非常像：

注册一个 miner，绑一个加密密钥
miner 做点事，这些事被 validator 拿走去验
validator 按一套预先定好的规则给你打分
结果上链，链上对"哪些 miner 干得好"达成共识
按你在曲线上的位置发奖励

每个 miner 都在往网络里输出某种有价值的东西——可能是存储、可能是算力、可能是模型、可能是数据。validator 一直在度量他们各自带来了多少价值，给他们排序。这是一个自适应的系统——差的 miner 被淘汰，新的接上去，整个网络在循环换血。

你可以把它看成遗传算法、强化学习，也可以看成机器学习里的梯度下降问题——从优化角度有很多种类比。但它本质上是建在 miner 真实生产力之上的。

讲到这里，激励计算的"理论"部分就讲完了。下面看 Bittensor 上已经在跑的真实例子——这才是这个框架是否成立的真正证据。

例 1：写代码（SWE-Bench）

Bittensor 上有一个网络，挖的不是 hash，挖的是会写代码的能力——基本上就是 Cursor 在做的那种 intelligence model。

机制大概是这样：miner 提交 AI agent → agent 在 SWE-Bench 上被评测 → 按表现给奖励，奖励是数字 token。

这个机制没有给 agent 设计解法。它只是把"激励"写出来，让 agent 在这套激励下被进化出来。

没有任何工程师，没有任何"算法设计"——这个网络跑出来的 agent，在 SWE-Bench 上的成绩比 Claude、比 OpenAI、比任何闭源开源模型都更强。

谁做的？我们也不知道。世界上某个不知名的人，写了 7,000 行代码——一个 7,000 行的 AI agent——能 embed 文件、grep 文件、用 git 应用 diff，把 SWE-Bench 成绩拉了上去。

这一刻给我的感觉，跟 2012 年神经网络第一次在 MNIST 上跑通的那一刻非常像。

这是一个没有任何工程师的 AI 实验室。这个实验室不去定义"问题怎么解"——它只定义激励。

奖励还挺可观。这个 subnet 上的头部 miner，一天能挣 6 万美元。没有 HR、没有 VC、没有营销——所有钱直接通过网络付给真正在做优化、真正在解决问题的人。

注：这个 subnet 是 SN62 Ridges AI，专做 AI 软件工程 agent。截至 2026 年 4 月，α 市值在 Bittensor 全网排在 #7 左右，是激励计算在"AI agent"这条赛道上跑得最远的一个证明。

例 2：跨互联网协同训练 700 亿参数模型

要训出真正有分量的神经网络，必须训得动超大模型。手上没有几万张 GPU，基本就别想跟闭源实验室硬碰硬。

但如果一群人能把各自的 GPU 凑起来，理论上就能合训一个一样大的模型，每个人不用各自扛全部成本。

那能不能给"训这种模型需要的梯度"建一个市场？

机制：miner 产梯度 → validator 检查梯度有没有让 loss 下降 → 按表现结算。

我们正在一个 700 亿参数的模型上训，跨整个互联网。不需要许可，世界上任何人都能贡献，没有白名单。你只要能比别人更快地产出一个让 loss 下得更快的梯度，网络就给你付钱。

这是把 Bitcoin 挖矿那一套搬过来训机器学习模型——完全去中心化、跨整个互联网、靠激励驱动、不需要许可。这件事此前没人做成过。

注：这个 subnet 是 SN3 τemplar，做 LLM 去中心化预训练。截至 2026 年 4 月，τemplar 已成功训出 70B 参数级别的模型——证明"协作式预训练"在工程上可行，而不再只是论文里的设想。最近 Templar 刚刚跑路，后续我会专门出文章来讲。

例 3：GPU 出租（DePIN）

我们也做一些更标准、更"常规"的 DePIN 类问题——比如 GPU。能不能通过把 GPU 接进网络来挖矿？我们去验证你接进来的 GPU 是真货，再给你结算。

这个问题相对简单，没那么科幻，也不那么"AI"，但很酷。我们把同一套挖矿结构搬过来，套用在一种"实物商品"上，让全世界的 miner——比如挺多中国 miner——把 GPU 资源接上来。这些 GPU 在网络上被租出去——

结果：全世界最便宜的 GPU 价格。

因为我们把这个网络做成了不需要许可、没有国界、靠激励驱动的，所以我们能给出全世界最低的 GPU 单价。

注：Bittensor 上做 GPU 算力市场的代表性 subnet 包括 SN51 Lium（GPU 租赁市场，对标 Akash /io.net）和 SN4 Targon（可验证推理 + GPU 市场）。两者目前都稳居 top 5 by α 市值。

例 4：开源模型推理（Chutes）

这是一个跑在我们网络上的真实产品，同一个想法。这次 miner 提供的是推理——他们要提供一个能接收查询的 endpoint，我们看推理跑得多快，按速度结算。

很短时间内，我们在 OpenRouter 上成了全世界最大的开源模型推理提供方。这个网络——靠世界各地的人贡献跑起来的——现在跑的开源模型推理，比任何其他开源推理提供方都多。

有那么一段时间，我们这个网络跑 DeepSeek 的推理量，比 DeepSeek 自己跑的还多。

注：这是 SN64 Chutes，serverless GPU 推理子网。截至 2026 年 4 月，α 市值排名 #1，日处理 token 数超过 500 亿，年化收入超 200 万美金。

例 5：机器人 / 物理世界

我可以一个一个讲下去。

对机器人感兴趣的同学：我们能优化的不只是梯度、算力这种抽象的数字资源。激励计算这个域非常宽，因为我们处理的是真金白银的激励——不是机器学习里那种"reward 只是计算机里的一个数字"，而是真钱，可能是人类社会能量最抽象的那种形态：钱。正因为这样，物理的、数字的、夹在中间的所有东西都能优化——从芯片到 GPU 到梯度到软件，再到机器人。

举个例子：让 miner 提交机器学习模型，我们去测这些模型的表现，按表现给奖励。一架无人机在仿真里跑某个 miner 提交的 ML 模型，我们在一组环境里测它的表现，奖励那些能让模型在赛道上跑得最快的 miner。我们也在优化物理世界里的东西。

长尾清单

这个清单其实很长。Bittensor 上已经有项目在做：

炒美股信号 · 体育博彩预测 · 训运动物体识别 VLM · AutoML · 药物发现 · 天气预报 · Bitcoin 价格预测 · 量子计算 · Bitcoin 挖矿 · 3D 图像生成 · 数据理解 · 推理速度 · 大宗商品交易……

每一个都在用同一套机制——把"挖矿"换成"挖任何有用的东西"。

更深一层。

我们对网络说：你能造一个机制，而且这个机制对其他机制构成的市场有价值，那我们就用流动性来奖励你。

这相当于把强化学习套在它自己身上。

具体的实现叫 dynamic TAO（dTAO）——按每个 subnet "维持高价格"和"在生态里消耗、锁住 TAO" 的能力，给它分配流动性。换句话说，每个 subnet 之间从此进入赤裸裸的资本竞争：市场用钱投票决定哪些 subnet 该拿到下一轮 emission。

这一切，本质上就是把激励计算自我应用——网络用激励来选出最有价值的激励机制本身。

注：dTAO 于 2025 年 2 月正式上线。截至 2026 年 4 月，Bittensor 上有 128 个 subnet（这是当前的硬性上限）；

我们正在进入一个时代——可能是历史上头一回——一些有史以来最大的公司，员工只有一两千、三四千人。

OpenAI，一家千亿美元级的公司、可能是下一个超级独角兽，员工只有 3,000 人。基本一个人说了算。一个闭源实验室。你大概率这辈子都进不去，剩下能做的就是订阅它。

所有权力集中在一小撮人手里。他们做决策，你最后甚至不知道发生了什么。你不知道你的数据去了哪儿。你没有参与，你也不持有任何 OpenAI——它的轮次都是封闭的。

这种自上而下的世界——AI 被收拢进一小撮非常小的公司，他们抓着所有算力、所有数据，你什么都拿不到——正是大家想把我们带去的地方。

但当我们用"用钱去优化"的这种新技术来处理这些问题的时候，我们顺带做的事情是：

把所有权分散出去。把游戏规则摆到台面上让所有人看得见。

每个人都能进来，都能拥有，都能贡献，都能用一种不一样的方式接触这些数字商品——一种更公平、更开放的方式。

这才是我们做这件事的真正原因。也是为什么哪怕最终做成的不是 Bittensor，是别的项目——只要思路对，整个 AI 经济的形态都会因此改变。