
昨天有一篇英文文章叫做 Why TAO is the Bitcoin of AI 反响很高,讲的就是 Bittensor 是如何将 Bitcoin 的逻辑应用到 AI 上的。本来我也准备专门写写这个话题,那我就利用一段当时 Bittensor 创始人 Jacob 在清华大学的演讲来聊聊 Bittensor 和 Bitcoin 的关系是什么,以及为什么 AI 是非常好的应用场景。
去年 10 月份,Bittensor 创始人 Jacob 一行来到中国,我们和他们一起去了上海,北京,杭州,深圳,香港,并且在几个主要的高校都组织了演讲,包括上海交大,复旦,北大,清华,深圳,港科大。

我也是在听了不下 10 次 Jacob 的 presentation 之后才真正理解了 Bittensor 的本质,具体大家可以看我写的上一篇文章。

Jacob 有一个 80 多页的 PPT,但是他每次分享都不是固定的,会根据听众的情况来作出调整,同时每次分享完在回酒店的路上他都会和我们一起复盘今天的 pitch 怎么样,听众的反馈是怎样的,下次应该作出哪些调整。因此,虽然听了不下十次,基本每次的 presentation 都是不一样的。
其中我认为最好的一次应该是在北大的分享:虽然当时申请到的教室比较小,但是却难掩学生们的热情,大家听完 Jacob 的分享之后和他进行了很多高质量的思想碰撞和交流,Jacob 当时甚至专门发了一条推来纪念那一次的分享,我想这应该是他在整个校园行当中最难忘的一次。

只可惜那次我们没有专业的设备,没有将 Jacob 的演讲录下来,我们这次就以他在清华大学的演讲为蓝本,来讲讲到底 Bittensor 和 Bitcoin 的关系是什么。为了增强可读性,我并没有逐字进行翻译,主要是以达意为准。也强烈推荐大家去看下我们在 YouTube 上发的原视频:
https://www.youtube.com/watch?v=yRzc-WTyXXw&t=6s

要理解 Bittensor 是什么,先回到 2010 年看一眼。
那一年,AI 一点都不火,神经网络被认为是个走不通的方向。当时业内做手写数字识别(MNIST)的方法很"工程化":先人为定义 "数字应该长什么样"——找曲线、找直线、计算线条数量和长度——再写一个数学函数把这些特征手工映射到 0 到 9。最好的论文做到了 97% 的准确率,但其实挺烂的。
转折点是 2012 年的 AlexNet。它的核心创新是:
不再事先定义"答案应该长什么样",而是让模型自己在一个不断适应的过程里学出来。
搭一个神经网络,定一个目标函数(错误率),喂数据进去跑,得到 loss,用梯度更新权重——一个循环。让它跑下去,loss 慢慢下降,网络慢慢变好。
MNIST 被这套方法彻底打穿。从那之后,整个 AI 领域就再也没有停下来。
这套结构强在哪里?强在它普适。同样的 pattern 在很多地方都能看到:
强化学习:环境 → agent 做动作 → reward 回来更新参数。一个 feedback loop,能跑十亿次。
遗传算法:基因码 → 评估 → 选种群 → 越来越好。
生物界:黏菌放进迷宫,能顺着燕麦的蛋白质气味梯度生长,最后真能找到最短路径。这就是最朴素的"对奖励的适应"——也是生物界里最底层的"智能"。
物质世界本身:树怎么长、叶脉怎么铺、闪电是什么形状、河流三角洲怎么形成——本质上都是某种"获取能量、调整自己、维持自身结构"的体系。
把这些放在一起看,你会发现它们本质上是同一个东西:
state · objective · feedback · adaptation · loop
状态、目标、反馈、适应、循环——然后让它疯狂迭代。
这是世界结构最底层的一种 pattern。现代机器智能的所有突破,本质上都是在借力同一个 pattern。

我在 DARPA 做神经形态芯片的那几年,研究的就是这种"自适应"的行为。同一时期我在学 Bitcoin。然后我意识到一件事:
Bitcoin 也是这个 pattern 的一个例子——不是作为一种货币,而是作为一个网络。
Bitcoin 是一台自适应的计算机,是一个生产 hash 的网络。机制极其简单:
矿工产 hash → 网络发 BTC 作为奖励 → 验证 hash 看你产得多快 → 按速度结算
这就是 Bitcoin 的全部。它就是用这套结构来保护这个网络的——一个被设计成"按状态-目标-反馈-适应-循环来产 hash"的自适应系统。
Bitcoin 是世界上最大的超级计算机
为什么这件事值得重点讲?看几组数字:
Bitcoin 的算力是美国最大六家算力供应商加起来的 1,000 倍
它每秒产 10²¹ 次 hash——一个大到屏幕都写不下的数字
它持续耗电 23,000 兆瓦——和泰国整个国家的耗电量是一个量级,一个一亿多人口的国家
更值得拆解的是它的"效率":
美国最大六家算力厂 Bitcoin 网络 投入资本 ~1 万亿美元 500 亿 - 3,000 亿美元 产出算力 ~1,000 exaflops ~450,000 exaflops
也就是说,在"产 hash"这件事上,Bitcoin 比那些标准化算力公司高效 700 到 9,000 倍。
而且这个网络是完美高效的——Bitcoin 价格涨,矿工立刻产更多 hash。
Bitcoin 凭什么这么能打?
把 Bitcoin 当成一台计算机来看,它的几个关键特征解释了为什么它能跑出这种规模:
没有国界。 你在哪儿都行,一台笔记本就能挖。它能调动地球上每一个国家的资源。
永远在跑。 没有开市收市,周末也不歇。7×24 不停,竞争激烈,永远在自我优化。
完全自治。 没有人在中间发号施令。
不需要许可。 不用问任何人就能进。它就只是从电网里拼命拉电。
最后这条尤其关键。一家正常公司做不到这种效率——它要养 HR、要审身份、必然带偏见——你哪个学校毕业的、哪个国家来的,公司都会问。Bitcoin 不在乎。它只在乎你能不能产 hash。
这是它高效的根本原因。它是一个纯粹的市场——你产 hash 越多,赚得越多,能投多少算力、回报多少,全部算得清清楚楚。

把上面这些拼起来,可以给这种新现象起一个名字:激励计算(incentive computing)。
机器学习是一种计算,强化学习是一种学习,遗传算法是一种计算——激励计算也是一种计算。它和前面这些方法本质上是同一个 pattern:定义状态、定义目标、给反馈、让系统自适应。区别在于,激励计算把"反馈"换成了真金白银的激励。
这个区别看起来小,但它是整件事跑得猛的关键——传统机器学习里的 reward 是计算机里的一个数字,你不能用它去推动地球上 200 个国家的人替你做事。Bitcoin 把这个 reward 换成了真钱,于是整个地球都被变成了挖矿网络。
但我们其实根本不需要 hash——hash 在 Bitcoin 之外是没用的。我们想要的是任何东西。
如果能把"造出全世界最大超级计算机"那一套机制,搬去做存储、做算力、甚至做机器学习本身——会怎么样?
这就是我们想回答的问题。

我们把 Bitcoin 拆开看:矿工产 hash · 验证者验 hash · 网络给矿工发币。
把它通用化:
矿工做任何工作 · 验证者验任何工作 · 网络给矿工铸造数字货币
这就是我们做的 Bittensor。它本质上是一个平台——你可以在上面构造任何形式的激励计算。它就像一个 PyTorch、一种语言——一种用来构造激励计算的语言。
具体怎么跑?跟 Bitcoin 非常像:
注册一个 miner,绑一个加密密钥
miner 做点事,这些事被 validator 拿走去验
validator 按一套预先定好的规则给你打分
结果上链,链上对"哪些 miner 干得好"达成共识
按你在曲线上的位置发奖励
每个 miner 都在往网络里输出某种有价值的东西——可能是存储、可能是算力、可能是模型、可能是数据。validator 一直在度量他们各自带来了多少价值,给他们排序。这是一个自适应的系统——差的 miner 被淘汰,新的接上去,整个网络在循环换血。
你可以把它看成遗传算法、强化学习,也可以看成机器学习里的梯度下降问题——从优化角度有很多种类比。但它本质上是建在 miner 真实生产力之上的。

讲到这里,激励计算的"理论"部分就讲完了。下面看 Bittensor 上已经在跑的真实例子——这才是这个框架是否成立的真正证据。
例 1:写代码(SWE-Bench)
Bittensor 上有一个网络,挖的不是 hash,挖的是会写代码的能力——基本上就是 Cursor 在做的那种 intelligence model。
机制大概是这样:miner 提交 AI agent → agent 在 SWE-Bench 上被评测 → 按表现给奖励,奖励是数字 token。
这个机制没有给 agent 设计解法。它只是把"激励"写出来,让 agent 在这套激励下被进化出来。
没有任何工程师,没有任何"算法设计"——这个网络跑出来的 agent,在 SWE-Bench 上的成绩比 Claude、比 OpenAI、比任何闭源开源模型都更强。
谁做的?我们也不知道。世界上某个不知名的人,写了 7,000 行代码——一个 7,000 行的 AI agent——能 embed 文件、grep 文件、用 git 应用 diff,把 SWE-Bench 成绩拉了上去。
这一刻给我的感觉,跟 2012 年神经网络第一次在 MNIST 上跑通的那一刻非常像。
这是一个没有任何工程师的 AI 实验室。这个实验室不去定义"问题怎么解"——它只定义激励。
奖励还挺可观。这个 subnet 上的头部 miner,一天能挣 6 万美元。没有 HR、没有 VC、没有营销——所有钱直接通过网络付给真正在做优化、真正在解决问题的人。
注:这个 subnet 是 SN62 Ridges AI,专做 AI 软件工程 agent。截至 2026 年 4 月,α 市值在 Bittensor 全网排在 #7 左右,是激励计算在"AI agent"这条赛道上跑得最远的一个证明。
例 2:跨互联网协同训练 700 亿参数模型
要训出真正有分量的神经网络,必须训得动超大模型。手上没有几万张 GPU,基本就别想跟闭源实验室硬碰硬。
但如果一群人能把各自的 GPU 凑起来,理论上就能合训一个一样大的模型,每个人不用各自扛全部成本。
那能不能给"训这种模型需要的梯度"建一个市场?
机制:miner 产梯度 → validator 检查梯度有没有让 loss 下降 → 按表现结算。
我们正在一个 700 亿参数的模型上训,跨整个互联网。 不需要许可,世界上任何人都能贡献,没有白名单。你只要能比别人更快地产出一个让 loss 下得更快的梯度,网络就给你付钱。
这是把 Bitcoin 挖矿那一套搬过来训机器学习模型——完全去中心化、跨整个互联网、靠激励驱动、不需要许可。这件事此前没人做成过。
注:这个 subnet 是 SN3 τemplar,做 LLM 去中心化预训练。截至 2026 年 4 月,τemplar 已成功训出 70B 参数级别的模型——证明"协作式预训练"在工程上可行,而不再只是论文里的设想。最近 Templar 刚刚跑路,后续我会专门出文章来讲。
例 3:GPU 出租(DePIN)
我们也做一些更标准、更"常规"的 DePIN 类问题——比如 GPU。能不能通过把 GPU 接进网络来挖矿?我们去验证你接进来的 GPU 是真货,再给你结算。
这个问题相对简单,没那么科幻,也不那么"AI",但很酷。我们把同一套挖矿结构搬过来,套用在一种"实物商品"上,让全世界的 miner——比如挺多中国 miner——把 GPU 资源接上来。这些 GPU 在网络上被租出去——
结果:全世界最便宜的 GPU 价格。
因为我们把这个网络做成了不需要许可、没有国界、靠激励驱动的,所以我们能给出全世界最低的 GPU 单价。
注:Bittensor 上做 GPU 算力市场的代表性 subnet 包括 SN51 Lium(GPU 租赁市场,对标 Akash /io.net)和 SN4 Targon(可验证推理 + GPU 市场)。两者目前都稳居 top 5 by α 市值。
例 4:开源模型推理(Chutes)
这是一个跑在我们网络上的真实产品,同一个想法。这次 miner 提供的是推理——他们要提供一个能接收查询的 endpoint,我们看推理跑得多快,按速度结算。
很短时间内,我们在 OpenRouter 上成了全世界最大的开源模型推理提供方。这个网络——靠世界各地的人贡献跑起来的——现在跑的开源模型推理,比任何其他开源推理提供方都多。
有那么一段时间,我们这个网络跑 DeepSeek 的推理量,比 DeepSeek 自己跑的还多。
注:这是 SN64 Chutes,serverless GPU 推理子网。截至 2026 年 4 月,α 市值排名 #1,日处理 token 数超过 500 亿,年化收入超 200 万美金。
例 5:机器人 / 物理世界
我可以一个一个讲下去。
对机器人感兴趣的同学:我们能优化的不只是梯度、算力这种抽象的数字资源。激励计算这个域非常宽,因为我们处理的是真金白银的激励——不是机器学习里那种"reward 只是计算机里的一个数字",而是真钱,可能是人类社会能量最抽象的那种形态:钱。正因为这样,物理的、数字的、夹在中间的所有东西都能优化——从芯片到 GPU 到梯度到软件,再到机器人。
举个例子:让 miner 提交机器学习模型,我们去测这些模型的表现,按表现给奖励。一架无人机在仿真里跑某个 miner 提交的 ML 模型,我们在一组环境里测它的表现,奖励那些能让模型在赛道上跑得最快的 miner。我们也在优化物理世界里的东西。
长尾清单
这个清单其实很长。Bittensor 上已经有项目在做:
炒美股信号 · 体育博彩预测 · 训运动物体识别 VLM · AutoML · 药物发现 · 天气预报 · Bitcoin 价格预测 · 量子计算 · Bitcoin 挖矿 · 3D 图像生成 · 数据理解 · 推理速度 · 大宗商品交易……
每一个都在用同一套机制——把"挖矿"换成"挖任何有用的东西"。

更深一层。
我们对网络说:你能造一个机制,而且这个机制对其他机制构成的市场有价值,那我们就用流动性来奖励你。
这相当于把强化学习套在它自己身上。
具体的实现叫 dynamic TAO(dTAO)——按每个 subnet "维持高价格"和"在生态里消耗、锁住 TAO" 的能力,给它分配流动性。换句话说,每个 subnet 之间从此进入赤裸裸的资本竞争:市场用钱投票决定哪些 subnet 该拿到下一轮 emission。
这一切,本质上就是把激励计算自我应用——网络用激励来选出最有价值的激励机制本身。
注:dTAO 于 2025 年 2 月正式上线。截至 2026 年 4 月,Bittensor 上有 128 个 subnet(这是当前的硬性上限);

我们正在进入一个时代——可能是历史上头一回——一些有史以来最大的公司,员工只有一两千、三四千人。
OpenAI,一家千亿美元级的公司、可能是下一个超级独角兽,员工只有 3,000 人。基本一个人说了算。一个闭源实验室。你大概率这辈子都进不去,剩下能做的就是订阅它。
所有权力集中在一小撮人手里。他们做决策,你最后甚至不知道发生了什么。你不知道你的数据去了哪儿。你没有参与,你也不持有任何 OpenAI——它的轮次都是封闭的。
这种自上而下的世界——AI 被收拢进一小撮非常小的公司,他们抓着所有算力、所有数据,你什么都拿不到——正是大家想把我们带去的地方。
但当我们用"用钱去优化"的这种新技术来处理这些问题的时候,我们顺带做的事情是:
把所有权分散出去。把游戏规则摆到台面上让所有人看得见。
每个人都能进来,都能拥有,都能贡献,都能用一种不一样的方式接触这些数字商品——一种更公平、更开放的方式。
这才是我们做这件事的真正原因。也是为什么哪怕最终做成的不是 Bittensor,是别的项目——只要思路对,整个 AI 经济的形态都会因此改变。



夜雨聆风