“未来属于那些敢于为真相支付带宽的人。”——Garry Tan,《The Light Cone》

信息时代的大爆炸并未带来认知的丰盈,反而制造了前所未有的注意力稀缺。
我们淹没在数据洪流中,却难以触及事实的核心。
而真正的分水岭正在显现:
未来不是人与人之间的竞争,而是人与机器协同效率的竞争——
更准确地说,是“谁更能驾驭信息带宽”的竞争。
前不久,YC总裁Garry Tan仅用五天、200美元API费用,重建了一个具备全网爬取、多源交叉验证与深度报告生成能力的博客平台。
十三年前,同样的功能需要10万美元、两人团队、三个月工期。
这不是技术奇迹,而是一种新范式的胜利:
Token Maxxing。
它并非“烧钱”,而是一种主权实践——
通过主动支付上下文成本,换取确定性输出;
通过最大化信息带宽,重构个人生产力边界。
在AI革命的深水区,技艺已死,洞见为王。
Token Maxxing的本质,正是知识资本家在信息时代构建“一人企业”的高杠杆操作系统。
一、Token不是成本,而是带宽:从MVP到MVC的认知跃迁
传统软件工程信奉“最小可行产品”(MVP):
用最少功能验证市场。
但在AI时代,这一逻辑已然失效。
Garry Tan的实践揭示了一个反直觉真相:
真正的效率不来自功能精简,而来自上下文丰度。
他称之为“最大可行上下文”(Maximum Viable Context, MVC)。
当模型被喂入完整的代码库依赖图、用户场景画像、失败路径预演和边界条件清单,其输出不再是概率猜测,而是接近确定性的工程解。
Token在此刻不再是消耗品,而是信息带宽的计量单位——
你愿意为多少上下文付费,决定了你能获得多高的输出保真度。
这解释了为何加州初中生无法学习代数的问题,在单信源下归因于“预算削减”,而在20个信源交叉分析后,暴露出教材垄断与师资短缺的结构性矛盾。
Token Maxxing的本质,是拒绝被简化、拒绝被代表,主动“煮沸整片海洋”以逼近真相。
在编程领域,这意味着:
- 不止提供函数签名,而是注入整个模块的调用链与错误处理逻辑;
- 不止生成单一测试用例,而是让AI构建覆盖80%以上执行路径的测试套件;
- 不止询问“如何实现登录”,而是先要求模型绘制数据流图、标注安全边界、模拟弱网环境下的用户体验。
这种范式转移,标志着从“功能交付”到“认知交付”的跃迁。
代码不再是技艺的终点,而是洞见的管道。
二、Thin Harness, Fat Skills:剥离代码执念,重构任务边界
Garry Tan提出一个颠覆性公式:
Thin Harness, Fat Skills。
这不仅是工程架构原则,更是认知手术刀。
这场认知手术的核心,是剥离工程师对“确定性代码”的执念。
传统开发试图用if-else堆砌解决模糊问题——
如“判断用户是否满意”——
结果是逻辑膨胀、边界漏洞频出。
而大语言模型的潜空间天然擅长处理意图、情感、文化语境等非结构化变量。
因此,真正的Agentic Engineering,关键在于精准划分任务边界:
- 确定性执行交给代码:如“拨打20个婚礼场地电话”,用Twilio API实现;
- 模糊推理交给LLM:如“策划一场让新人流泪的婚礼”,通过自然语言描述情感目标、宗教禁忌、预算弹性与时间窗口。
在AI时代,提示词就是新型代码,编排力就是新型架构能力。
那些嘲笑Garry Tan“只是兜售Markdown”的人,恰恰错失了这场范式革命的本质:
人类不再写代码,而是定义问题。
三、400倍效率:可测量的生产力奇点
“我现在写代码的速度是2013年的100倍。”Garry Tan曾如此宣称,引发质疑。
但他随后用“逻辑代码行数”重新测算:
实际是400倍。
依据来自软件工程经典研究:
专业工程师日均交付、测试并上线的有效代码仅30–50行。
他2013年兼职时日均14行;
如今通过指挥15个AI Agent,日均产出5600行——
相当于400名工程师的合力。
关键在于工作流的重构:
1. 启动“CEO Plan”技能:
模拟Brian Chesky的“10星体验”思维,定义产品理想形态;
2. 切换至“工程技能”:
要求模型先输出数据流图与状态机;
3. 生成代码+自动测试套件:
提交PR,无需人工逐行审查;
4. 批量验证:
累积一定数量后,调用Playwright自动化测试框架统一验证。
整个过程,人类仅做决策校准,机器完成执行与验证。
这不仅是效率提升,更是角色升维:从“执行者”变为“编排者”,从“工匠”变为“导演”。
Token Maxxing在此刻显现出其经济本质:
Token是你租用“百万年机器时间”的租金。
只要产出价值大于成本,就是无限杠杆。
四、双模型协同:构建你的“探针-棱镜”系统
Garry Tan的另一洞见在于:
不要迷信单一模型。
模型能力正在趋同,拉开差距的不再是“用哪个”,而是“如何组合”。
他观察到:
- Claude Code擅长高并发、多任务场景,但偶有幻觉;
- Codex类高智商模型则如沉默专家,精于底层调试与逻辑推演。
于是他构建“双探针系统”:
- 日常开发由Claude主导,负责产品规划、代码生成、测试编写;
- 遇顽固Bug时,调用Codex扫描全库,输出精准诊断;
- 诊断报告回传Claude,协同修复方案。
反之,若以Codex为主力,亦可临时召唤Claude担任“CEO角色”,提供战略视角。
这揭示了一个残酷现实:
真正的高手,手里握的不是锤子,而是整套光学仪器——
显微镜放大细节,望远镜俯瞰全局。
模型组合的复杂度,将成为个人IP的技术护城河。
五、控制权之争:Personal AI时代的计算主权
Garry Tan抛出终极问题:
“当Personal AI普及时,你是自己写Prompt,还是把决策权交给大公司的黑箱算法?”
回溯历史,个人电脑革命的核心并非硬件降价,而是普通人首次获得计算主权——
我的机器,我做主。
今天,我们站在同等拐点。
Personal AI革命的胜负手,在于三大主权:
- 数据主权:你的交互历史是否被平台收割用于训练?
- 集成自由:能否随意连接Notion、Stripe、Twilio等第三方服务?
- Prompt 所有权:你的“AI员工手册”是否可迁移、可复用、可继承?
若你不写自己的Prompt ,就会沦为算法牢笼中的被动节点——
信息流由Facebook决定,能力边界由API文档定义,人生选项由产品经理预设。
Token Maxxing因此成为一种抵抗姿态:
我愿意为完整上下文付费,因为我拒绝被简化、被代表、被黑箱化。
这不是消费行为,而是主权声明。
不是你在用AI,而是你是否拥有AI的“操作系统”。
六、行动切片:普通人如何构建高杠杆操作系统
Garry Tan强调:“我和大家没有本质区别,只是一个想把事情做成的人。”
Token Maxxing并非天才专利,而是可复制的方法论。
切片 1:从“最小提示词”升级到“最大上下文”
停止提问“怎么写登录功能”。改为:
“你是一名资深全栈工程师。用户是35岁职场妈妈,使用iPhone 14,网络不稳定。
请设计登录流程:支持邮箱+密码、Google一键登录、短信验证码。
要求:错误提示友好、加载状态明确、防暴力破解。
先画数据流图,再输出React+Node.js代码及Jest测试用例。”
上下文越厚,输出越确定。
切片2:建立你的“技能库”
将高频提示词存入Obsidian或Apple Notes,形成可复用资产:
- CEO Plan:模拟10星体验的产品规划模板;
- Debug Probe:全库扫描Bug的指令集;
- Research Synthesizer:跨信源交叉验证框架。
你的Prompt库,就是你的数字分身,也是你的一人企业核心资产。
切片 3:接受“Token即租金”的新经济
一天花费500美元API费?
Garry Tan的回答是:“不搬到旧金山的代价才更高。”
在AI时代,只要产出价值 > Token成本,就是正向杠杆。
高净值个体应视Token为生产资料租金,而非消费支出。
做局者,而非破局者
Garry Tan的故事,无关技术神话,而是一场认知升维。
他未发明新模型,未创造新框架,只是敢于把Token用到极致,把提示词当作核心资产,把控制权牢牢握在手中。
在AI革命的深水区,一人企业不再是微型公司,而是知识资本家的操作系统——
通过高杠杆内容,撬动无限杠杆;
通过洞见,穿越周期获得自由。
Token Maxxing的真正启示在于:
未来属于那些亲手编写Prompt、拒绝被算法驯化的人。
他们不做局中棋子,而是规则制定者。
你选择做局,还是被局做?
✦ 精选内容 ✦
我们比谁都更需要Palantir的技术实践,但不是因为马杜罗



夜雨聆风