「半年前还在和AI聊天,如今AI写的代码已超过人类历史总和」·

📋 摘要速览

本期聚焦AI编程范式的历史性转折——多位顶级科技领袖观察到AI生成的代码量已超越人类历史总和。同时，YC掌门人两小时微调397B大模型、Vercel CEO千人大调研揭示编程工具格局、Box CEO深度解析"任务≠工作"的就业逻辑，以及GitHub看板等实用工具推荐。

🎓 小白解读

AI写代码这件事，半年内发生了翻天覆地的变化。 以前我们用AI主要是聊天、问问题，现在AI已经开始大规模写代码了——有创业者说，2026年5月的今天，AI系统产出的代码量已经超过了人类历史上写过的所有代码之和。这不是科幻，是真的在发生。

YC（硅谷最牛创业加速器）的CEO自己动手，两小时就完成了一个397B参数超大模型的微调。 放在以前，这种事需要整个工程师团队干好几个月。现在一个人、一个下午就能搞定。这意味着"个人AI"时代真的要来了——每个人都能定制自己的超级AI。

Vercel CEO做了一个千人调研，让大家晒出用AI做的最自豪的产品。结果很有趣：OpenAI的Codex被提到的次数超过了Claude Code，但Anthropic的模型本身还是更受欢迎。说明编程工具这个赛场还在激烈竞争，没有谁真正坐稳了王座。

Box CEO写了一篇精彩分析：别把"能用AI完成某些任务"和"AI能取代整个工作"搞混了。工作不是任务的简单堆砌——当AI帮你干了琐碎活，你的工作会自然地升级到更高价值的事情上去。小公司以前雇不起营销团队，现在一个人+AI就能干出一个团队的活。就业不会消失，只是会进化。

还有一个实用的技巧：让AI在干活的时候维护一个"草稿日志"，记录它做的每一个决策和权衡。这样你事后一看就知道AI到底替你做了什么选择、漏了什么没告诉你——坏脾气程序员的自我修养。

📖 原文精选

🗣️ 半年前还在聊天，如今AI写的代码已超过人类历史总和

Can you imagine that we lived in a world 6 months (Nov 2025) ago when we would mostly just chat with LLMs and would be so happy about AI?? It's May 2026 and these LLMs now have produced more code than we have written over all time.

你能想象吗？2025年11月——仅仅半年前——我们还在为能和LLM聊上天而兴奋不已。现在是2026年5月，这些大模型产出的代码量已经超过了人类历史上写过的全部代码。

📎 Aditya Agarwal · X · 2026-05-23 · 查看原文^[1]

🗣️ YC掌门人两小时微调397B模型：个人AI时代来了

Thinking Machines is impressive. In a couple hours I just fine tuned my own Qwen3.5-397B model this afternoon. Fast usable multimodal is also going to enable very mind-blowing personal AI.

Thinking Machines 太厉害了。我今天下午只用几个小时就微调了自己的 Qwen3.5-397B 模型。快速可用的多模态能力还将催生出令人震撼的个人AI。

📎 Garry Tan · X · 2026-05-24 · 查看原文^[2]

🗣️ 别把任务当工作：Box CEO揭示AI时代真正的就业前景

We are constantly making the mistake of confusing task completion with AI with being able to eliminate the whole job. Even as we can automate one or many tasks within a job, the definition of the job almost inevitably just expands to do vastly more of those tasks.

我们一直在犯一个错误：把AI能完成某些任务，等同于AI能消灭整个工作。即便我们可以自动化工作中的一项或多项任务，这份工作的定义几乎必然会扩展——做更多同类任务、以更高品质完成、或者转向那些尚未被自动化的领域。

📎 Aaron Levie · X · 2026-05-23 · 查看原文^[3]

🗣️ Vercel CEO千人调研：编程工具格局正在重塑

Processed 1400 replies: OpenAI is catching up to Anthropic, 'Codex' got more mentions than 'Claude Code'. However, by model mentions, Anthropic is dominating.

处理了1400条回复：OpenAI正在追赶Anthropic，Codex被提及次数超过了Claude Code。但按模型提及量来看，Anthropic仍然碾压全场。

📎 Guillermo Rauch · X · 2026-05-24 · 查看原文^[4]

🗣️ 让AI写一份"草稿日志"，别再事后翻车

Tell codex to maintain a scratch-log while it works on bigger refactors with decisions it had to make, tradeoffs, review fixes, so later on you can read through which tradeoffs the agent made, what you forgot to specify.

让 Codex 在做大型重构时维护一份草稿日志，记录它所做的每个决策、权衡取舍、review 修复。事后你就能回顾AI替你做了什么选择，以及你忘了交代什么。

📎 Peter Steinberger · X · 2026-05-23 · 查看原文^[5]

🗣️ 他建了个GitHub看板，获得了676个赞

I always wanted a GitHub dashboard: See my repos, open Issues/PRs, what version I released last, how many commits since last release. So I built one for everyone.

我一直想要一个GitHub看板：一眼看到所有仓库、未关闭的Issue/PR、上次发布版本、距上次发布多少个commit。所以我给所有人做了一个。

📎 Peter Steinberger · X · 2026-05-24 · 查看原文^[6]

🗣️ 一句话让Claude Code帮你省钱

Every now and then I remember you can run the "please save me money" prompt and it will actually work.

每隔一段时间我就会想起来：你可以直接让Claude Code跑一句"请帮我省钱"，而且它真的有效。

📎 Thariq · X · 2026-05-24 · 查看原文^[7]

📖 今日术语

English	中文	解释
Fine-tuning	微调	在已有大模型基础上用特定数据继续训练，使其更擅长某个领域。就像让一个已经学会开车的人再专门练赛道驾驶
Reranking	重排序	对初步检索结果进行二次排序以提高精度，就像先从图书馆找到一堆书，再按相关度重新排列
Multimodal	多模态	AI能同时理解和处理文字、图片、音频等多种信息形式，而不是只懂文字
SOTA (State of the Art)	当前最优	在某个任务上表现最好的模型或方法
MVP (Minimum Viable Product)	最小可行产品	用最少功能做出的能用的产品版本，用来快速验证想法

参考链接

[1] 查看原文: https://x.com/adityaag/status/2058233900464238801

[2] 查看原文: https://x.com/garrytan/status/2058378310254793013

[3] 查看原文: https://x.com/levie/status/2058223867815227756

[4] 查看原文: https://x.com/rauchg/status/2058353051073970416

[5] 查看原文: https://x.com/steipete/status/2058308112134635528

[6] 查看原文: https://x.com/steipete/status/2058381186884411473

[7] 查看原文: https://x.com/trq212/status/2058377974882210096