乐于分享
好东西不私藏

AI时代的范式革命——数据库将成为新的软件

AI时代的范式革命——数据库将成为新的软件

每一次技术革命都遵循同一个规律:上一个时代的瓶颈,变成下一个时代的商品;而价值则迁移到新的稀缺资源上。大型机时代,硬件稀缺;PC 时代,操作系统稀缺;互联网时代,分发和触达稀缺;移动互联网时代,用户注意力稀缺。如今,AI 正以惊人的速度将「软件开发」本身从稀缺资源变为廉价商品。当代码可以按需生成、成本趋近于零时,真正稀缺的资源只剩一样——高质量的结构化数据。

这意味着:数据库将成为新的软件。人们将基于数据构建各种定制化应用,而不再被固定的软件形态所束缚。

当 AI 将软件开发成本压向零,应用层正在坍缩进数据层。

从互联网到移动互联网再到 AI 时代,一部「稀缺资源迁移史」正在重演。


软件曾经有多昂贵?

要理解即将到来的变革有多深远,我们必须先回顾软件曾经有多昂贵、多痛苦。

在互联网时代(1995–2007),企业要实现信息化,几乎只有两条路:购买大型商用软件套件(如 SAP、Oracle、Siebel),或者花重金定制开发。两条路都极为烧钱。据行业统计,一次中等规模的 ERP 系统实施平均耗资 280 万美元,约占企业年营收的 4.6%;而 SAP 的部署均价高达 550 万美元,财富 500 强的项目动辄超过千万美元、历时数年。定制化 Web 应用的开发成本在 5 万到 50 万美元之间,大型企业级开发商的时薪高达 400–800 美元。

更可怕的是失败率。Gartner 的研究表明,75% 的 ERP 项目未能达到预期目标;McKinsey 则发现超过 70% 的数字化转型未达成预期 ROI。这些不是小打小闹——好时巧克力(Hershey‘s)在万圣节旺季上线一套 1.12 亿美元的三合一系统(SAP + Manugistics + Siebel),结果导致 1–1.5 亿美元的订单无法履行、库存飙升 25%、股价单日暴跌 8%。耐克(Nike)的供应链管理软件灾难则酿成 4 亿美元的天价损失,Phil Knight 留下了那句经典的吐槽:「这就是 4 亿美元换来的结果?」

这种痛苦催生了 SaaS 模式。1999 年,Salesforce 在旧金山一间公寓里成立,打出了激进的「No Software」口号——不再需要在本地安装和维护软件。从 2005 年的 1.76 亿美元营收,到 2025 年的 379 亿美元,Salesforce 用二十年实现了约 32% 的年复合增长率。全球 SaaS 市场也从 2008 年的个位数十亿,膨胀到 2024 年的 2470–2500 亿美元。到 2023 年,企业平均使用 130 个 SaaS 应用。

SaaS 极大地降低了企业使用软件的门槛,但它并没有从根本上改变软件的生产经济学——它只是把开发成本从用户端转移到了厂商端。构建一个优秀的 SaaS 产品依然需要庞大的工程团队、数年的开发周期和数千万美元的投入。


移动时代:软件需求的爆炸

2008 年 7 月 10 日,iPhone App Store 上线,初始仅有 500 款应用。第一个周末就突破了 1000 万次下载。到 2013 年突破 100 万款应用;到 2025 年,苹果和谷歌应用商店合计托管超过 400 万个应用。Apple 向开发者累计支付了 3200 亿美元,其 App Store 在 2024 年促成了 1.3 万亿美元的总销售和计费。

关键数据:

  • 500 – App Store 初始应用数(2008)

  • 400 万+ – 苹果+谷歌应用总数(2025)

  • $3200 亿 – Apple 累计向开发者支付金额

  • $1.3 万亿 – App Store 年度总销售额(2024)

移动时代让「每家企业都需要一个 App」变成了刚需——但开发成本依然居高不下。一个中等复杂度的移动应用开发费用在 6 万到 15 万美元之间,耗时 3–6 个月;复杂应用则高达 15 万到 50 万美元以上。如果需要同时覆盖 iOS 和 Android 两个平台,成本几乎翻倍。上线后第一年的维护费用约占初始开发预算的 50%。一个类 Uber 应用的开发成本达 10 万到 50 万美元以上。

全球开发者数量从 2000 年的约 1000 万人增长到 2024 年的 2870 万人,其中中国以 700 万居首,印度 580 万,美国 440 万。但供给始终无法满足需求——仅美国一国,到 2026 年就面临 120 万开发者缺口。

软件始终昂贵,而每一家企业需要的软件都多于它能负担开发的量。这就是持续了三十年的核心矛盾。


AI 正在改写游戏规则

上述矛盾正在被 AI 编码工具以惊人的速度化解。证据不是零星的轶事,而是一组压倒性的数据。

AI 编码工具的爆发式增长

GitHub Copilot 在 2025 年 7 月突破 2000 万用户,拥有 470 万付费订阅者,被 90% 的财富 100 强企业采用。它为活跃用户平均生成 46% 的代码(Java 项目中高达 61%),代码留存率达 88%。微软 CEO 纳德拉确认,Copilot 的业务规模已经超过了微软当初 75 亿美元收购 GitHub 时整个 GitHub 的体量。

Cursor(Anysphere 公司)成为 SaaS 史上增速最快的公司——从 100 万美元到 20 亿美元以上 ARR 仅用了大约一年时间,估值达到 293 亿美元——而这一切最初只有 12 个人。超过一半的财富 500 强企业正在使用它。Lovable 在 60 天内从零达到 2000 万美元 ARR——欧洲创业史上最快的增长记录——不到一年估值达 66 亿美元。Replit 在推出 AI Agent 后,9 个月内从 1000 万美元跳到 1 亿美元 ARR,其 Agent 可自动化高达 90% 的基础代码任务。

「一个原本需要 10 万美元开发的软件应用,到 2030 年可能只需要 10 美分。」

—— Sam Altman, OpenAI CEO,2025 年 7 月美联储会议

效率提升的数据同样惊人。GitHub 的对照实验显示,使用 Copilot 的开发者完成任务速度快了 55%,Pull Request 周期从 9.6 天缩短到 2.4 天——缩减了 75%。McKinsey 发现开发者在简单任务上的编码速度可提升至 2 倍。Jellyfish 的报告显示,AI 采用率达到 80–100% 的团队生产力增幅超过 110%。到 2025 年,全球约 41% 的代码由 AI 生成。

最令人震惊的数据来自 Y Combinator:其 2025 年冬季批次中,25% 的创业公司代码库有 95% 由 AI 生成——而那一批恰恰是 YC 历史上增速最快、盈利能力最强的批次。Anthropic CEO Dario Amodei 说:「我公司里有工程师告诉我,‘我已经不写任何代码了,全部交给模型来写’。」微软 CTO Kevin Scott 则预测,到 2030 年将有 95% 的代码由 AI 生成。


编程的新语言:英语和中文

2025 年 2 月 2 日,特斯拉前 AI 总监、OpenAI 联合创始人 Andrej Karpathy 在一条被浏览了 450 万次的帖子中提出了一个概念:Vibe Coding(氛围编程)。他写道:「有一种新的编程方式,我称之为 vibe coding——你完全沉浸在氛围中,拥抱指数增长,忘记代码的存在……我只是看东西、说东西、运行东西、复制粘贴,大部分情况下它就能跑。」

这个概念当选了 2025 年柯林斯英语词典年度词汇。一年后,Karpathy 进一步提出了「Agentic Engineering」——一种人类指挥 AI 智能体、而非亲手写代码的新范式。他的预言已经变成了现实:「最热门的新编程语言是英语。」

NVIDIA CEO 黄仁勋在 2024 年世界政府峰会上更为直白:「我们的工作是创造这样的计算技术——让任何人都不需要编程,编程语言就是人类语言。世界上的每一个人现在都是程序员。」复旦大学在 2026 年春季学期专门面向非计算机专业学生开设了「生成式软件开发」课程,教授如何用自然语言和 AI 来「聊」出软件。

「未来的编程语言只会剩下两种,一种叫英文,一种叫中文。程序员这个职业将不复存在。」

—— 李彦宏,百度创始人


当软件成本归零,什么才有价值?

如果应用代码可以按需生成、成本趋近于零,那什么才具有真正的价值?答案越来越清晰:结构化数据以及它所编码的专有知识。

斯坦福教授、data-centric AI 运动的先驱 Andrew Ng 将这一转向称为「过去十年中与深度学习崛起同等重要的范式转移」。他的研究表明,投入改善数据质量的效果,相当于收集三倍数量的数据。他的框架——「AI 系统 = 代码 + 数据」,其中「价值的更高筹码在数据一侧」——已成为这一论点的学术基石。

市场正在大规模验证这一判断。

关键数据:

  • 50 万+ – Airtable 服务的组织数(含 80% 财富 100 强)

  • 1 亿+ – Notion 用户数(较 2022 年增长 5 倍)

  • 80%+ – Neon 数据库实例由 AI Agent 自动创建

Airtable 是「数据库即应用」范式的典型代表。它服务超过 50 万个组织(含 80% 的财富 100 强),年经常性收入约 4.78 亿美元,净美元留存率高达 170%。2025 年 6 月,Airtable 进行了一次自称为「重新创立」的 AI 转型,推出了 Omni——一个 AI 入口,用户只需用自然语言描述工作流程,Airtable 就能生成完整的数据库和应用界面。Notion 用户突破 1 亿(较 2022 年增长 5 倍),年营收约 4–6 亿美元,超过一半的客户为 AI 功能付费——这些 AI 功能将 Notion 的数据库转化为了动态应用。

数据基础设施层正在从下方「吞噬」应用层。Databricks 以约 10 亿美元收购了 Neon(Serverless PostgreSQL),并发布了 Lakehouse——一个嵌入数据湖仓的 OLTP 引擎。Snowflake 以约 2.5 亿美元收购了 Crunchy Data。两项收购发出了同一个信号:数据平台正在成为完整的应用平台。

最具说服力的统计数据:Neon 上超过 80% 的数据库实例由 AI Agent 自动创建,而非人类。正如 Databend 创始人张雁飞在中国科技媒体上所观察到的:「数据库的‘用户’已经从人,变成了模型和 Agent。」

当 LLM 变得越来越成熟时,它们也将迅速变得商品化……企业应当关注如何将这些模型与自身的数据相整合。

—— Microsoft WorkLab

投资机构也在重新校准框架。Activant Capital 指出,算力公司的总市值高达 12.7 万亿美元,而数据公司仅为 6000 亿美元——两者相差 21 倍——这强烈暗示数据被严重低估。

中国在政策层面走在了前面。2020 年,中共中央、国务院正式将数据列为继土地、劳动力、资本、技术之后的「第五大生产要素」。2023 年,国家数据局成立。2024 年,企业数据资源被允许纳入资产负债表确认——数据正式成为一种资产类别。2023 年中国数据产量达到 32.85 ZB,同比增长 22%。


软件正在变成「一次性用品」

当软件成本趋近于零的逻辑推演到极致,结果就是一次性软件——为某个特定场景生成、用完即弃的应用。这已经在发生。

a16z 合伙人 Anish Acharya 在 2025 年 8 月发表了一篇定义性文章:「当软件昂贵且难以构建时,我们基本只为严肃的事情创建它,并期望它能长久使用……但并非所有软件都需要是永久的或实用的。软件创作过去受限于投资回报率,现在仅受限于想象力。」他自己为孩子做了一个数学游戏,为家猫做了一个迷你 Instagram——「不是产品,不是创业项目」,而是「为特定受众量身定制的小应用」。

开发者 Benjie Holson 记录了一个极具象征意义的场景:他花了 10 分钟搜索一个卡片打印工具,没有找到合适的;然后他用 Cursor 花了 7 分钟自己构建了一个定制的 Web 应用。「我制作这个工具花的时间,比我寻找它的时间还短。」他的预言是:「未来的 LLM 将持续创建小型应用,运行它们,然后丢弃它们来完成单次任务。」

这种趋势已经延伸到了生产系统。Claude 的 Artifacts 功能让用户在对话中直接生成交互式应用——计算器、仪表盘、模拟器、表单——无需任何编码。Vercel 的 v0 可以从自然语言生成生产级的 React 界面。OpenAI 将 ChatGPT 变成了一个应用平台,第三方应用可以在对话内运行。有开发者构建了一个 AI Agent,可以在运行时修改自己的代码:朋友要求添加一个食谱本功能,当他发送一个 URL 时,Agent 自动抓取网页、解析食谱、通过 API 存储数据、更新界面——没有需求文档,没有部署周期。

技术壁垒的崩塌速度同样惊人:基于 API 的新功能的中位复制时间从 2017 年的 18 个月缩短到 2024 年的 2.4 周——技术优势的半衰期下降了 98%。

Morgan Stanley 在 2026 年 2 月将此称为「软件的三重恐惧」——DIY 软件、模型提供商取代应用、劳动力替代。AI 编码突破引发了超过一万亿美元的 SaaS 股票抛售,被称为「SaaSpocalypse」。

—— Fortune,2026 年 2 月报道


历史的韵脚:价值迁移的规律

软件到数据的价值迁移并非孤立事件,而是一个跨越 60 年的历史模式的最新一章。

时代
稀缺资源
核心资产
统治者
大型机(1960s–80s)
计算能力
硬件
IBM
PC(1980s–90s)
软件
操作系统
Microsoft
互联网(1995–2007)
分发与触达
平台/网络效应
Google
移动互联网(2007–2020)
用户注意力
应用生态
Apple
AI 时代(2020+)
专有数据
结构化数据与上下文
待定

1960s–1980s:大型机时代 – 计算能力极其稀缺,一台大型机价值数百万美元。谁掌控硬件,谁就掌控了技术世界。IBM 一度占据全球计算市场的 70% 以上。

1980s–1990s:PC 时代 – PC 将硬件商品化后,价值迁移到操作系统和应用软件。Windows + Office 的组合让微软登上顶峰,市值一度超过 6000 亿美元。

1995–2007:互联网时代 – Web 让软件的分发成本趋近于零。价值迁移到能够聚合流量和注意力的平台。Google 通过搜索入口掌控了互联网的注意力分配。

2007–2020:移动互联网时代 – 智能手机让互联网触达无处不在。稀缺资源变成了用户注意力和移动端入口。Apple 通过 App Store 生态系统控制了移动时代的价值分配。

2020+:AI 时代 – AI 将代码生成商品化。当任何人都能用自然语言生成软件时,真正的价值壁垒只剩下一样:高质量的结构化数据和专有上下文。数据库成为新的操作系统,数据成为新的代码。

科技分析师 Benedict Evans 追溯了这一模式的历史轨迹:「1970 年代,统治大型机意味着统治科技行业;1990 年代,统治 PC 操作系统意味着统治科技行业。现在不再如此。」Paul Kedrosky 在 2026 年 3 月提出了 AI 时代的对应关系:「大型语言模型是新的硅片,编排层是新的操作系统,应用是新的办公套件。」

一个值得关注的观察来自 FourWeekMBA 的分析:每次转型都「需要既有的脚手架——新系统在旧系统之上运行数年,然后经济逻辑才会完全反转」。前一个时代的领导者不会消失,而是被「超越但不被取代」。IBM 仍然统治着大型机市场,微软比以往更强大。数据库即软件的转型同样会是渐进的——但方向是确定的。

中国科技媒体 OFweek 的一篇分析文章以罕见的精确度表达了这一论点:「SaaS 某种程度上可以简化理解为‘数据库 + 业务逻辑’——它本质上是业务和数据之间的中间层。那为什么不让 AI Agent 直接「对话」数据库、接管逻辑呢?」


未来已来:从「定义软件」到「定义数据」

本文汇集的证据指向一个清晰的新兴范式:

定义数据模型 → AI 生成应用 → 数据库即平台

代码是临时的,数据是永恒的。

这不是关于遥远未来的预测,而是正在发生的现实:Airtable 的 Omni 正在从自然语言描述生成生产级应用;Neon 上 80% 的数据库实例由 AI Agent 创建;YC 创业公司拥有 95% AI 生成的代码库;开发者构建定制工具的速度比搜索现有工具还快。

从这项研究中浮现出三个关键洞察。第一,2026 年 2 月的「SaaSpocalypse」——一场万亿美元级的市场事件——标志着金融市场正式承认了技术界早已在说的事实:软件的护城河正在溶解。第二,中国的政策框架——2020 年将数据列为正式生产要素、2024 年允许数据入表——可能证明是有远见的,在西方充分认识到这一转型之前就将数据视为一等经济资产。第三,一个重要的反面证据值得关注:METR 的随机对照实验发现,经验丰富的开发者使用 AI 工具时实际上多花了 19% 的时间(尽管他们自认为更快了)。这说明转型可能会比最激进的预测更为曲折——但它不会改变方向。

稀缺资源正在迁移。在 AI 时代,谁掌控数据,谁就掌握真正的权力。

数据库,正在成为新的软件。