AI走到哪一步了:能力、产业、冲击与历史坐标

2026年已经快过去一半了。这半年里，AI圈发生了太多事：DeepSeek把Token打到地板价、谷歌I/O全面押注智能体、高通单周暴涨40%、索辰科技连拉两个20cm涨停、红杉警告AI投入产出比失衡、22-25岁程序员就业降了近20%……

与此同时，A股AI赛道分歧剧烈：有人喊"物理AI是新主线"，有人说"全是概念炒作"，每天万亿成交背后，是市场在重新定价AI的未来。到底是革命还是泡沫？

过去一个多月，我们陆续写了好几篇AI应用的文章，从"成本归零催生十倍赛道"，到"当整个行业都在涨价，DeepSeek偏不"，再到赛道标的的逐一梳理。今天这篇文章，我想用五个维度把这些碎片拼成一张完整的图——AI到底走到哪一步了？

能力——从"能聊天"变成了"能干活"

2022年底ChatGPT横空出世的时候，大多数人第一次意识到AI能像模像样地聊天。现在三年半过去了，AI早就不满足于聊天了——它想替你干活。

这个转变的核心是Agent。

AI不再只是回答你的问题。它能订机票、写代码、操作电脑、帮你处理邮件、安排会议、整理数据——它不光要"懂"，更要"动手"。

先说好消息。2024年初，最领先的模型在SWE-bench Verified（一个用真实GitHub bug来测试AI编程能力的基准）上得分不到5%。现在Anthropic的Claude Sonnet 4在高算力模式下做到了80.2%。80%的真实bug，AI能自己找出来并修好。抽象推理进步也很大。OpenAI的o3在ARC-AGI上从GPT-4o的5%直接飙到87.5%。

更关键的是，成本在以让人眩晕的速度往下掉。2023年初，同等智能水平下大模型推理成本大约是每百万Token 60美元。2025年降到了6美分。到2026年中，DeepSeek直接把输入价格打到每百万Token 0.025元人民币——大约0.0035美元。

从2023年到2026年，累计降了差不多10000倍。哪怕只看2025到2026这一年，也降了约10倍。注意我的用词——不是1/10的成本，是1/10000的成本。

但能力在进步，不等于已经"靠谱"了。

2024年，AI在真实电脑环境中完成任务的成绩最高只有12.24%。到了2026年，Gemini 3.1 Pro在OSWorld-Verified上做到了76.2%——质的飞跃。但76%还不是95%。在需要零失误的商业场景里，这个失败率依然太高。

还有一个容易被忽略的事实：虽然88%的组织声称已采用AI，但真正部署AI Agent来执行完整业务流程的比例，在所有业务职能中都低于10%。企业和个人"试试AI"的热情很高，但让AI真正嵌入核心业务流程——那是另一回事。

另外，AI"一本正经地胡说八道"的老毛病，两年半了，从根本上没治好。

AI正从"对话"跨越到"行动"，这一步的方向是对的。成本降了10000倍，Agent成功率从12%涨到76%，都是实打实的进步。但76%到95%之间还有段路，幻觉问题也还在原地。

产业——万亿砸下去，是真金还是虚火

2024年，头部科技公司在AI基础设施上花了约2000亿美元。2025年，超过3000亿美元。到2026年，微软、谷歌、Meta、亚马逊四大巨头合计的AI资本开支超过7000亿美元。

做个对比——1995到2001年整个电信泡沫期间，上市运营商的累计资本支出也就5000多亿美元。现在AI的资本开支，光2026年一年就可能超过那个数字。

英伟达是这波浪潮最早的的赢家。2026财年全年营收2159亿美元，增长65%。第四财季单季营收681亿美元，数据中心业务一个季度就贡献了623亿美元。利润率仍然慷慨得吓人。

但7000多亿砸下去，赚回来多少？

红杉资本给过一个震撼数字：AI产业存在6000亿美元的收入缺口——每投入1美元AI基础设施，目前只能赚回约0.25美元。到了2026年，这个数字变得更极端了：四大巨头的AI投入预计达7250亿美元，而AI服务收入仅约250亿美元。投入产出比从1:0.25变成了大约1:0.03。

说人话就是基础设施的钱花得越来越猛，应用端的收入追得气喘吁吁。

但这不完全是空转。英伟达2159亿美元的营收是实的，利润率也是实的。这和2000年互联网泡沫"有流量没利润"的逻辑完全不同。这次的问题不是"没有利润"，而是"有利润，但远不够填投入的坑"。

泡沫还是不泡沫？

和互联网泡沫有几个本质区别。互联网时代，无数烧钱的小公司在纳斯达克上市，很多连收入都没有。这次烧钱的主力是微软、谷歌、Meta、亚马逊——每一家都有极其健康的现金流，每一家都不会因为AI烧钱而倒闭。

但是，分析师预测四大巨头的自由现金流在2026年可能下降高达90%。巨头也扛得住，但不是不疼。

值得注意的信号是：热钱的流向正在变化。

我们在之前文章里反复提到，DeepSeek把Token价格打穿，本质上是在用技术把上游成本压下来，把利润空间让给下游。红杉说的6000亿收入缺口，恰恰是下游应用层的投资机会——当基础设施已经跑得太远，最大的红利会从"卖铲子"转向"用铲子创造新价值"。

A股市场的反应也在印证这一点。最近一段时间，AI医疗、AI教育、AI智能终端等应用方向明显在吸引增量资金，而纯算力方向开始分化。

英伟达的利润是真的，产业规模也是真的。问题是基础设施跑了太远，应用还没追上。但这也是投资机会所在——当所有人都盯着上游时，下游正在酝酿最大的结构性变化。

冲击——白领先挨刀

历史上每一次技术革命，都是机器替代体力、人类转向脑力。工业革命让纺织工下岗但创造了工程师，自动化让流水线工人失业但催生了程序员。

AI反过来了。它先冲着白领来。

编程、写作、翻译、法律研究、数据分析——这些恰恰是AI最擅长的。麦肯锡的研究早就指出，生成式AI对知识型工作的影响远大于体力劳动。

斯坦福HAI 2026年报告显示：22-25岁的软件开发人员就业人数，自2024年以来下降了近20%。近20%——不是预测，是已经发生的事实。

企业对未来的预期更说明问题。约三分之一的组织预计AI将导致员工总数减少。预期缩减最严重的三个职能是：服务运营、供应链管理、软件工程。

不过，在几乎所有职能领域里，企业"预期"要缩减的人数都超过了"已经"缩减的人数。这说明很多企业对AI替代人力的预期可能过于乐观了——至少目前如此。但生产力提升也是真的。客服支持效率提升14-15%，软件开发效率提升26%，营销产出提升50%。

还有一个值得注意的发现：斯坦福报告特别指出，有初步证据表明过度依赖AI可能带来长期学习代价——用AI越多，自己学得越慢。这对初级从业者来说尤其是个风险。

AGI还远不远

AGI，全称是通用人工智能。用人话讲，就是“一个AI什么都能干，而且干得比人好”。

一提到这个，很多人脑子里的画面是《终结者》《黑客帝国》——机器人觉醒、反抗人类。但目前在AI圈子里吵的AGI，其实分两类人：一类人想的是“AI能不能把所有工作都自动化，让人类彻底不用干活”；另一类人想的是“AI能不能在每个领域都达到专家水平，但依然是人类的工具”。

OpenAI的Sam Altman说AGI是“在大多数有经济价值的工作上超越人类”——这是算经济账的。Meta的LeCun说，光会聊天不算，得真正理解物理世界才算。而ARC-AGI测试的创始人Chollet说，聪明不是看你知道多少，而是看你学新东西有多快。

定义不一样，时间表自然对不上。说AGI快到的，讲的是“AI能帮人干很多活”。说AGI还远的，讲的是“AI离真正理解世界还差得远”。

一个实验最能说明问题。

有个叫ARC-AGI的测试，专考AI的抽象推理能力，普通人能轻松拿95分以上。GPT-4o一开始只得5分，后来o3冲到了87.5分——看起来飞跃了。但测试方出了一个更难的第二代，o3预估直接掉到30分以下。

这说明什么呢？AI确实在变聪明，但它更像是一个“超级刷题王”——给它练过的题型，它无敌；换个新题型，它就不灵了。离人类那种“举一反三”的悟性，还有距离。

治理比技术更让人头疼。

技术圈还在吵时间表，监管已经远远跟不上了。

全球三个大经济体走出了三条完全不同的路：欧盟最严，违规最高罚3500万欧元，走“权利优先”；中国管得最细，从算法推荐到深度合成都有专门法规，走“国家管控”；美国到现在联邦层面还没有一部全面的AI立法，基本靠公司自觉。

结果是跨国企业谁都不敢动——欧盟要数据追踪，中国要数据本地化，美国没有统一标准。全球AI治理各管各的，短期内看不到统一趋势。

国内这边倒是动作很快。5月国家发改委明确说正谋划“人工智能+”配套文件，要推动央国企开放AI应用场景。三部门联合印发了智能体规范发展实施意见。四部门在推AI和能源的双向赋能。国务院2026年立法计划里，AI综合性立法也被明确提上了日程。

对投资者来说，AGI远不远没那么重要。

监管框架加速成形，意味着合规成本将成为行业分水岭。那些已经深度绑定央国企、具备信创资质的公司，长期受益确定性更强。与其赌科幻片里的机器人什么时候来，不如看眼前的：哪些公司在用AI赚钱，哪些还在烧投资人的钱讲故事。

我们之前梳理过——汉得信息AI收入一年翻三倍，新大陆的AI智能体已经在真实商户场景落地。理论上这些才是AGI这场大戏里，目前最能看得到真金白银的地方，但事实不见得是这样，传统业务被吞噬，产品与领先大模型厂商的差距再被扩大。

拿互联网和移动互联网的尺子，量一量AI

要回答"AI走到哪一步"，光看它自己不够——得用历史的尺子量一量。

第一把尺：资本开支——比互联网还猛

1995到2001年电信泡沫期间，上市运营商累计资本支出超过5000亿美元。AI呢？2026年四大巨头资本开支超过7000亿美元。光一年的投入就可能超过整个互联网泡沫时期的总和。

第二把尺：渗透率——大概在互联网的1997年

红杉2024年估算AI在企业端的"真正采用率"约10-15%。斯坦福HAI 2026年报告说88%的组织在"使用AI"，但AI Agent在所有职能中的部署率不到10%。试试和真正用起来，不是一回事。

从渗透率看，基础建设可能已经进入了下半场，AI应用才刚刚出场。

第三把尺：泡沫信号——这次不一样？

互联网泡沫：纳斯达克从不到800点涨到5048点，5年涨5倍多。然后崩盘——两年跌掉78%。

AI的泡沫信号确实出现了。股票集中度极高，投资强度极大。但和互联网泡沫有几个本质区别：利润是真的（英伟达一个季度681亿美元），成本在暴跌（10000倍），烧钱的是巨头不是散户。

移动互联网那面镜子

iPhone发布（2007）→ App Store上线（2008）→ iPhone 4引爆（2010）→ 应用全面爆发（2013）。

ChatGPT发布（2022底）→ GPT API/插件生态（2023）→ GPT-4o/DeepSeek引爆（2024-2025）→ 应用爆发（？）

从突破性产品到应用爆发，移动互联网用了约6年。AI从ChatGPT算起才3年半。

申万宏源的研究指出，当前AI产业类似于移动互联网的2010年——"iPhone 4时刻"：硬件和平台已经证明价值，但应用还处于"0到1"的早期阶段。

我们在之前的文章里反复提到一个历史规律：电力便宜后，最大的赢家不是发电厂，是用电造汽车的福特；晶体管便宜后，最大的赢家不是造芯片的，是装进电脑里的微软和装进手机里的苹果。现在Token便宜了，最大的机会在"用Token创造新东西"的人身上。

这与中金公司的框架完全一致：AI正处在"基础设施期"向"渠道为王期"过渡的阶段——基础设施投入拉满了，但AI如何触达普通用户、嵌入日常工作流，还没有定型。

三把尺子加一面镜子的答案：

资本开支对标互联网1998-1999年，渗透率对标1995-1997年，泡沫信号对标1998-1999年（但基础更实），移动互联网对标2010-2011年。

方向一致：基础设施投完了，渗透率刚起步，泡沫信号（局部泡沫肯定存在，特别是基础设施这一块）出现但基本面更扎实，杀手级应用尚未出现但正在酝酿。AI正处在从概念到落地的关键过渡期。

就像1999年的互联网：泡沫信号已现，但真正改变世界的应用，恰恰是在泡沫破灭之后才长出来的。

关注我，还有更多有价值的信息！！！

写在最后

五个维度看完，"AI走到哪一步了"的答案比任何一个单一判断都复杂，但方向是清晰的。

能力上，AI正从聊天转向干活，成本降了10000倍，Agent从12%涨到76%——进步是实打实的，但"能用"到"好用"之间还有距离。

产业上，2026年四大巨头砸下超7000亿美元，但投入产出比大约只有1:0.03——基础设施跑太快了，应用还没追上。而我们反复论证过，最大的机会恰恰在应用层：企业级AI智能体、AI智能终端、AI教育、AI医疗……这些方向正在被DeepSeek的Token降价点燃。

冲击上，AI先冲着白领来，初级程序员已经感受到了。但大规模失业还没出现。用AI的人和不用AI的人，正在分化成两个群体。用AI的公司和不用AI的公司，也正在分化成两个群体——我们梳理过的A股AI应用标的中，那些已有真实AI业务收入的公司，与纯概念炒作的公司，差距会越拉越大。

AGI上，乐观派和怀疑派继续吵，但真正的危机不在技术时间表——全球治理的高度碎片化，以及国内政策框架的加速成形，才是投资者最该关注的事。

历史坐标上，AI大概在互联网1999年、移动互联网2010-2011年的位置。杀手级应用还没影，但应该不远了。

这不是"AI还行但跟你没关系"的阶段，也不是"AI已经改变一切"的阶段——这是最关键的过渡期。

1999年说"互联网改变世界"是泡沫。2026年说同样的话，没人会反对。

AI大概率也是这个剧本。而我们之前的结论仍然站得住：核心仓位，应该放在那些能用廉价Token定义新交互、新内容、新服务的应用企业上。

之前关于AI应用的文章

成本归零催生十倍赛道

AI应用六大赛道全梳理

风险提示： 以上为产业趋势的推演与观察，不构成具体投资建议。文中涉及的所有A股公司仅为逻辑验证样本，AI技术演进路径、行业竞争格局、商业化节奏均存在不确定性，投资决策请结合个人风险承受能力审慎判断。