2026年已经快过去一半了。这半年里,AI圈发生了太多事:DeepSeek把Token打到地板价、谷歌I/O全面押注智能体、高通单周暴涨40%、索辰科技连拉两个20cm涨停、红杉警告AI投入产出比失衡、22-25岁程序员就业降了近20%……
与此同时,A股AI赛道分歧剧烈:有人喊"物理AI是新主线",有人说"全是概念炒作",每天万亿成交背后,是市场在重新定价AI的未来。到底是革命还是泡沫?
过去一个多月,我们陆续写了好几篇AI应用的文章,从"成本归零催生十倍赛道",到"当整个行业都在涨价,DeepSeek偏不",再到赛道标的的逐一梳理。今天这篇文章,我想用五个维度把这些碎片拼成一张完整的图——AI到底走到哪一步了?
能力——从"能聊天"变成了"能干活"
2022年底ChatGPT横空出世的时候,大多数人第一次意识到AI能像模像样地聊天。现在三年半过去了,AI早就不满足于聊天了——它想替你干活。
这个转变的核心是Agent。
AI不再只是回答你的问题。它能订机票、写代码、操作电脑、帮你处理邮件、安排会议、整理数据——它不光要"懂",更要"动手"。
先说好消息。2024年初,最领先的模型在SWE-bench Verified(一个用真实GitHub bug来测试AI编程能力的基准)上得分不到5%。现在Anthropic的Claude Sonnet 4在高算力模式下做到了80.2%。80%的真实bug,AI能自己找出来并修好。抽象推理进步也很大。OpenAI的o3在ARC-AGI上从GPT-4o的5%直接飙到87.5%。
更关键的是,成本在以让人眩晕的速度往下掉。2023年初,同等智能水平下大模型推理成本大约是每百万Token 60美元。2025年降到了6美分。到2026年中,DeepSeek直接把输入价格打到每百万Token 0.025元人民币——大约0.0035美元。
从2023年到2026年,累计降了差不多10000倍。哪怕只看2025到2026这一年,也降了约10倍。注意我的用词——不是1/10的成本,是1/10000的成本。
但能力在进步,不等于已经"靠谱"了。
2024年,AI在真实电脑环境中完成任务的成绩最高只有12.24%。到了2026年,Gemini 3.1 Pro在OSWorld-Verified上做到了76.2%——质的飞跃。但76%还不是95%。在需要零失误的商业场景里,这个失败率依然太高。
还有一个容易被忽略的事实:虽然88%的组织声称已采用AI,但真正部署AI Agent来执行完整业务流程的比例,在所有业务职能中都低于10%。企业和个人"试试AI"的热情很高,但让AI真正嵌入核心业务流程——那是另一回事。
另外,AI"一本正经地胡说八道"的老毛病,两年半了,从根本上没治好。
AI正从"对话"跨越到"行动",这一步的方向是对的。成本降了10000倍,Agent成功率从12%涨到76%,都是实打实的进步。但76%到95%之间还有段路,幻觉问题也还在原地。
产业——万亿砸下去,是真金还是虚火
2024年,头部科技公司在AI基础设施上花了约2000亿美元。2025年,超过3000亿美元。到2026年,微软、谷歌、Meta、亚马逊四大巨头合计的AI资本开支超过7000亿美元。
做个对比——1995到2001年整个电信泡沫期间,上市运营商的累计资本支出也就5000多亿美元。现在AI的资本开支,光2026年一年就可能超过那个数字。
英伟达是这波浪潮最早的的赢家。2026财年全年营收2159亿美元,增长65%。第四财季单季营收681亿美元,数据中心业务一个季度就贡献了623亿美元。利润率仍然慷慨得吓人。
但7000多亿砸下去,赚回来多少?
红杉资本给过一个震撼数字:AI产业存在6000亿美元的收入缺口——每投入1美元AI基础设施,目前只能赚回约0.25美元。到了2026年,这个数字变得更极端了:四大巨头的AI投入预计达7250亿美元,而AI服务收入仅约250亿美元。投入产出比从1:0.25变成了大约1:0.03。
说人话就是基础设施的钱花得越来越猛,应用端的收入追得气喘吁吁。
但这不完全是空转。英伟达2159亿美元的营收是实的,利润率也是实的。这和2000年互联网泡沫"有流量没利润"的逻辑完全不同。这次的问题不是"没有利润",而是"有利润,但远不够填投入的坑"。
泡沫还是不泡沫?
和互联网泡沫有几个本质区别。互联网时代,无数烧钱的小公司在纳斯达克上市,很多连收入都没有。这次烧钱的主力是微软、谷歌、Meta、亚马逊——每一家都有极其健康的现金流,每一家都不会因为AI烧钱而倒闭。
但是,分析师预测四大巨头的自由现金流在2026年可能下降高达90%。巨头也扛得住,但不是不疼。
值得注意的信号是:热钱的流向正在变化。
我们在之前文章里反复提到,DeepSeek把Token价格打穿,本质上是在用技术把上游成本压下来,把利润空间让给下游。红杉说的6000亿收入缺口,恰恰是下游应用层的投资机会——当基础设施已经跑得太远,最大的红利会从"卖铲子"转向"用铲子创造新价值"。
A股市场的反应也在印证这一点。最近一段时间,AI医疗、AI教育、AI智能终端等应用方向明显在吸引增量资金,而纯算力方向开始分化。
英伟达的利润是真的,产业规模也是真的。问题是基础设施跑了太远,应用还没追上。但这也是投资机会所在——当所有人都盯着上游时,下游正在酝酿最大的结构性变化。
冲击——白领先挨刀
历史上每一次技术革命,都是机器替代体力、人类转向脑力。工业革命让纺织工下岗但创造了工程师,自动化让流水线工人失业但催生了程序员。
AI反过来了。它先冲着白领来。
编程、写作、翻译、法律研究、数据分析——这些恰恰是AI最擅长的。麦肯锡的研究早就指出,生成式AI对知识型工作的影响远大于体力劳动。
斯坦福HAI 2026年报告显示:22-25岁的软件开发人员就业人数,自2024年以来下降了近20%。近20%——不是预测,是已经发生的事实。
企业对未来的预期更说明问题。约三分之一的组织预计AI将导致员工总数减少。预期缩减最严重的三个职能是:服务运营、供应链管理、软件工程。
不过,在几乎所有职能领域里,企业"预期"要缩减的人数都超过了"已经"缩减的人数。这说明很多企业对AI替代人力的预期可能过于乐观了——至少目前如此。但生产力提升也是真的。客服支持效率提升14-15%,软件开发效率提升26%,营销产出提升50%。
还有一个值得注意的发现:斯坦福报告特别指出,有初步证据表明过度依赖AI可能带来长期学习代价——用AI越多,自己学得越慢。这对初级从业者来说尤其是个风险。
AGI还远不远
AGI,全称是通用人工智能。用人话讲,就是“一个AI什么都能干,而且干得比人好”。
一提到这个,很多人脑子里的画面是《终结者》《黑客帝国》——机器人觉醒、反抗人类。但目前在AI圈子里吵的AGI,其实分两类人:一类人想的是“AI能不能把所有工作都自动化,让人类彻底不用干活”;另一类人想的是“AI能不能在每个领域都达到专家水平,但依然是人类的工具”。
OpenAI的Sam Altman说AGI是“在大多数有经济价值的工作上超越人类”——这是算经济账的。Meta的LeCun说,光会聊天不算,得真正理解物理世界才算。而ARC-AGI测试的创始人Chollet说,聪明不是看你知道多少,而是看你学新东西有多快。
定义不一样,时间表自然对不上。说AGI快到的,讲的是“AI能帮人干很多活”。说AGI还远的,讲的是“AI离真正理解世界还差得远”。
一个实验最能说明问题。
有个叫ARC-AGI的测试,专考AI的抽象推理能力,普通人能轻松拿95分以上。GPT-4o一开始只得5分,后来o3冲到了87.5分——看起来飞跃了。但测试方出了一个更难的第二代,o3预估直接掉到30分以下。
这说明什么呢?AI确实在变聪明,但它更像是一个“超级刷题王”——给它练过的题型,它无敌;换个新题型,它就不灵了。离人类那种“举一反三”的悟性,还有距离。
治理比技术更让人头疼。
技术圈还在吵时间表,监管已经远远跟不上了。
全球三个大经济体走出了三条完全不同的路:欧盟最严,违规最高罚3500万欧元,走“权利优先”;中国管得最细,从算法推荐到深度合成都有专门法规,走“国家管控”;美国到现在联邦层面还没有一部全面的AI立法,基本靠公司自觉。
结果是跨国企业谁都不敢动——欧盟要数据追踪,中国要数据本地化,美国没有统一标准。全球AI治理各管各的,短期内看不到统一趋势。
国内这边倒是动作很快。5月国家发改委明确说正谋划“人工智能+”配套文件,要推动央国企开放AI应用场景。三部门联合印发了智能体规范发展实施意见。四部门在推AI和能源的双向赋能。国务院2026年立法计划里,AI综合性立法也被明确提上了日程。
对投资者来说,AGI远不远没那么重要。
监管框架加速成形,意味着合规成本将成为行业分水岭。那些已经深度绑定央国企、具备信创资质的公司,长期受益确定性更强。与其赌科幻片里的机器人什么时候来,不如看眼前的:哪些公司在用AI赚钱,哪些还在烧投资人的钱讲故事。
我们之前梳理过——汉得信息AI收入一年翻三倍,新大陆的AI智能体已经在真实商户场景落地。理论上这些才是AGI这场大戏里,目前最能看得到真金白银的地方,但事实不见得是这样,传统业务被吞噬,产品与领先大模型厂商的差距再被扩大。
拿互联网和移动互联网的尺子,量一量AI
要回答"AI走到哪一步",光看它自己不够——得用历史的尺子量一量。
第一把尺:资本开支——比互联网还猛
1995到2001年电信泡沫期间,上市运营商累计资本支出超过5000亿美元。AI呢?2026年四大巨头资本开支超过7000亿美元。光一年的投入就可能超过整个互联网泡沫时期的总和。
第二把尺:渗透率——大概在互联网的1997年
红杉2024年估算AI在企业端的"真正采用率"约10-15%。斯坦福HAI 2026年报告说88%的组织在"使用AI",但AI Agent在所有职能中的部署率不到10%。试试和真正用起来,不是一回事。
从渗透率看,基础建设可能已经进入了下半场,AI应用才刚刚出场。
第三把尺:泡沫信号——这次不一样?
互联网泡沫:纳斯达克从不到800点涨到5048点,5年涨5倍多。然后崩盘——两年跌掉78%。
AI的泡沫信号确实出现了。股票集中度极高,投资强度极大。但和互联网泡沫有几个本质区别:利润是真的(英伟达一个季度681亿美元),成本在暴跌(10000倍),烧钱的是巨头不是散户。
移动互联网那面镜子
iPhone发布(2007)→ App Store上线(2008)→ iPhone 4引爆(2010)→ 应用全面爆发(2013)。
ChatGPT发布(2022底)→ GPT API/插件生态(2023)→ GPT-4o/DeepSeek引爆(2024-2025)→ 应用爆发(?)
从突破性产品到应用爆发,移动互联网用了约6年。AI从ChatGPT算起才3年半。
申万宏源的研究指出,当前AI产业类似于移动互联网的2010年——"iPhone 4时刻":硬件和平台已经证明价值,但应用还处于"0到1"的早期阶段。
我们在之前的文章里反复提到一个历史规律:电力便宜后,最大的赢家不是发电厂,是用电造汽车的福特;晶体管便宜后,最大的赢家不是造芯片的,是装进电脑里的微软和装进手机里的苹果。现在Token便宜了,最大的机会在"用Token创造新东西"的人身上。
这与中金公司的框架完全一致:AI正处在"基础设施期"向"渠道为王期"过渡的阶段——基础设施投入拉满了,但AI如何触达普通用户、嵌入日常工作流,还没有定型。
三把尺子加一面镜子的答案:
资本开支对标互联网1998-1999年,渗透率对标1995-1997年,泡沫信号对标1998-1999年(但基础更实),移动互联网对标2010-2011年。
方向一致:基础设施投完了,渗透率刚起步,泡沫信号(局部泡沫肯定存在,特别是基础设施这一块)出现但基本面更扎实,杀手级应用尚未出现但正在酝酿。AI正处在从概念到落地的关键过渡期。
就像1999年的互联网:泡沫信号已现,但真正改变世界的应用,恰恰是在泡沫破灭之后才长出来的。
关注我,还有更多有价值的信息!!!
写在最后
五个维度看完,"AI走到哪一步了"的答案比任何一个单一判断都复杂,但方向是清晰的。
能力上,AI正从聊天转向干活,成本降了10000倍,Agent从12%涨到76%——进步是实打实的,但"能用"到"好用"之间还有距离。
产业上,2026年四大巨头砸下超7000亿美元,但投入产出比大约只有1:0.03——基础设施跑太快了,应用还没追上。而我们反复论证过,最大的机会恰恰在应用层:企业级AI智能体、AI智能终端、AI教育、AI医疗……这些方向正在被DeepSeek的Token降价点燃。
冲击上,AI先冲着白领来,初级程序员已经感受到了。但大规模失业还没出现。用AI的人和不用AI的人,正在分化成两个群体。用AI的公司和不用AI的公司,也正在分化成两个群体——我们梳理过的A股AI应用标的中,那些已有真实AI业务收入的公司,与纯概念炒作的公司,差距会越拉越大。
AGI上,乐观派和怀疑派继续吵,但真正的危机不在技术时间表——全球治理的高度碎片化,以及国内政策框架的加速成形,才是投资者最该关注的事。
历史坐标上,AI大概在互联网1999年、移动互联网2010-2011年的位置。杀手级应用还没影,但应该不远了。
这不是"AI还行但跟你没关系"的阶段,也不是"AI已经改变一切"的阶段——这是最关键的过渡期。
1999年说"互联网改变世界"是泡沫。2026年说同样的话,没人会反对。
AI大概率也是这个剧本。而我们之前的结论仍然站得住:核心仓位,应该放在那些能用廉价Token定义新交互、新内容、新服务的应用企业上。
之前关于AI应用的文章
风险提示: 以上为产业趋势的推演与观察,不构成具体投资建议。文中涉及的所有A股公司仅为逻辑验证样本,AI技术演进路径、行业竞争格局、商业化节奏均存在不确定性,投资决策请结合个人风险承受能力审慎判断。
夜雨聆风