透视AI 黑盒-大模型时代的冷思考与务实之路

透视AI 黑盒

大模型时代的冷思考与务实之路

——中美人工智能发展格局深度复盘

深度复盘报告安泰行研中心| 人工智能行研班2026年4月

─────────────────────────────────

核心论点

❝ AI训练走的是经验路线，但文明的跃迁需要理性。中美在人工智能领域的竞争，表面上是算力与资本的博弈，本质上是两种截然不同的控制哲学与战略选择。——安泰行研中心 · 讲座核心论断

本报告基于安泰行研中心AI 行研班第二课时讲座内容整理而成，旨在对当前中美人工智能发展格局进行系统性的冷静审视。报告涵盖四个核心议题：技术溯源与Scaling Law极限、中美AI发展的资本与算力鸿沟、DeepSeek的中国式破局，以及从感知让渡到心即理回归的哲学反思。最终落脚于"守住人类认知主体地位"的战略主张。

报告结构

章节	核心议题
第一章	技术溯源：大模型本质与Scaling Law极限
第二章	中美分野：猎豹的爆发vs 象群的势能
第三章	破局者：DeepSeek 与中国式"暴力降本"
第四章	智能体与具身智能：从"聊天助手"到"推理器"
第五章	哲学反思：心即理与认知主体性的守护
总结	守住人类认知的"主体地位"

第一章　技术溯源：大模型本质与Scaling Law极限

理解AI，首先要理解大语言模型（LLM）的本质：**LLM是基于海量历史数据预测下一个词的概率模型。** 它与传统聊天机器人有着根本的区别：

维度	传统聊天机器人	大语言模型（LLM）
技术基础	基于规则/模板，依赖预定义的流程匹配	基于深度学习的大型神经网络，海量文本训练
语言理解	回答机械式，局限于预设模板或关键词	能理解复杂自然语言、语义、上下文甚至情感
创造力	无法生成超出预设内容的回答	能够进行创意写作、代码生成等开放性任务

ChatGPT成功的核心秘密，在于引入了**基于人类反馈的强化学习（RLHF）**机制，使大模型从"能说话"升级为"会说人话"。

1.1　Scaling Law 的极限与哈布斯堡诅咒

OpenAI的核心信仰是**Scaling Law（规模定律）**：模型参数量越大、训练数据越多、算力越强，模型能力就越强。然而，这一定律的极限正在显现。

OpenAI前CTO曾公开表示，"世界上的数据已经被充分利用"。当高质量人类数据耗尽，模型只能用AI生成的数据来训练新的AI时，就会陷入"哈布斯堡诅咒"——如同近亲繁殖，导致模型能力的代际退化，最终走向"认知崩溃"。

图1：Scaling Law 的极限与哈布斯堡诅咒（数据来源：讲座课件）

1.2　AI发展的五个级别

OpenAI将AI的发展分为五个层级。当前我们正处于从Level 2（推理器）向Level 3（智能体）过渡的关键阶段。

层级	名称	特征描述	现状
Level 1	聊天助手（Chatbots）	具备自然对话能力	✅ 已实现
Level 2	推理器（Reasoners）	达到人类水平的问题解决能力	⚡ 部分实现（o1/o3）
Level 3	智能体（Agents）	能够自主执行复杂任务	��当前阶段
Level 4	创新者（Innovators）	能够辅助发明创造	��未来目标
Level 5	组织者（Organizations）	能够完成组织级别的工作	��远期愿景

─────────────────────────────────

第二章　中美分野：猎豹的爆发vs 象群的势能

美国如同猎豹，爆发力强，追求极致速度与颠覆性创新，执着于突破参数极限以实现通用人工智能（AGI）。中国则如象群，转身稍慢，但步步为营，势能不可挡，目标是将AI融入全球最完整的硬件供应链，实现产业赋能。

维度	美国	中国
战略目标	实现AGI，追求从0到1的颠覆性创新	产业赋能，追求从1到100的规模化效能
驱动力	市场导向+ 风险投资（VC）	政策引导+ 国家基金
监管哲学	"事后追责"与"行业自律"，保护创新活力	"事前审批"与"强监管"，大模型需经"备案"
模型策略	闭源为主（GPT-4、Claude、Gemini）	开源为主（DeepSeek、通义千问）
核心优势	原创算法+ 高端芯片 + 顶尖人才	数据规模+ 工程落地 + 供应链完整

2.1　资本鸿沟：12倍的私人投资差距

在资本层面，中美展现出截然不同的驱动模式。美国由私人资本驱动，拥有47家AI独角兽，Google和Meta等头部公司单季AI投入高达250亿美元。相比之下，中国私人资本投入仅为美国的十二分之一——**美国私人投资总额1091亿美元 vs 中国93亿美元**。

图2：中美 AI 私人资本投资鸿沟（数据来源：2024 中期记分卡）

面对巨大的私人资本鸿沟，中国必须走"举国体制"，依赖国家大基金三期（475亿美元）来弥补私人资本的不足。美国的风险投资文化允许大量失败，从失败中迭代出颠覆性创新；而中国的国家引导资金则更注重确定性和产业落地。

2.2　算力困境：戴着镣铐跳舞

在硬件算力方面，美国占据了全球74%的高端算力，而中国仅占14%。出口管制切断了高端芯片供应，使得中国在算力基础设施上面临严峻挑战。

更令人担忧的是"效率惩罚"问题。由于性能折损、互联瓶颈与生态系统成熟度差异，中国在达到同等算力时，需要投入约**3倍的硬件资源**。具体而言，美国使用10万片NVIDIA B200芯片即可达到的算力，中国需要约30万片国产等效芯片。

图3：硬件效率惩罚——3倍的算力代价（数据来源：讲座关键指标）

2.3　能源瓶颈：AI发展的终极制约

除了算力，电力正在成为AI发展的另一道"天花板"。单次AI搜索查询耗能约为2.9 Wh，是传统Google搜索（0.3 Wh）的**10倍**。讲座预判：2024-2025年为"算力瓶颈"期，预计2028年左右，全球将全面进入"能源瓶颈"期。届时，能源效率将成为AI竞争的核心变量。

────────────────────────────────

第三章　破局者：DeepSeek 与中国式"暴力降本"

❝ 如果ChatGPT刷新了我们对AI的认知，那么DeepSeek在某种程度上颠覆了美国人对中国AI水平的认知。当前大模型研发成本骤降：不一定需要10万卡和上亿美元的投入。——课件原文

3.1　技术路线：算法巧劲绕过"大力出奇迹"

DeepSeek的核心技术创新体现在三个层面：

【混合专家架构（MoE）】DeepSeek V3采用671B参数的MoE架构，但每次推理只激活其中约37B的参数。这种"按需激活"的机制，大幅降低了推理成本。

【多头潜在注意力（MLA）】通过创新的注意力机制，DeepSeek显著降低了推理时的KV Cache内存占用，使得在有限硬件上运行大模型成为可能。

【强化学习（RL）推理优化】DeepSeek R1通过纯强化学习训练推理能力，无需大量人工标注数据，模型自主学会了"慢思考"——在回答复杂问题时，通过链式思维（Chain-of-Thought）逐步推理。

3.2　成本革命：数字说话

DeepSeek的成本数据，是对"大力出奇迹"信仰的一次有力冲击：

指标	DeepSeek V3	GPT-4o	Claude-3.5-Sonnet	倍数差距
参数量	671B	175B（估算）	175B（估算）	—
训练成本	<$600万	~$1亿	~$5亿	GPT-4o的1/20
推理价格（/百万Token）	$0.48	$18	$18	GPT-4o的1/40
质量指数（MMLU）	80	82	75	接近持平

**训练成本不到600万美元，是GPT-4o的1/20；推理价格降至GPT-4o的1/40。** 这组数字不仅打破了"训练大模型必须烧钱"的神话，更引发了全球AI产业的深刻反思：Scaling Law的边际效益是否正在递减？算法优化是否可以部分替代算力堆砌？

图4：DeepSeek V3 vs GPT-4o 成本对比（数据来源：DeepSeek官方技术报告）

3.3　开源涟漪：解构"闭源算力霸权"

DeepSeek最具战略意义的决策，是将所有模型全部开源。这一举措产生了四重涟漪效应：

【效应一：刺穿溢价壁垒】迫使全球算力军备竞赛从"堆砌算力"转向"优化算法提升效率"，Meta、XAI等公司被迫加速开源布局。

【效应二：打破闭源垄断】开源也有好模型的事实得到证明，迫使OpenAI、谷歌等闭源公司重新审视其商业策略，ChatGPT已宣布部分降价。

【效应三：赋能云厂商】DeepSeek提供API服务，使云厂商可以自行部署，利好国内各云服务、芯片厂商，加速国产AI生态的形成。

【效应四：全球南方布局】借助"一带一路"，中国正在向中东、东南亚和非洲出口基于DeepSeek的本地化AI解决方案，打破西方市场的绝对统辖。

─────────────────────────────────

第四章　智能体与具身智能：从"聊天助手"到"推理器"

4.1　智能体（Agent）：AI的"手脚"

如果说大语言模型是AI的"大脑"，那么智能体（Agent）就是赋予AI"手脚"的关键技术。智能体能够自主执行复杂任务，调用外部工具（如搜索、代码执行、文件操作），并根据反馈动态调整行动策略。

目前最成功的代码智能体是Anthropic的Claude Code（Claw Code），它凝结了数千名工程师的编程经验，在软件开发任务上展现出令人印象深刻的能力。华人背景的智能体公司Manus，上线仅10个月ARR（年度经常性收入）即达到1亿美元，随后被Meta收购，成为中国AI应用层能力的有力佐证。

4.2　具身智能：从虚拟到实体的最后一跳

具身智能（Embodied AI）是指将AI的感知、推理和决策能力与物理实体（机器人）相结合，使其能够在真实世界中自主行动。从基座模型到智能体，再到具身智能，是迈向通用人工智能（AGI）的关键路径。

目前，全球七八成人形机器人公司在中国，这与中国完整的制造业供应链密切相关。然而，讲座也指出，具身机器人离真正的"自主做事"还相当遥远。讲座团队的目标是今年年底前推出自己的机器人，设计思路是"先做大脑，再做小脑"——先解决感知与决策问题，再解决运动控制问题。

4.3　快思考 vs 慢思考：两种模型范式的对决

CoT链式思维的出现，将大模型分为两类：

维度	概率预测（快速反应，如ChatGPT 4o）	链式推理（慢速思考，如OpenAI o1）
性能表现	响应迅速，算力成本低	慢速思考，算力成本高
运算原理	基于概率预测，通过大量数据给出快速预测可能的答案	基于链式思维（CoT），逐步推理问题的每个步骤来到达答案
决策能力	依赖预设算法和规则进行决策	能够自主分析情况，实时做出决策
创造力	局限于模式识别和优化，缺乏真正的创新能力	能够生成新的创意和解决方案，具身创新能力

─────────────────────────────────

第五章　哲学反思：心即理与认知主体性的守护

❝ 从哲学角度看，目前基于经验训练AI模型的范式很难达到AGI，因为机器缺乏理性，对世界的认识是片面和有限的。——讲座金句

5.1　认知的让渡：MIT实验的警示

MIT的神经科学实验为我们提供了一个令人警醒的数据点：过度依赖AI辅助思考会导致前额叶连接度降低，**83%的学生甚至无法引用自己"写"的内容**。这种"外包思考"不仅是技能的退化，更是认知主权的实质性让渡。

这一现象在教育领域尤为突出。浙江K12已开设AI课程，但如何教学、以及高中和大学应提供何种教育，仍是悬而未决的问题。更令人担忧的是，很多AI公司已经开始直接从高中招人，跳过了大学教育体系。长远来看，仅有工程能力是不够的——缺乏创新能力，在范式变迁时必然掉队。

5.2　西方哲学的镜鉴：理性 vs 经验的千年之争

理解当前AI的局限，需要回溯18世纪欧洲哲学的核心争论：

【莱布尼茨（理性主义）】认为真正的知识来自理性，通过逻辑推演可以认识世界的本质。这对应于AI中的"符号主义"路线——用逻辑规则和知识图谱来表达智能。

【休谟（经验主义）】认为知识来自经验和感官，人类的认识是对感官印象的归纳和总结。这对应于AI中的"连接主义"路线——用神经网络从海量数据中学习模式。

【康德（批判哲学）】试图调和理性与经验，认为"认识始于经验，但知识来自理性"。

当前的大语言模型，走的是彻底的"休谟路线"——基于海量数据的经验归纳，通过概率预测生成输出。它们所做的是概率模式匹配，是模拟而非思考，并非真正的智能。从哲学角度看，这种范式很难达到AGI，因为机器缺乏理性，对世界的认识是片面和有限的。

5.3　东方哲学的智慧：心即理的回归

东方哲学同样对这一问题有深刻的洞察：

【儒家】"内圣外王"——内在的道德修养是外在事功的根本，强调人的主体性与内在价值。

【佛家】《金刚经》中"应无所住而生其心"，禅宗认为世界是内心的投影，强调心的主体地位。

【道家】"道法自然"，强调人对世界理解的重要性，人是认识世界的主体。

【王阳明心学】"良知乃是天理照明灵觉处，故良知即是天理，心即理"——世界的规律和真相，取决于人的内心的理解与体悟。

东西方哲学在这一点上高度一致：**人有区别于自然的灵性，这是机器所不具备的。** 当前的机器仍在做概率匹配，Claude Code之所以效果不错，是因为它凝结了几千名工程师的经验——但这是人类智慧的结晶，而非机器自主的创造。

5.4　感知让渡的边界：哪些可以，哪些不能

基于上述分析，我们可以划定一条清晰的"让渡边界"：

能力类型	可让渡给AI（工具）	必须由人类守护（主权）
感知层	数据采集、图像识别、语音转写、信息检索	—
认知层	—	价值判断、战略决策、创意生成、道德推理
执行层	重复性任务、标准化流程、7×24运营	—
创新层	—	范式突破、跨界融合、人文关怀

引入AI的终极价值，并非简单的降本增效或替代人力，而是"**数字化资产的沉淀**"。AI能够提供7×24小时的绝对运营稳定性，无需情绪管理，且边际成本不断递减。未来的智能化软件范式，必将是"规则驱动（符号主义）+ 概率模型（连接主义）"的深度融合。

─────────────────────────────────

总结与战略建议：在时代洪流中做清醒的掌舵者

石器、青铜、铁器、蒸汽、电力、互联网、AI——每次技术革新都给社会带来巨大的冲击和机遇。当下成功出圈的案例，如黑神话悟空、DeepSeek、哪吒，成功的路径各不相同且不具备可复制性，但有两个共性：**志存高远、坚信不疑**。

从AGI角度看，我们距离真正登顶还有很长的路（Level 2/5），需要有长远的战略眼光，提前布局。DeepSeek/Qwen等开源模型为中国AI的崛起吹起号角，围绕其构建全球范围内人工智能生态正在逐渐形成规模效应。

对安泰校友的三项战略建议

【建议一：拥抱工具，守护认知】积极将AI融入业务流程，提升感知层和执行层的效率；但在战略决策、价值判断和创意生成等核心认知活动中，坚持人类的主导地位。警惕"认知让渡"的陷阱，培养团队的批判性思维和创新能力。

【建议二：关注应用，而非模型】对于大多数企业而言，自研基础模型既不必要也不现实。真正的机会在于将AI能力与行业深度结合，尤其是中国制造业在供应链、产业数据和产品上的独特优势。AI + 制造，是中国企业最具竞争力的赛道之一。

【建议三：坚持长期主义，警惕泡沫】AI是一个需要20-30年发展的长期行业，虽处于早期，但发展可能存在泡沫且会破裂。投资部门需关注AI是否为泡沫以及泡沫何时破裂等问题，企业应坚持长期主义，避免追风口式的短期投机，在泡沫破裂后仍能保持核心竞争力。

────────────────────────────────

结语：致安泰校友

❝ 智能时代下，创新意识和能力是人才培养重中之重，了解、掌握、熟练使用当下最前沿的AI工具是每个人的"必修课"。需要研究大语言模型吗？需要。但是我们更应该持续探索崭新的真正的AI范式。——讲座结语

在这个充满不确定性的时代，愿安泰校友们既能拥抱技术的变革，又能坚守理性的底线。让我们共同探索AI与产业深度融合的务实之路，在时代的洪流中，做清醒的掌舵者。

目前团队正在努力推出自己的机器人，目标是今年年底前完成，设计先做大脑，再做小脑。这是一个将学术探索与产业落地相结合的实践，也是对"守住认知主体性"这一理念的身体力行。

安泰行研中心2026年4月