乐于分享
好东西不私藏

软件吞噬世界之后AI开始吞噬组织

软件吞噬世界之后AI开始吞噬组织

软件改变了商业的外壳:渠道、交易、协作和交付。AI 正在往更深的地方走,它开始改变组织内部最基础的问题:谁能判断,谁能行动,谁被放大,谁来负责。                        

2011 年,Marc Andreessen 写下《软件正在吞噬世界》。那句话后来成了一个时代的注脚:媒体、零售、金融、出行、教育、医疗,越来越多行业被软件重新组织。

十几年后,AI 没有停在软件的界面上。它继续往公司内部走,开始触碰组织更深处的结构。

过去,公司管理的是人的动作:谁写代码,谁做销售,谁审批合同,谁回复客户,谁承担结果。岗位、流程、层级、绩效和审计,大多围绕这些动作展开。

AI Agent 出现后,一个人的行动半径突然变大。他可以同时调用模型、检索、代码、数据分析、PPT、客服系统和自动化工具,在几个小时内完成过去一个小组的初步产出,也可能在几分钟内把错误放大到系统、客户和合规流程里。

这时,公司真正要管理的东西就变了。

“要不要用 AI”和“AI 会不会替代员工”,都只是表层问题。更难的是:组织愿意把多大范围的判断权、资源权和行动权,交给一个人,或者一个人和一组 Agent 组成的工作单元?这个单元犯错时,谁能发现,谁能叫停,谁来负责?

如果说软件吞噬世界,是把商业活动逐步搬进代码、网络和数据系统;那么 AI 吞噬组织,就是把执行力、判断力和协调方式重新分配给人和机器共同组成的工作单元。

这篇文章试图用一个朴素的方法看这件事:先回到历史中观察,再把不同组织形态压缩成几个底层变量,最后推测 AI Native 组织会往哪里走。

我越来越倾向于一个判断:

AI Agent 正在把授权对象,从岗位推向“人-Agent 复合单元”。

组织过去授权给岗位、团队、部门。未来,它会越来越多地授权给“人-Agent 复合单元”。这会带来速度,也会带来新的失控方式。

一、回到历史:组织怎样处理未知

历史上的强组织,很少是单靠一种管理哲学赢的。

战争、军工、科研、全球化企业,每一种高难任务都会逼着组织重新分配判断权、行动权和责任链。它们看起来差异很大,底层都在处理同一个问题:谁可以在不完整信息下行动,组织又如何确保这种行动仍然可控。

军事组织是一个好入口。

人们常把军队想象成命令服从的机器,也常把德军 Auftragstaktik 或美军 Mission Command 浪漫化成“充分相信前线”。这两种理解都太轻了。

任务式指挥的核心,是让下级理解上级真正的意图,而非简单自由发挥。上级给出目的、边界、资源和期望结果,下级在战场变化中选择手段。它需要共同训练、共同语言、参谋体系、风险边界和事后问责。

这对 AI 组织很有启发。

一个前线小队可以被授权,是因为它理解任务意图,也有能力在现场变化中自我纠偏。一个员工和一组 Agent 可以被授权,也必须先拥有类似条件:清楚目标、知道边界、拿得到上下文、有复盘标准,也能被及时叫停。

特种作战也是类似道理。

美式特种作战常被写成“小队自治”的故事。但真正决定它能力的,除了小队本身,还有情报、航空、后勤、通信、法律授权、跨机构协作和持续训练预算。后 9/11 的 JSOC 更像一张高速运转的“情报、行动、再情报”网络,而非几支孤立突击队。

所以,小队可以小,但背后的系统不能弱。

未来的 AI 特种小队也是这样。一个 5 人团队加 50 个 Agent 能不能创造巨大产出,关键不只是这 5 个人多聪明,还在于他们有没有高质量任务意图、工具链、数据权限、测试环境、发布通道和风险熔断机制。

中国革命战争中的组织形态也提供了另一个角度。

中共早期军队的创新,超出了单纯军事专业化。它把政治目标、基层组织、纪律和群众动员结合起来。三湾改编、古田会议、支部建在连上、政治工作、官兵关系、军民纪律,构成了一套“政治共同体 + 基层组织嵌入 + 纪律 + 动员系统”。

到解放战争后期,这支军队已经走出单纯游击战,能组织大兵团运动战、围歼战、城市攻坚和大规模后勤动员。淮海战役中的支前体系,靠的是地方政权、群众动员、补偿、政治教育、组织编组和交通工具的整合,而非现代工业后勤。

国民党军队并非没有正规化努力。德式训练、美援、黄埔军官体系和精锐部队都真实存在。问题在于,这些能力没能覆盖全军,又被派系、地方实力、财政崩溃、通胀、后勤瓶颈、士气和战略判断共同削弱。

这组材料对“人是否可以被信任”有一个很重要的提醒:

所谓人可以被信任,首先不是人格假设;它指向的是组织能否持续生产可信行为。

组织管理里真正的问题,不止是人性善恶,更是组织能否把善意、能力和责任稳定地转化为可预期行动。

二、军工创新:小团队背后有大系统

很多关于创新组织的故事,容易把注意力放在天才小团队上。

Skunk Works、DARPA、曼哈顿计划、Apollo、Grumman F6F Hellcat、B-2 隐身飞机、Operation Warp Speed,都常常被拿来证明“小团队、高授权、低流程”的力量。

但仔细看,这些案例并不支持一种简单的反管理叙事。

曼哈顿计划不能被理解为 Los Alamos 的单点奇迹。它是 Oak Ridge、Hanford、Los Alamos 等多地项目网络。Groves 代表军事工程、资源调度、安全、建设和行政力量;Oppenheimer 代表科学共同体、跨学科讨论和研究判断。科学自由、军事工程、国家资源和保密治理,被强行绑在一个系统里。

DARPA 的关键也不在“给天才自由”。它真正有意思的地方是 Program Manager 制度。少数项目经理带着非常难的问题,组织大学、公司、实验室和政府网络,用 Heilmeier Catechism 追问:你要做什么?现在怎么做?新方法为什么可能成功?风险、成本、周期和阶段考试是什么?

这是高授权,也是高审查。

Skunk Works 确实提供了小团队突破大组织摩擦的经典样本。Kelly Johnson 的规则强调强项目经理、小而精团队、最少报告、早期测试、军方和承包商每日协作。但它并非没有治理。它有清晰客户需求、军方项目办公室、保密约束、成本压力和真实飞行测试。

Grumman F6F Hellcat 则说明,创新不总来自底层科学突破。F6F 的成功,来自战时需求反馈驱动下的快速工程化。它重视可生产、易维护、坚固、改型少、能快速规模化。很多时候,关键胜利来自把需求、工程、生产和反馈压缩在一起。

Bell Labs 和 Xerox PARC 又把问题推向另一面。

Bell Labs 代表长期稳定任务约束下的基础研究空间。它既服务 AT&T 通信系统可靠性,又能容纳固体物理等基础科学。晶体管的诞生,需要长期资金、顶尖同伴密度和真实工程问题的牵引。

PARC 证明了研究共同体可以发明未来,也可能无法拥有未来。Alto、图形用户界面、激光打印、Ethernet 等技术都从那里走出,但研究原型、商业产品、销售渠道、利润模型和组织激励没有对齐。

这些案例可以压缩成几条共同机制:

1. 目标极其具体,路径保持开放。

2. 少数强整合者掌握接口。

3. 小核心统筹大网络。

4. 反馈回路被压缩。

5. 例外治理存在,但治理没有消失。

6. 科研、工程、制造、部署和监管之间必须有转化接口。

这才是历史真正提供的组织经验。

真正值得学习的,不是找一个天才小团队躲开所有管理,而是把大组织的审批摩擦隔离掉,同时保留任务、资源、测试和客户反馈。

三、当代 AI 公司:高授权,也有高治理

今天的 AI 公司并不是凭空出现的新物种。

OpenAI、Anthropic、DeepSeek、Moonshot 这些组织,继承了许多旧组织原语:使命、项目制、研究共同体、产品反馈、安全治理、资本动员和人才高授权。

OpenAI 是使命治理、资本需求、研究军团和产品平台的混合体。它一方面需要推进“让 AGI 造福所有人”的使命,另一方面又必须调动巨额资本、算力和人才激励。它的组织张力不来自某个管理风格,而来自前沿模型本身的资源强度和风险强度。

Anthropic 更明确地把安全治理制度化。Responsible Scaling Policy、模型能力评测、访问控制、监控、外部审查和长期利益治理结构,都说明前沿 AI 公司不能只靠研究者自律。

DeepSeek 给出另一种面貌。梁文锋在访谈中强调自下而上、不预设角色、分工自然形成;研究人员可以调用训练集群,无需层层审批;招聘重视热情和好奇心。这是一种适合无人区探索的组织方式:先保护高质量探索,再把资源加注到被验证的方向上。

Moonshot/Kimi 则提醒我们,AI 产品开发本身也在变。过去互联网产品更像确定性 GUI 和确定性后端的组合;大模型时代,产品越来越像数据、模型、测试、反馈系统的共同产物。产品经理需要理解用户,也需要理解模型能力边界。

这些公司看起来都更相信顶尖人才。但把它们简单写成“高信任组织”,仍然会漏掉关键部分。

更准确的说法是:它们同时提高了人才授权、治理强度和工作流重构深度。

企业 AI 转型也证明了这一点。

McKinsey 2025 年调研显示,AI 使用已经非常广泛,但真正对 EBIT 产生显著影响的组织仍是少数。BCG、Gartner、Deloitte 等机构也给出类似信号:很多公司已经采购工具,甚至部署了 Agent,但价值没有自然进入利润表。

原因并不神秘。

AI 工具进公司很容易,工作流重构很难。权限、数据、复核、日志、异常处理、责任签署、ROI 追踪,任何一个环节缺失,Agent 都只能停留在局部效率工具。

Agent benchmark 也让人保持克制。TheAgentCompany 把 Agent 放进模拟软件公司,让它浏览网页、写代码、运行程序、与同事沟通,最强 Agent 也只完成了约 30% 的任务。ST-WebAgentBench 进一步指出,只看完成率会高估 Agent;加入企业安全和信任政策后,合规完成率明显下降。

这不意味着 Agent 没价值。恰恰相反,它说明 Agent 的价值必须嵌入组织系统。

未来组织不会因为装上 Agent 自动变化。变化发生在工作流、权限、数据、验证、责任和经济性被一起重构之后。

四、压缩:信任来自系统,可信行动才是结果

回到最初的问题:组织管理中最关键的假设,是否是“人可以被信任”?

这个问题仍然重要。但我现在更愿意换一种问法:

什么样的人,在什么条件下,可以被放大?

这比“相信人”更接近组织真实处境。

华为式强流程组织,不一定是把人看成不可被信任。面对大规模全球交付、复杂客户、供应链、合规、项目管理和人才层次差异,它选择用流程、干部体系、绩效和审计降低行为不确定性。它信任的是被流程、价值观、干部体系和审计边界塑形之后的人。

顶尖 AI 公司看起来更相信人,因为它们面对无人区问题、人才密度极高、任务不可流程化、探索价值巨大。它们必须把更大的判断权交给少数高能力研究者。但它们也在强化安全框架、发布审查、模型评测和治理结构。

所以,信任不应被理解成道德态度。组织里的信任,更像一个设计问题:

组织愿意把多大范围的判断权、资源权和行动权交给某类人或某类系统,并用多强的反馈和校验机制约束这种授权。

未来组织设计,可以先看五个变量。

第一,任务意图。到底要完成什么,为什么重要。

第二,授权半径。谁能独立决定,调用什么资源,执行到哪一步。

第三,反馈密度。多久知道对错,能不能用测试、用户、市场、战场或日志快速反馈。

第四,审查质量。谁来挑战假设,谁来识别风险,谁有权说停。

第五,退出能力。错了能不能撤、改、回滚、隔离和追责。

信任在这里,更像这五环运转良好后的产物。

当验证成本低、失败成本低时,组织可以更大胆地授权。当验证成本高、失败成本高时,组织必须压缩授权半径,引入专家、审计、冗余和监管。

AI 改变的是这组变量的成本结构。

执行成本下降了,信息处理成本下降了,复制和扩张成本也下降了。但验证成本、权限风险和责任链复杂度,反而上升了。

这也是为什么 AI Native 组织真正困难的地方,常常不在自动化本身,而在重新设计判断链。

谁定义问题,谁提供上下文,谁调用 Agent,谁验证结果,谁承担后果。这条链条会比传统岗位说明书更重要。

五、推测:AI Native 组织会走向分化

未来组织不太可能一步进入“全自动公司”。

更可能发生的是分阶段演进。

第一阶段,是个人副驾驶。AI 提高写作、代码、分析、检索、会议纪要、客服辅助等个人产出。组织结构基本不变,只是个体效率提升。很多公司现在就在这里。

第二阶段,是工作流嵌入。AI 开始进入业务流程。组织需要重写 SOP、权限、数据接口和 KPI。人和 AI 开始共同完成流程,而不是把 AI 当成外置工具。

第三阶段,是人-Agent 工作单元。岗位开始围绕“一个人 + 多个 Agent”设计。经理不只管理人,也管理 Agent 权限和产出;员工不只完成任务,也配置、训练、评估和复盘 Agent;绩效不只看个人努力,也看这个复合单元的吞吐、质量、成本和风险。

第四阶段,是 AI 项目军团。它更接近 DARPA、Skunk Works 和 Mission Command 的混合体。组织围绕高价值任务设置强 PM,PM 调度人类专家、模型、数据、工具链、Agent 集群、外部供应商和客户反馈。

第五阶段,是高自治但可撤销的组织网络。组织边界变薄,智能执行层变成基础设施。但责任链不会消失,反而更重要。

这些阶段不会整齐地依次发生。不同公司、不同部门、不同任务,会停在不同位置。

最终更可能出现的是组织生态位分化。

标准流程会变成 AI 流程工厂。客服、财务、人事、运营、销售支持等大量可验证流程,会由 Agent 执行,人类处理例外。

高风险专业服务会变成专家副驾驶组织。医疗、法律、金融、投研、合规等场景,AI 负责检索、生成、比对和初步分析,人类专家负责判断、签署和承担责任。

新产品探索会变成 AI 特种小队。少数高密度人才,带着大量 Agent、数据工具、原型系统和用户反馈,在短周期内探索新交互、新产品和新市场。

前沿模型研发会形成模型军团。模型、安全、数据、算力、产品、部署高度耦合,既像实验室,也像参谋部,还像基础设施公司。

基础研究可能出现 Bell Labs 2.0。AI for Science、硬科技、生命科学、材料、能源等领域,需要长期研究空间,也需要更强的转化接口。

开源网络会继续扩张。工具、模型、数据集、评测和插件由社区共同演化,靠声誉、代码审查、fork 和 benchmark 协调。

超级个体也会成为一种微型组织形态。一个人调用大量 Agent,完成过去小团队才能完成的内容、软件、咨询、研究和服务。

这些形态会并存。真正强的组织,未必有一种固定样子。它更像一套切换能力:能在不同任务中切换不同的授权、反馈、审查和退出机制。

六、结尾:组织不会消失,但组织资产会变

AI 时代的组织讨论,很容易被两个极端吸走。

一种极端相信组织会被超级个体和 Agent 瓦解,未来公司越来越小,管理越来越少。另一种极端认为组织最终仍会回到流程、合规、层级和审批,只是工具更智能。

历史给出的答案更复杂。

人类面对重大挑战时,很少只靠自由,也很少只靠控制。军事组织需要意图和纪律;军工项目需要授权和审查;科研共同体需要自由和转化接口;强流程企业需要规模稳定性;前沿 AI 公司需要高人才密度,也需要安全治理。

所以,未来组织的核心问题,可能会从“相信人还是不相信人”,变成一组更具体的问题。

它更像是在问:

谁值得被放大?

他被放大到什么程度?

他拿到哪些工具、数据和权限?

他的行动如何被反馈、审查、撤回和追责?

未来组织的胜负,不取决于是否相信人,而取决于能否安全地放大可信行动。

低不确定性、大规模交付场景,用流程生产可信行动。

高不确定性、顶尖人才场景,用使命、能力和审查生产可信行动。

AI Agent 出现后,两者都会被重构。

组织不会消失。

但组织的核心资产,会从“雇佣多少人”,转向“能安全调度多少可信智能单元”。

下一步真正值得追问的是:什么样的人,值得被 AI 放大?

这个问题,会把我们从组织形态,带回人才识别本身。

参考资料与延伸阅读

以下为本文写作和事实核验中使用的公开资料,按主题归类。

组织理论与治理

– Henry Mintzberg, Structure in 5’s: https://pubsonline.informs.org/doi/10.1287/mnsc.26.3.322

– Burns & Stalker 组织理论节选: https://us.sagepub.com/sites/default/files/upm-binaries/27412_8.pdf

– High Reliability Organizations 研究综述: https://www.sciencedirect.com/science/article/abs/pii/S0148296315006979

– Taylor, The Principles of Scientific Management: https://www.gutenberg.org/ebooks/6435

– Toyota Production System: https://global.toyota/en/company/vision-and-philosophy/production-system/

– NIST Zero Trust Architecture: https://csrc.nist.gov/pubs/sp/800/207/final

– Huawei Corporate Governance: https://www.huawei.com/en/corporate-governance

军事组织与任务式指挥

– U.S. Army Mission Command: https://www.army.mil/article-amp/106872/understanding_mission_command

– ADP 6-0 Mission Command PDF: https://irp.fas.org/doddir/army/adp6_0.pdf

– Army University Press, Auftragstaktik debate: https://www.armyupress.army.mil/Journals/Military-Review/English-Edition-Archives/July-August-2022/Herrera/

– NDU Press, Goldwater-Nichols and Joint Force reforms: https://ndupress.ndu.edu/Media/News/News-Article-View/Article/1567511/reverse-engineering-goldwater-nichols-chinas-joint-force-reforms/

– U.S. Army CMH, American Military History Volume II: https://history.army.mil/Publications/Publications-Catalog/American-Military-History-Volume-II/

– U.S. Army CMH, Korean War campaigns: https://history.army.mil/Research/Reference-Topics/Army-Campaigns/Brief-Summaries/Korean-War/

– U.S. Army CMH, U.S. Army Mobilization and Logistics in the Korean War: https://history.army.mil/Publications/Publications-Catalog/US-Army-Mobilization-and-Logistics-in-the-Korean-War/

– U.S. Army, AirLand Battle doctrine summary: https://history.army.mil/portals/143/Images/Publications/catalog/101-21.pdf

– U.S. Army CMH, TRADOC doctrine history: https://history.army.mil/portals/143/Images/Publications/catalog/69-1.pdf

– U.S. Army CMH, Stilwell’s Mission to China: https://history.army.mil/Publications/Publications-Catalog/Stilwells-Mission-to-China/

– U.S. Army CMH, Stilwell’s Command Problems: https://history.army.mil/Publications/Publications-Catalog/Stilwells-Command-Problems/

国共组织形态与中国战争史材料

– Mao, On Guerrilla Warfare, Chapter 6: https://www.marxists.org/reference/archive/mao/works/1937/guerrilla-warfare/ch06.htm

– Mao, The Concept of Operations for the Huai-Hai Campaign: https://www.marxists.org/reference/archive/mao/selected-works/volume-4/mswv4_43.htm

– Mao, The Democratic Movement in the Army: https://www.marxists.org/reference/archive/mao/selected-works/volume-4/mswv4_27.htm

– 三湾改编与古田会议相关材料: https://www.mod.gov.cn/gfbw/jmsd/4880278.html

– 中华人民共和国国防部,党指挥枪历史节点: https://www.mod.gov.cn/gfbw/gfjy_index/js_214151/4886793.html

– 古田会议政治建军材料: https://slt.fujian.gov.cn/ztzl/dsxxjy/dsrrj/202111/t20211116_5774991.htm

– 共产党员网,古田会议: https://www.12371.cn/2021/08/12/ARTI1628761455544728.shtml

– 党史和文献研究院,古田会议精神的历史考察: https://www.dswxyjy.org.cn/n1/2020/0309/c219021-31623227.html

– 南京大学近代中国研究院,淮海战役期间中国共产党的支前民工工作: https://ccrm.nju.edu.cn/cgyxm/bkwz/2023/20240628/i269361.html

– 国家档案局,淮海战役/渡江战役支前档案: https://www.saac.gov.cn/daj/c100202/201904/feefc563e2c048e1846f51157f4c9b93.shtml

– Britannica, Chinese Civil War, 1947-48: https://www.britannica.com/event/Chinese-Civil-War/The-tide-turns-1947-48

– Stanford University Press, Seeds of Destruction: https://www.sup.org/books/asian-studies/seeds-destruction

军工、科研与颠覆式创新组织

– DARPA Research: https://www.darpa.mil/research

– DARPA Heilmeier Catechism: https://www.darpa.mil/about/heilmeier-catechism

– DARPA Program Managers: https://www.darpa.mil/about/program-managers

– DARPA Become a Program Manager: https://www.darpa.mil/careers/program-manager

– RAND 75-year history: https://medium.com/rand-corporation/rand-turns-75-a-look-through-the-decades-at-world-changing-research-aa3a7fb8690f

– RAND AI failure report: https://www.rand.org/content/dam/rand/pubs/research_reports/RRA2600/RRA2680-1/RAND_RRA2680-1.pdf

– Manhattan Project / Los Alamos: https://www.osti.gov/manhattan-project-history/Events/1942-1945/establishing_los_alamos.htm

– Atomic Heritage Foundation, Building the Bomb: https://ahf.nuclearmuseum.org/ahf/history/building-bomb-1943/

– NPS, Manhattan Project: https://www.nps.gov/mapr/learn/manhattan-project.htm

– NPS, Manhattan Project Site Selection: https://www.nps.gov/articles/000/manhattan-project-site-selection.htm

– Smithsonian, Head Skunk: https://www.smithsonianmag.com/air-space-magazine/head-skunk-5960121/

– Britannica, Kelly Johnson: https://www.britannica.com/biography/Kelly-Johnson

– Lockheed Martin, Skunk Works legacy: https://www.lockheedmartin.com/en-us/who-we-are/business-areas/aeronautics/skunkworks/skunk-works-origin-story.html

– Lockheed Martin, F-117 Nighthawk: https://www.lockheedmartin.com/en-us/news/features/history/f-117.html

– Smithsonian, Grumman F6F Hellcat: https://www.si.edu/object/grumman-f6f-3k-hellcat%3Anasm_A19610107000

– U.S. Air Force B-2 fact sheet: https://www.af.mil/About-Us/Fact-Sheets/Display/Article/104482/b-2-spirit/

– National Museum of the U.S. Air Force, B-2 Spirit: https://www.nationalmuseum.af.mil/Visit/Museum-Exhibits/Fact-Sheets/Display/Article/195832/northrop-b-2-spirit/

– NASA, Managing America to the Moon: https://www.nasa.gov/history/SP-4219/Chapter8.html

– NASA, Apollo Program: https://www.nasa.gov/the-apollo-program/

– GAO, Operation Warp Speed: https://www.gao.gov/products/gao-21-319

– NIH, Operation Warp Speed testimony: https://www.nih.gov/about-nih/nih-director/testimony-operation-warp-speed-researching-manufacturing-distributing-safe-effective-coronavirus-vaccine

– Computer History Museum, Xerox PARC: https://www.computerhistory.org/revolution/story/348

– Britannica, PARC: https://www.britannica.com/topic/PARC-company

– Britannica, Bell Labs transistor: https://www.britannica.com/technology/transistor/Innovation-at-Bell-Labs

当代 AI 公司与访谈

– OpenAI structure: https://openai.com/our-structure/

– OpenAI enterprise AI report: https://openai.com/business/guides-and-resources/the-state-of-enterprise-ai-2025-report/

– OpenAI GDPval: https://openai.com/index/gdpval/

– OpenAI Preparedness Framework update: https://openai.com/index/updating-our-preparedness-framework/

– Anthropic Responsible Scaling Policy: https://www.anthropic.com/news/anthropics-responsible-scaling-policy

– Anthropic Responsible Scaling Policy updates: https://www.anthropic.com/responsible-scaling-policy

– Anthropic Long-Term Benefit Trust: https://www.anthropic.com/news/the-long-term-benefit-trust

– Google DeepMind responsibility and safety: https://deepmind.google/responsibility-and-safety/

– Google DeepMind Frontier Safety Framework update: https://deepmind.google/blog/strengthening-our-frontier-safety-framework/

– Sam Altman, The Gentle Singularity: https://blog.samaltman.com/the-gentle-singularity

– Dario Amodei, Machines of Loving Grace: https://www.darioamodei.com/essay/machines-of-loving-grace

– DeepSeek 梁文锋访谈转译: https://finance.sina.com.cn/2025-02-10/doc-ineiyprh3677882.shtml

– DeepSeek 梁文锋 60 条思考: https://finance.sina.com.cn/jjxw/2025-02-07/doc-ineisaue7591659.shtml

– 36氪,梁文锋的新想法、DeepSeek 的新方向: https://www.36kr.com/p/3303058800089608

– Moonshot 杨植麟访谈整理: https://hub.baai.ac.cn/view/33033

– 谢赛宁访谈整理: https://echo.liujiacai.net/2026-03-16-saining-xie-world-models-ami-labs-yann-lecun-fei-fei-li-and-42/

– 罗福莉访谈: https://www.bianews.com/news/details?id=236687

Agent 能力、企业落地与 ROI

– CMU TheAgentCompany: https://www.cs.cmu.edu/news/2025/agent-company

– TheAgentCompany arXiv: https://arxiv.org/abs/2412.14161

– IBM ST-WebAgentBench: https://research.ibm.com/publications/st-webagentbench-a-benchmark-for-evaluating-safety-and-trustworthiness-in-web-agents

– ST-WebAgentBench arXiv: https://arxiv.org/abs/2410.06703

– METR, Measuring AI Ability to Complete Long Tasks: https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/

– METR, Task-Completion Time Horizons: https://metr.org/time-horizons/

– McKinsey State of AI 2025: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai/

– BCG AI value gap 2025: https://www.bcg.com/publications/2025/are-you-generating-value-from-ai-the-widening-gap

– BCG The Widening AI Value Gap: https://www.bcg.com/assets/2025/the-widening-ai-value-gap.pdf

– BCG AI Radar 2025: https://www.bcg.com/press/15january2025-ai-optimism-autonomous-agents

– Gartner Agentic AI cancellation forecast: https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027

– Microsoft Work Trend Index 2025: https://www.microsoft.com/en-us/worklab/work-trend-index/2025-the-year-the-frontier-firm-is-born

– Deloitte State of AI in the Enterprise 2026: https://www.deloitte.com/us/en/what-we-do/capabilities/applied-artificial-intelligence/content/state-of-ai-in-the-enterprise.html

– NVIDIA CEO Letter 2025: https://images.nvidia.com/pdf/Annual-NVIDIA-CEO-Letter-2025.pdf