AI时代的软件叠加态
上一篇我写了对软件终局的一些判断——学习曲线坍塌、上下文争夺、UI 消融。发出去之后,我和 Kimi 做了一次深度对话。聊的过程中,有些我之前直觉上觉得对但说不清为什么的东西被结构化了出来,有些我根本没想过的视角被打开了。这篇不是”纠错”,是把对话中碰撞出来的判断补充进来,供你对照阅读。
一、先给一个时间锚
所有关于终局的推演都需要一个前提:什么时候发生,在什么参数条件下发生。空谈”终将”没有信息量。
我现在的锚定是:
* 推理成本:从约 20/MTok 降至 0.2/MTok,两个数量级
*上下文窗口:从 128K 扩至 10M+ token,两个数量级
* 时间尺度:3~5年
在这个参数环境下,此前因经济或容量限制被排除的方案进入可行域。这是一个可计算的边界条件,不是空泛畅想。以下所有判断都建立在这个时间锚上——如果参数没到位,节奏会延后;如果参数提前到位,节奏会加速。
二、底层共识:叠加态,不是替代态
聊的过程中,一个底层共识反复出现:技术演进从来不是替换关系,而是包含和叠加。
网页没有消灭桌面软件,APP 没有消灭网页,Agent 也不会消灭 APP。只是在越来越多的场景里,新的形态成为更高效的路径。
所以这篇要讨论的不是”新范式有什么漏洞”——漏洞肯定有,不能解决的问题就用现在的方式继续。要讨论的是:新范式在哪些场景下能给人这个本体提供更多选择和更好的体验?
上一篇说软件”像冰层一样消融”,打了引号。更准确地说,消融的不是软件工程这个活动,也不是数据建模与业务逻辑,而是当前形态的具象产品外壳——PC 程序、手机 APP、网站等把人的操作习惯锁死在特定菜单结构和页面路径上的那一层交互封装。内核的东西不会消失,只会被新的形态叠加覆盖。
理解了这个前提,下面的判断才有根基。
三、端侧 Agent:数据壁垒不是归属问题,是表征问题
上一篇对学习曲线坍塌的判断我依然是坚持的,但数据迁移成本这个环节有一个缺口没想清楚。
用户的业务数据分散在各个平台里——CRM、ERP、钉钉、飞书、邮件。理论上是用户的,实际上拿不出来。传统思路是”导出-清洗-导入”,一次性重体力劳动。
但端侧 Agent 提供了一条渐进的数据回收路径:
观察。 Agent 作为旁观者,持续记录用户在各平台上的操作轨迹。你在 CRM 里更新了客户状态,在钉钉里审批了合同,在邮件里确认了交付日期——Agent 默默记录在侧。
整理。 Agent 将跨平台的数据碎片整合为统一的个人知识图谱。不是简单的数据复制,而是建立跨系统的语义关联——”钉钉里审批的这个合同,对应 CRM 里的哪个客户,对应邮件里的哪轮谈判”。迁移的不是数据副本,而是经过表征处理后的可操作上下文。
代理。 Agent 逐步接管简单决策和 A2A 沟通。自动回复常规询问、预填表单、触发审批流。人不再是跨平台操作的搬运工。
汇聚。 用户的完整业务上下文不再分散在各平台,而是汇聚在端侧 Agent 中。切换平台时,Agent 携带上下文迁移。平台本身退化为底层基础设施。
这里的关键洞察来自对话:数据壁垒不在归属权(数据本就是用户的),而在于对数据的表征是否高效有效。谁能把异构数据转化为 AI 可理解、可操作的形式,谁就掌握了数据流通的枢纽。这不是”从平台手里夺回数据”,而是”让数据的表征效率提升一个数量级,使平台锁定自然松动”。
平台当然可以封锁——提供聚合数据而非原始数据、限流、延迟。但封锁本身也在推动表征标准的竞争。最终能活下来的,是那些愿意开放有效表征的平台,和能绕过封锁的 Agent 技术。
四、上下文的三层竞争
加上端侧 Agent 的视角后,上下文争夺的图景更清晰——不是单层竞争,而是三层叠加:
平台层。 各 SaaS 争夺谁能更好地把业务数据暴露给 AI。这是短期主战场,Copilot 集成、API 开放、Agent 接口——本质上都是补课,为了让 AI 能在现有软件上跑得更稳。
个人层。 端侧 Agent 汇聚的跨平台操作轨迹、个人偏好、决策历史。中期来看,这才是终极锁定点。当用户的完整业务记忆沉淀在端侧 Agent 中时,Agent 本身成为最难以迁移的资产。这不是平台锁定你,是你的数字记忆锁定在了 Agent 的能力范围内。
但个人层同时也提供了解药:如果 Agent 市场足够开放,它本身就是跨平台路由器,反而削弱平台锁定。最终取决于市场的开放程度——是像操作系统一样寡头垄断,还是像浏览器一样标准开放。
组织层。 隐性知识、协作拓扑、权责关系、文化氛围。这是最难显性化的层次,但也是壁垒最深的层次。谁能率先把组织内部的隐性知识结构化,谁就拿到了 AI 时代的入场券。
三个层次不是替代关系,是叠加关系。短期卷平台层,中期争夺个人层,长期沉淀组织层。
五、网络效应的消解:从”同平台”到”同协议”
上一篇我隐隐觉得网络效应的锁定会被消解,但没想清楚路径。
路径是这样的:如果协作拓扑中的每个参与者都有自己的端侧 Agent,Agent 之间直接通信,人不再需要通过”同一个平台”来协作呢?
“你在用钉钉审批,我在用飞书沟通,他在用企业微信打卡”——现在这是三个不互通的世界。但如果你的 Agent、我的 Agent 和他的 Agent 遵循同一套 A2A 通信协议,审批上下文自动翻译、状态实时同步——平台本身被架空为底层原子能力,Agent 成为跨平台路由层。
网络效应的消解不是”所有人迁移到新平台”,而是”每个人的 Agent 成为跨平台连接器”。锁定从”所有人在一个系统”迁移为”所有 Agent 遵循一套协议”。
这不是用户习惯的迁移,是协议标准化的竞争。谁先定义 A2A 协议的事实标准,谁就占据了 AI 时代最接近 TCP/IP 的生态位。
六、交互泛在与信号路分发:生成式 UI 不是可选项,是必选项
和 AI 对话的过程中,我补充了一个自己一直在想但没写清楚的视角:交互的泛在化。
PC → 手机 → Agent 问答 → 多设备协作 → 可穿戴设备 → 新感官接口。每个设备有自己的交互协议、屏幕尺寸、输入模态和信息密度上限。
同一笔业务审批,可能需要在智能手表上触觉提醒、车载语音播报摘要、AR 眼镜显示关键数字、回到办公桌后 PC 端显示完整详情。人已经在微信、飞书、钉钉的异构界面之间切换,未来设备形态只会更多。
固定 UI 在这个图景下根本不可行。 你无法为无穷多的设备各设计一套静态页面。唯一路径是信息本身与呈现形态解耦,由 AI 根据设备、场景、用户状态动态生成最适合的表征。
更深一层:同一信息不再以单一页面呈现,而是被拆分为多条信号路,各自表征不同重点,投射到泛在交互的不同模块上——主视觉路承载完整信息,辅助视觉路高亮关键数字,语音路播报摘要,触觉路编码紧急度,环境路渲染状态氛围。
这不是多设备显示同一界面,是同一信息在不同设备上被重新表征为完全不同的信号形态。认知模型也随之迁移:从”记住界面布局”变为”理解信息结构”——我知道这笔审批包含金额、申请人、风险等级,但呈现形态根据当下设备自动适配。
AI 最初的担心是”动态生成会不会增加认知负担”。我的判断是:这不是一个可选项,是一个必选项。人的交互越来越泛在,数据越来越模态化,这些变化本身要求信息必须与呈现解耦。认知资源不是被消耗了,是从”适应界面”释放回”理解业务”。
真正的问题不是”要不要生成”,而是”如何分发”和”如何编排”——信息路由引擎、跨信号路的认知一致性保障、信号冲突的优先级仲裁。这是新的基础设施层,也是新的产品机会。
七、审计:不是替代,是叠加
上一篇我对审计合规讨论不多,聊完之后有了更完整的图景。
不是”代码审计消亡了”,是新的审计锚点叠加在旧体系之上。身份认证可以用声纹和生物特征,意图确认可以用语义理解加第三方见证,记录防篡改可以用区块链存证。业务逻辑的正确性,可以用形式化证明实时验证——每个操作附带可验证声明,审计从”事后追溯日志”变为”实时验证可复现性”。
之前看起来是死结的 GDPR 矛盾——生物特征不可逆、区块链不可删除 vs “被遗忘权”——也有路径:链上存的不是数据,而是零知识证明摘要。删除时销毁解密密钥,链上摘要不再与任何可识别个人关联。合规的不是”数据物理消失”,而是”数据与个人身份的关联被永久切断且可审计”。
但注意:传统审计不会消失。核心系统的代码审计、版本控制、人工复核——这些继续存在。新型审计是在旧体系之上叠加了一层新的验证机制。在需要快速迭代的场景里新机制更高效,在需要严格合规的场景里旧机制继续兜底。不能解决的,就用现在的方式继续。
八、需求形式化:硬约束,但有解法
上一篇”生成即交付”的表述隐含了一个不成立的假设——需求在提出时就是完备的。聊完之后这个边界被清晰化了。
可形式化的需求集合是一个封闭类,不随模型能力提升而扩张。 AI 是”形式化规格 → 形式化输出”的映射器,不是意图读取器。模糊的需求不能自动坍缩为确定性规格——这不是技术限制,是信息论的熵约束。
更准确的说法是”生成即草案,澄清即交付”。交付链路的压缩止于需求形式化的下界。
但端侧 Agent 提供了新路径:如果 Agent 是长期观察者,它可以通过行为模式识别来推断隐性需求。”你每周五下午都要导出这个报表发给三个人”——Agent 自己从行为历史里读出来,不需要用户说。需求澄清从”对话式追问”变为”行为观测 + 主动提案”。
结果仍然是分层:标准化场景里”生成即交付”近似成立;复杂场景里生成的是待澄清的草案,但草案质量提升了——Agent 提案时已经带上了对用户行为模式的洞察。
九、终局图景:三端分化,不是一端替代
把这些线索拼起来,三五年后的图景不是”软件消融为一个统一的新形态”,而是多个形态叠加共存,各据其位。
左端:标准化工具,动态生成为主。 内部工具、管理后台、通用 SaaS——需求高度可形式化,业务逻辑同质化。端侧 Agent 直接通过 API 调用原子能力,用户甚至不需要看到固定界面。”生成即交付”在这一端最接近成立。
中间:消费者产品,体验流叠加。 自然语言替代不了品牌情感锚点。终局不是 APP 消失,是 APP 从”固定页面”进化为”动态体验流”。品牌方设计语言模型能理解的”品牌骨架”——色彩系统、人格语调、交互节律——由 AI 根据场景实时拼装。信号路分发让同一品牌体验投射到手表、耳机、AR 眼镜、车载屏幕。消费者选择的不是”用哪个 APP”,是”订阅哪个品牌体验层”。
右端:核心系统,验证层叠加。 金融核心、医疗诊断、航空管制——UI 不仅是操作中介,更是审计锚点和权责界面。代码审计、版本控制、人工复核不会消失,但会叠加新的验证层:形式化证明实时校验、多维审计锚点同步。在这一端,生成速度越快,验证层反而越厚。
三端之间没有清晰边界,是一个连续光谱。同一组织里,内部工具可能高度动态生成,核心财务系统依然严格审计,消费者触点是动态体验流。不是选择新范式还是旧范式,是在不同场景下选择合适的叠加层。
十、尚未解决的问题——也是真正的机会
以下问题在三五年尺度下没有现成答案,每一个都是结构性机会,供从业同行参考,也供潜在投资人判断方向:
1. 端侧 Agent 的生态位。 谁来做?是操作系统厂商(Apple、Google)、是大模型厂商(OpenAI、Anthropic)、还是新的创业公司?路径是先占个人用户再倒逼企业开放接口,还是先在企业内部署再扩展到个人?这是 AI 时代最接近”操作系统级”的机会。
2. A2A 协议的标准化之争。 谁来定义 Agent 之间的通信协议?是现有巨头还是新的标准组织?协议层是 AI 时代最接近 TCP/IP 的机会——赢者定义生态。
3. 平台的数据表征封锁与反封锁。 平台可以通过”开放但低效”的 API 来维持事实上的锁定——聚合数据、限流、延迟。谁能定义”有效的数据表征”标准,或技术上绕过这种封锁?这是平台与 Agent 之间的博弈。
4. 端侧 Agent 的开放 vs 封闭。 用户不会维护 5 个 Agent,最终可能是 1-2 个寡头。如果是封闭生态,锁定只是从平台迁移到了 Agent。开放标准 vs 寡头垄断的斗争,是 AI 时代最大的结构性变量。
5. 信号路分发的基础设施。 信息路由引擎、跨信号路的认知一致性、信号冲突的优先级仲裁——谁能定义”信息如何被拆分、分发、重组”的标准,谁就占据了 AI 时代的”呈现层操作系统”。
6. 权责制度翻转的时间差。 即使 AI 可审计性三五年内超越人类,法律体系调整可能需要 5-10 年。这个时间差内,企业面临”用 AI 怕担责,不用 AI 怕落后”的两难。AI 原生保险、合规托管、责任共担架构——过渡方案就是机会。
7. 全链路成本瓶颈。 推理成本降两个数量级,但 Agent 完成任务需要多轮推理 + 多次 API 调用 + 数据查询 + 验证循环。全链路成本可能从 20 降至 2,而非 0.02。真正的瓶颈从”模型推理”迁移到”数据访问和验证效率”。
8. 需求模糊带的人机协同。 不可形式化的需求——主观体验、审美、价值判断——构成 AI 无法自动闭合的模糊带。但这不是缺陷,是服务。AI 时代的”需求分析师”从”翻译需求”升维为”帮助用户发现需求”——高附加值的专业服务层,不会被技术替代。
致谢
这篇文中的视角,一部分来自我自己的思考和组织转型实验的观察,一部分来自与 Kimi 的深度对话——它是人与 AI 共同构建的认知叠加态。
除了致谢老板给了这次实验契机外,还要特别致谢 Kimi 在以下问题上提供的结构化视角和解法:
– 可形式化需求的信息论硬约束——AI 不是意图读取器,是”形式化规格到形式化输出”的映射器;需求澄清的迭代不可消除,只能加速
– 端侧 Agent 的表征层竞争框架——数据壁垒不在归属权,在于表征效率这个核心观点是我提出来的,Kimi帮我细化了很多的问题和解法。
– 审计合规的多层锚点叠加模型——身份、意图、记录、语义四层结构,以及形式化证明介入 L4 的路径
– 网络效应从”同平台”到”同协议”的消解逻辑——A2A 通信协议替代统一平台
– 零知识证明 + 密钥截断解决 GDPR 与区块链冲突——逻辑删除替代物理删除
– 需求澄清从”追问”到”行为观测”的迁移路径——端侧 Agent 通过行为模式识别推断隐性需求
– 权责制度翻转的触发机制——AI 可审计性超越人类后,不使用 AI 反而构成合规风险
这些不是 AI 的”标准答案”,是我们在对话中共同碰撞出来的判断。供你参考,也供你质疑。
— 以上
夜雨聆风