百厂之中,一基之重 · 集团软件工厂建设指南
01
-
软件工厂建设有三阶段成熟度——零散期 / 集中期 / 联邦期。多数集团目前处于零散期,头部集团已开始走向集中期(总厂 / 分厂模式),联邦是集中期的成熟形态——三阶段不是替代关系,是演化关系。 -
美军 50+ 工厂走的就是联邦——Platform One 共享底座 + 军种工厂集群 + 数百个 Tiger Team;底座、工厂、交付小队三层各司其职。 -
集团做底座,不做工厂:国产加固镜像仓 + DevSecOps 参考架构 + 多级密分接入规范 + 三合一合规接口(GJB 5000B + 等保 2.0 + 新网安法 2026)+ 共享代码 / 模型 / 数据集仓。 -
院做领域工厂:在集团底座上加本院特殊工具 + 维护「型号 × 平台」模板库——雷达 / 卫星 / 导航 / 舰船 各领域各建,不是各院各建。 -
所派 Tiger Team,不建独立工厂:6—15 人小队接入院级流水线,聚焦型号交付。所级独立建厂是”看似自主、实则孤岛”的最大陷阱。 -
联邦能不能跑通,看接口契约——集团 → 院、院 → 所、院 ↔ 院 三组接口必须清晰且强制;任何”绕过”必须升级到上一层,这是联邦底线。
02

-
重复造轮子的成本累积:国产 CI/CD 工具链联调、SBOM 自动生成、涉密多级网络接入、合规证据自动留存——这五件事每个院都要单独做一遍。横向复用本可以把总成本压到三分之一。
-
工程师无法跨院流动:每个院的工厂是独立技术栈,X 院的平台工程师跳到 Y 院,要重新学一套工具链——工程师被绑死在原院,军工工程师圈的整体能力流动停滞。
-
模型 / 数据集 / 安全规则隔离:每个院有自己的模型仓 / 数据集仓 / SAST 规则——跨院共享几乎不可能。这一点在 AI 时代尤其值得关注。
-
业务领域跨度大:一个集团下可能同时有雷达、卫星、导航、电子对抗、舰船等多个领域,总厂的工具链、流水线、安全规则,难以同时合适所有领域。最终结果是总厂被迫做”最小公约数”,每个院都觉得它”不够专”。
-
响应速度有上限:集团离一线远,院级的工程问题要走集团审批——快则两周,慢则两月。在型号节点逼近时,院 / 所有压力会绕开总厂自己写脚本。
-
领域文化适配难:每个院有自己的工程师文化——电子对抗讲求快速响应、卫星讲求极端可靠、雷达讲求精度——总厂只能是文化的最大公约数。
-
集团从”做工厂”转变为”做底座”:不再直接交付型号软件,而是为各院提供共享底座——加固镜像仓、DevSecOps 参考架构、多级密分接入规范、三合一合规接口(GJB 5000B + 等保 2.0 + 新网安法 2026)、共享代码 / 模型 / 数据集仓
-
分厂从”被托管”升级为”领域工厂”:在集团底座之上,加入本院的领域特殊工具(雷达仿真 / 卫星地面站 / 导航测试 / 舰船控制等),维护本院的「型号 × 平台」模板库
-
所级派 Tiger Team 接入领域工厂:不建独立工厂,以 6—15 人小队接入本院领域工厂,聚焦型号交付
-
集团是否有统一的加固镜像仓 + 共享代码仓?——没有 → 阶段 0;有 → 至少阶段 1
-
院 / 所是否在集团统一标准下做交付?——没有 → 阶段 0;有 → 阶段 1 或 2
-
集团是否自己直接交付型号软件?——是 → 阶段 1(总厂模式);否,集团只提供底座 → 阶段 2(联邦)
03

-
Iron Bank:加固容器镜像仓库,数千个签名 + 漏洞扫描通过的镜像,供所有工厂直接拉用
-
Big Bang:DevSecOps 参考架构(Kubernetes + Istio + ArgoCD + Vault 的开源栈)
-
Party Bus:多账户 IL2 / IL5 / IL6 隔离环境,对应不同密级的工程能力部署
-
Repo One:代码与制品托管,所有工厂的开源贡献回流入口
-
空军:Kessel Run(加油机 / 空中作战)、Kobayashi Maru(后勤)、LevelUP、Section 31(太空)、Forge、Bespin
-
陆军:Army Software Factory(2021 年建)
-
海军:Black Pearl
-
DoD 跨军种:Bravo(数据 / AI)、Tron(网络战)、Argos
-
使命多样性:加油机软件 ≠ 太空作战软件 ≠ 后勤软件——一个总厂解决不了所有问题
-
密级隔离:不同工厂有不同安全边界,无法集中在同一个物理或网络空间。Party Bus 多账户隔离正是为了在底座层支持各工厂的独立合规边界
-
速度:集中化 = 瓶颈。50+ 工厂同时演进,最佳实践会自然在工厂之间流动
-
文化适配:每个使命域有自己的文化,工厂要贴合,不能一把抓
04

-
国产加固镜像仓(对标 Platform One 的 Iron Bank)。集中维护一份所有院 / 所都可以拉用的加固容器镜像库——每个镜像经过签名 + 漏洞扫描 + 合规审视。各院 / 所不再单独构建基础镜像,大幅降低重复劳动和合规盲区。 -
DevSecOps 参考架构(对标 Big Bang)。集团提供一份”参考实现”——包含完整的 CI/CD 流水线、安全门禁、SBOM 生成、签名验证、合规证据自动留存的端到端范本。各院在此基础上裁剪适配,不再从零搭建。 -
多级密分接入规范(对标 Party Bus)。涉密 / 非涉密多级网络的统一接入接口、单向网闸规范、跨级数据流转的合规协议——这是集团必须定的标准,任何单一院 / 所都定不出(因为它需要跨院共识)。 -
三合一合规接口。GJB 5000B 过程域 + 等保 2.0 + 新网安法 2026 三套合规要求的统一证据接口——任何工厂只要按这个接口产生证据,自动满足三套合规框架。这件事是集团最高价值产出之一,因为它把合规从负担变成了可工程化的协议。 -
共享代码 / 模型 / 数据集仓。集团级的代码托管、模型仓、数据集仓——所有院 / 所的非涉密成果都可以横向流通。这件事在 AI 时代尤其关键:一个院训练好的模型,可以被另一个院直接复用,而不是”看到了用不了”。
-
不要直接交付型号软件。集团一旦开始做型号交付,就和院 / 所产生竞争关系——而集团既不懂任何具体型号,又有最大的话语权。结果是底座建设被边缘化、型号交付质量下降两头都失。这是阶段 1 的总厂模式之所以有边界的根本原因。 -
不要本地化部署。集团做底座,提供的是接口和标准,不是部署。任何”我帮你部署一套”的承诺,都会让集团团队被 100 个院 / 所的部署事务拖垮。底座是公共资产,不是私有部署。 -
不要强制业务管控。集团对底座有权,对业务无权。任何”这个工具必须用、这个流程必须走”的强制管控,都会被院 / 所规避或形式化执行。让底座做得好用,是让人愿意接入的唯一长期手段。
-
减法:把目前总厂里”直接做型号交付”的部分剥离,交还给院 / 所
-
加法:把目前总厂里”工程能力”沉淀成可复用的接口——加固镜像、参考架构、密分规范、合规接口、共享仓
-
对外姿态变化:集团不再说”接入我的总厂”,而是说”接入我的底座”——接入门槛降低,可定制度提升
05
-
在集团底座上部署本院专用实例。每个院在集团底座之上,部署一个本院专用的工厂实例——复用集团的加固镜像、参考架构、合规接口,加上本院的特殊配置。这一步是”接底座”的核心动作。 -
加领域特殊工具。不同领域有不同的工程特殊性——
-
雷达院:雷达仿真 + 信号处理仿真 + 多目标跟踪测试工具链
-
卫星院:轨道仿真 + 星间链路测试 + 地面站接入测试
-
导航院:多源融合算法测试 + 误差注入测试 + 抗干扰场景仿真
-
电子对抗院:对抗场景仿真 + 频谱分析 + 自适应博弈测试
-
舰船院:海况仿真 + 实时控制系统接入 + 机舰联合测试
-
维护本院”型号 × 平台”模板库。本院下属的所做不同型号,但很多型号有共性——比如同一个雷达院下的不同雷达型号,大量的开发流程、安全规则、测试用例可以复用。院级的”型号 × 平台”模板库就是这种共性的沉淀,让新型号 1 周内能接入,而不是从头来一遍。 -
培养本院的平台 / 安全 / MLOps 工程师。这三类新角色(在系列下篇里详细讲过)在院级建设——他们既理解本院领域专业,又懂工程效能与安全,是联邦能跑通的关键人才。所级的 Tiger Team 工程师由院级老角色带出来。 -
维护院级的合规证据接口。本院的合规证据按集团统一接口产生,但具体的领域特殊合规要求(比如某些型号有额外的特殊审视要求)在院级实现。这是”通用合规 + 领域特殊合规”的合理分层。
06
-
所级体量小,无法支撑独立工厂的运维。一个独立工厂需要至少 5—10 人的平台 / 安全 / MLOps 团队来维护——但一个所通常只有 30—80 人的总规模。让所拿出 10% 的人去建工厂,等于让所放弃型号交付能力。 -
所级专业窄,工程师无法跨型号流动。所通常专注一两个型号,独立建工厂会让平台 / 安全 / MLOps 工程师被”绑死在一两个型号上”——他们的能力得不到充分锻炼,也无法在所之间流动。 -
所级独立工厂会和院级工厂重复。所属于院,所建工厂会和院级领域工厂直接重叠——两套工具链、两份合规接口、两个模型仓——重复造轮子的成本不可接受。 -
所级独立工厂在 5 年后会变成”僵尸工厂”。独立的所级工厂,5 年后通常无法演进——人撤、不维护、合规不更新、和上层底座失联——成为最难处理的技术债。
-
小队规模:6—15 人,跨职能(开发 + 测试 + 安全 + 合规对接)
-
接入路径:复用院级流水线、模板库、合规接口——不需要自建任何工程基础
-
聚焦内容:具体型号的需求理解 / 设计 / 编码 / 测试 / 部署 / 运营 / 监控
-
能力成长:小队成员可以在不同型号 Tiger Team 之间轮动,能力随轮动加深
07

-
加固镜像 API:院级工厂从集团镜像仓拉用加固镜像,带签名验证
-
参考架构包:院级工厂从集团获取 DevSecOps 参考架构(IaC 形式),做适配后部署
-
合规证据 API:院级工厂产生的证据,按集团统一接口上报,自动满足三合一合规
-
代码 / 模型 / 数据集 API:院级跨院共享通过集团仓,带访问控制
-
多级密分接入 API:涉密 / 非涉密环境之间的数据流转,走集团统一规范
-
流水线接入规范:所级 Tiger Team 接入院级流水线,有标准的接入文档 + 模板代码
-
模板库使用规范:所级 Tiger Team 复用本院”型号 × 平台”模板库,有版本管理和变更流程
-
领域工具 API:所级 Tiger Team 调用本院特殊工具(雷达仿真等),通过统一 API
-
异常升级路径:Tiger Team 遇到流水线 / 工具 / 合规无法处理的异常,有清晰的升级路径(到院级平台 / 安全 / MLOps 工程师)
-
模型仓共享规范:不同院之间的模型,如何标准化、如何共享、如何溯源
-
数据集互通规范:数据集如何脱敏、如何标注、如何在多个院之间流转
-
工程师跨院流动路径:平台 / 安全 / MLOps 工程师在不同院之间轮岗的机制
-
跨院最佳实践流通:某个院发现的工程最佳实践,如何流通到其他院
08

-
第一步 · 集团做底座 MVP。对标 Platform One 早期形态,先做加固镜像仓 + DevSecOps 参考架构这两件事——这是联邦的最小可行底座。其他底座能力(密分接入、合规接口、共享仓)在第二步逐步加。过渡判据:有 1—2 个院能从底座拉到加固镜像并跑通构建。 -
第二步 · 挑 1—2 个先行院。选择信息化基础好、有真实交付压力、有关键人物支持的院,作为”先行院”——在集团底座上建第一个院级领域工厂。先行院不需要完美,需要”跑通”。过渡判据:先行院在底座上完成第一次完整版本交付,合规证据通过审计。 -
第三步 · 先行院的所级开始接入。先行院下属的所,选 1—2 个试点型号,组建 Tiger Team 接入院级流水线——先行院 + 试点所 + Tiger Team 三层串通,这是联邦最小完整循环。过渡判据:Tiger Team 在新流水线上稳定交付 ≥ 6 个月,无重大事故。 -
第四步 · 横向复制 + 底座演化。先行院的成功复制到其他院;同时集团底座持续演化(加合规接口、共享仓、多级密分接入)——横向 + 纵深同时推进。这一步没有终点——联邦是一个持续演化的形态,底座永远在升级,工厂永远在新增。
-
错配一 · 集团想做总厂,所有事都集团说了算。表现:集团团队的 KPI 还是”上架了多少工具”,而不是”被多少院复用”。解法:KPI 重设——从”上架率”改成”复用率 + 接入院数”;集团绝不直接交付型号软件。
-
错配二 · 院 / 所各自建,无横向复用。表现:各院 / 所在没有底座的情况下自建工厂,5 年后发现底座建不起来——因为各家方言已经成形。解法:集团必须先建底座,再让院 / 所在底座上建本地实例——次序不能颠倒。
-
错配三 · 跳过院级,集团直接管所。表现:集团 → 所 跨度太大,没有”领域专业层”;一旦出问题,中间没有人能斡旋。解法:院级必须存在——它的价值不是”管理层级”,而是”领域专业枢纽”。
09
-
通过权——决定一个动作能不能放行——
-
卡住权——决定一个动作必须停止——
-
绕过权——这是联邦的底线——
10
11
夜雨聆风