海康整套工业软件生态以观澜(Guanlan)多模态工业大模型为核心底座,实现机器视觉、产线编排、MES、设备运维、调度平台全链路大模型嵌入,分为原生内置大模型能力、第三方模型兼容对接、云端 - 边缘协同推理、业务系统 API 打通四大接入路径。

一、核心底座:观澜工业大模型三层架构
- 基础层
:多模态通用大模型(图像、语音、文本、光谱、超声、毫米波多感知融合)、语言理解、智能体调度引擎 - 工业垂类层
:质检大模型、SOP 行为大模型、设备预测维护大模型、安全生产大模型、包装齐套大模型等行业微调模型 - 软件适配层
:面向 VisionMaster、LogicAgent、AI 开放平台、工业超脑、MES/WMS 的标准化接入 SDK 与节点组件
二、主力工业软件大模型接入方案
1. VisionMaster(VM 机器视觉软件,最核心视觉工具)
VM V4.4 及以上深度集成观澜大模型推理引擎,两种接入模式:
(1)原生观澜大模型节点(零代码拖拉拽)
内置大模型专用算子:小样本缺陷检测、通用物体识别、语义分割、自然语言图像检索、OCR 大模型、动作识别
传统深度学习:需数百张标注图训练;观澜大模型1–8 张样品图即可注册生成检测模型,分钟级上线产线 适配场景:PCBA 虚焊、五金划痕、塑胶变形、包装配件齐套、字符模糊识别 推理部署:可跑工控机 GPU、海康 AI Box、工业相机端侧算力 
VM深度学习大模型模块界面
(2)兼容第三方 ONNX 大模型导入
支持外部训练大模型(YOLOv8、SAM、自研视觉大模型、LLM 轻量模型)导出 ONNX 格式,通过「深度学习加载 / 推理」节点接入 VM 流程流程:PyTorch/TensorFlow → ONNX 导出 → VM 加载 → 图像预处理→大模型推理→NMS 后处理→对接 PLC/IO 输出
(3)跨软件联动:VM ↔ DLCV 深度视觉平台
DLCV 训练观澜微调模型,一键导出加密模型包,直接在 VM 里调用推理,适合高精度 X 光、高光谱、超声无损检测场景
2. LogicAgent 工业算法编排软件(产线流程大脑)
搭载观澜工业大模型的低代码编排平台,是产线大模型调度中枢
能力:大模型智能体编排、SOP 装配行为校验、工序顺序纠错、人机动作识别 接入逻辑:相机图像流送入大模型做行为语义理解,输出合规 / NG 信号下发 PLC、MES、声光报警 柔性制造优势:换产无需重写逻辑,大模型自动适配新品规格,实现零延迟换产
3. AI 开放训练平台(大模型训练 + 发布中台)
全链路大模型生产、调优、发布、管理平台,为所有工业软件供给模型服务海康威视AI开放平台
训练端:自动标注、迁移学习、模型架构搜索、大模型轻量化剪枝量化 发布三种输出形态,供工业软件调用: 模型文件:给 VM、LogicAgent 本地离线推理 HTTP/GRPC API 服务:供 MES、WMS、第三方 ERP 远程调用大模型能力 边缘固件包:刷入工业相机、AI 超脑、AXI 检测设备端侧运行 多租户私有部署:工厂内网私有化大模型训练,数据不出厂
4. 工业超脑 / AI Box 边缘硬件配套软件
边缘分析软件内置观澜推理 runtime,实现端侧大模型实时分析,数据轻量上云:
多相机多路视频流并行大模型解析:人员安全帽、工装、设备跑冒滴漏、区域入侵 结果通过 OPC UA、MQTT 对接组态软件、MES、SCADA 低时延:工业安全场景信号输出至安全继电器时延≤100ms
5. MES/WMS/ 数字孪生业务系统集成
官方打通:海康自研 HikMES、智能仓储 WMS 原生对接观澜大模型 API 大模型根据订单、产能、设备状态智能排程;异常工单自动分析根因 包装工位视觉大模型齐套数据实时回写 MES 质检台账 第三方 MES 兼容(如摩尔元数等):标准 API、OPC UA 双向互通,视觉大模型质检结果、设备预测性维护数据写入制造执行系统
三、三大主流接入部署模式
模式 1:本地离线私有化(工厂内网首选,数据安全)
大模型权重部署在厂区 GPU 服务器 / AI 集群 VM、LogicAgent、边缘设备内网访问推理服务 完全断外网,适合汽车、半导体、军工等高保密制造
模式 2:边缘端侧轻量化推理(产线工位实时检测)
观澜大模型经过 AI 编译器量化压缩后,部署在工业相机、AXI、AI Box、工控机小算力;VM 直接调用本地硬件推理,无云端延迟海康威视AI开放平台
模式 3:云边协同混合部署
云端:大模型微调、批量样本训练、模型版本管理、全局数据分析 边缘:工位实时推理、信号控制、本地缓存;定时上传异常样本回云端迭代优化
四、对外兼容:接入第三方通用大模型(GPT、DeepSeek、通义等)
海康大模型一体化平台支持多 LLM 兼容融合:
平台内置 API 网关,可接入外部语言大模型 应用场景: 产线操作人员自然语言提问:“今天 A 产线 NG 不良 Top3 缺陷是什么”,大模型读取 VM 质检数据库生成分析报告 故障语音对讲:设备报警后,语音描述故障,LLM 匹配维修知识库推送解决方案 安全隔离:外部 LLM 仅处理文本问答,工业视觉、控制核心数据不对外流出
五、典型落地应用场景(软件 + 大模型闭环)
- 3C/PCBA 质检
VM + 观澜 X 光大模型,AXI 设备检测虚焊、连锡,检出率 99%+,效率提升 80%,不良数据自动同步 MES 品质模块 - 汽车零部件装配防错
LogicAgent + 动作识别大模型,监控螺丝顺序、配件正反、线束插接,错序立即锁机报警 
- 柔性包装齐套检测
1–8 张样品图训练大模型,识别数十种配件堆叠 / 平铺形态,换产一键切换模型,单线人工目检成本下降 40%+ - 工厂安全生产管控
边缘超脑大模型识别未戴护具、越界、设备高温异响,信号直连安全 PLC - 设备预测性维护
大模型融合振动、温度、视觉漏油数据,VM 采集设备外观图像,提前预判轴承、电机故障,推送工单至 MES 运维模块
六、开发对接技术接口清单
VisionMaster:内置大模型算子;C#/C++ 二次开发 SDK 可调用推理接口 AI 开放平台:RESTful API、GRPC 模型推理接口、模型管理 API LogicAgent:低代码拖拽 + 脚本调用大模型智能体 工业互联标准:OPC UA、MQTT、Modbus 对接 PLC/SCADA/ 组态软件 模型格式:原生观澜加密包、通用 ONNX、TensorRT
七、对比传统小模型的核心优势
八、实施注意事项
VM 最低版本建议 V4.4 及以上,旧版本无原生大模型节点; 高精度场景(X 光、超声)建议搭配 NVIDIA RTX 工控 GPU 或海康自研 AI 算力卡; 涉密工厂优先选本地私有化部署,禁止公网大模型直连产线控制; 第三方大模型导入后建议做精度复测,工业场景优先用观澜垂类微调模型稳定性更强。
热门文章推荐:点击直接进入相关文章:
001:从业五年,浅谈如何搞定机器视觉
002:干货PPT分享 | 3D机器视觉技术在智能制造中的应用!
005:机器视觉加速从2D走向3D
009:常见机器视觉误判原因分析
010:机器视觉三维成像方法及应用

夜雨聆风