【云端会客厅】从数据到智能:泛制造业 AI-ready 数据底座的破与立

【云端会客厅】从数据到智能:泛制造业 AI-ready 数据底座的破与立 | 精彩回顾

DTinsight导读：

在制造企业迈入 AI 应用深水区的过程中，数据环境复杂、标准不统一、业务系统林立、历史包袱沉重等现实难题正阻碍大模型落地。构建统一、开放、可扩展的数据底座，正成为制造业迈向智能化进程中亟待破解的关键命题。

为帮助泛制造业构建AI-ready的企业级数据底座，夯实AI创新所需的高质量、可信数据基础，4月16日，DTinsight中国数智发展研究中心举办【云端会客厅】线上直播，特邀东山精密集团IT高级总监赵力、海辰储能AI研究院院长徐晓卓、Cloudera大中华区副总裁刘汨春、Cloudera华东区资深客户经理杨昀、Cloudera大中华区制造业资深架构师是灏做客直播间，以“泛制造业如何构建AI-ready的企业级数据底座”为主题，聚焦AI与数据融合发展、直面泛制造业面临的数据困惑，揭秘企业如何企业构建高质量、可靠可信数据底座，为AI时代做好准备。

本次直播设有开场致辞、主题演讲和圆桌对话等环节，嘉宾们分享了深刻见解，展开精彩的思想碰撞。

本次直播由DTinsight中国数智发展研究中心执行主席王雪娜主持，她表示，当下，大模型技术正推动泛制造业 AI 应用从试点探索走向规模化落地。但现实中，生产线实时传感数据、设备时序数据、跨工厂协同数据，以及海量历史沉淀数据交织，形成高度复杂的数据环境，让众多企业“想用 AI 却用不好 AI”。从数据到 AI，从来不是简单的技术叠加，而是一场覆盖架构、治理与能力的系统性升级。

应对AI需求赋能智造行业

Cloudera华东区资深客户经理杨昀率先发表了开场致辞，并向线上观众介绍了Cloudera发展历程及解决方案。

杨昀向线上观众介绍了Cloudera，他表示，Cloudera作为赋能智能制造的数据与AI平台，也正在经历着深刻的战略转型。从传统的大数据平台商业化分发商，全面转向以“AI Anywhere、Cloud Anywhere、Data Anywhere”为核心的三大战略布局。

在数据层面，Cloudera通过开放统一的湖仓架构和引入流式实时引擎，不仅支持自有及第三方计算引擎，还能为车联网、工厂物联网等工业场景提供毫秒级的数据采集与分析洞察，实现成本节约与一致性服务；在云化方面，Cloudera借助容器化技术为客户提供一致的云原生体验，统一管理数据安全、元数据、数据血缘及应用开发，显著降低平台使用成本并提升灵活性；在AI领域，Cloudera覆盖了从基础大模型选择、智能体开发、模型编排到自动化工作流与推理服务部署的全生命周期，帮助企业加速从开发到企业级智能体应用的安全合规落地。

杨昀进一步表示，Cloudera能力已在跨行业特别是泛制造业的客户实践中得以验证，其三大战略已持续获得行业评选的高度认可。

此外，杨昀在直播中还分享了Cloudera AI+云+数据集成方案以及在泛制造业的具体实践，该方案包括混合基础设施、统一数据编织、开放数据湖仓、企业AI应用四层架构，既能帮助企业优化硬件投资并降低整体拥有成本（TCO），也能确保物理上分散的集群管理获得一致的数据编织与治理，还能帮助客户显著提升数据加工的实时性，为业务应用创造更多可能性。

最后，杨昀表示，Cloudera AI+云+数据集成方案，已在全球制造业标杆客户中得到广泛应用，助力企业提升业务创新能力与场景落地能力。

AI赋能制造业重塑智能未来

在主题演讲环节，Cloudera大中华区制造业资深架构师是灏，发表了以“云数智一体化重塑制造业智能未来”为主题的演讲，其不仅分析了制造业数字化趋势，更进一步展现了制造业数字化与AI应用实践。

对于当前制造业的转型趋势，是灏表示，制造业数字化转型已不再是可选项，而是企业提升核心竞争力的关键路径。随着 AI 技术成熟，制造业正加速向云数智一体化演进，呈现四大趋势：一是从预测分析转向实时感知、智能响应与前置处置；二是 IT 与 OT 架构实现云边协同，边缘侧落地执行，云端负责统一管理与模型训练，混合架构成为主流；三是 AI 驱动生产模式升级，通过仿真与数据建模提前识别风险，从源头降低缺陷与返工；四是能源成为关键优化维度，依托能耗实时分析与优化，提升企业运营效率与可持续发展能力。

面对多源异构数据复杂、数据价值难以释放和架构割裂与扩展受限的核心挑战，是灏认为AI已经从试点项目逐渐演变为企业的核心能力，并真正融入业务执行环节，呈现出从事后处理转向事前干预、AI 应用以业务价值为核心驱动、AI 赋能一线员工等三大明显转变。他表示，在 Cloudera 看来，AI 的下一步发展核心不再局限于模型本身，而是以 AI 智能体形式深度参与业务流程，针对各环节形成专属任务型 AI 能力并持续自主运行决策。

针对大量 AI 项目难从“单点成功”走向“规模化运营”的现状，是灏着重介绍了Cloudera 云数智一体化平台。他表示，Cloudera将云数智一体化平台总结为三个“Anywhere”理念，三者统一，企业才能从单点 AI 能力迈向端到端智能化运营。

最后，是灏分别从能力层面和制造业应用场景，拆解了Cloudera 云数智一体化平台能力价值，并建议企业无需一步到位，从具体场景切入验证价值，逐步实现规模化与智能化运营。

泛制造 AI 数据底座探索之路

在圆桌对话环节，DTinsight中国数智发展研究中心执行主席王雪娜与东山精密集团IT高级总监赵力、海辰储能AI研究院院长徐晓卓、Cloudera大中华区副总裁刘汨春围绕着“泛制造业如何构建AI-ready的企业级数据底座”的主题，展开精彩对话，深入交流泛制造 AI 数据底座构建之路。

王雪娜：大模型时代，不少企业部署 AI 先关注模型，而实践证明应优先理清数据来源与高质量数据。请各位结合产线、工厂、供应链等落地场景，拆解真正支撑模型业务价值的数据类型，并分享AI 顺畅落地的典型场景。

赵力：在实践中，AI落地场景主要分为三类，智能决策类高度依赖数据的完整性、实时性与质量，历史数据与实时数据结合是提升预测与决策精度的关键；视觉检测场景侧重样本多样性与标注质量，精标数据与合成数据可有效提升识别精度、降低误检漏检并缩短开发周期；文档知识类场景虽降低了对结构化数据的依赖，但高质量知识库、上下文元数据及数据血缘关系，仍是保障结果一致的核心。总之，数据质量决定 AI 应用成效，不同场景数据侧重点不同，需持续治理与闭环优化，才能最大化 AI 价值。

徐晓卓：企业用好 AI 离不开专属数据，通用大模型仅能应对简单问题，无法适配制造业的独特业务场景。以内部智能体为例，业务知识库更新不及时会直接导致 AI 回答错误；而灯塔工厂借助高精度、结构化的实验与研发数据，才能通过 AI 技术高效优化材料配方、取得良好效果。在制造业，数据是 AI 落地的核心根基。

刘汨春：在制造业 AI 应用中，随着大模型在研发、降本增效等场景落地，数据复杂度大幅提升，企业既要控制 Token 成本，也要保障安全合规，因此需要搭建自有企业 AI 平台。多模态数据（文本、图片、视觉等）最终均转化为 Token 处理，传统数仓理念不变，但将围绕 Token 重构 AI-ready 数据底座，已成为明确趋势。无论是国内大厂还是硅谷创新企业，都在围绕这一方向布局，Cloudera认为企业真正的核心竞争护城河，在于自身数据的规模化与价值提炼。

王雪娜：在数据与AI 应用层面，制造业存在真实痛点：IT 团队追求数据稳定，AI 团队追求算法迭代高效，二者目标冲突。从企业角度出发，该如何促进 IT 与 AI 团队协同，高效缩短模型从开发到上线的周期？

徐晓卓：围绕数据有效服务AI发展并跟上趋势，需要在组织层面进行创新。例如，专门成立AI研究院，聚焦智能体与模型等AI研发工作；IT团队则更专注于系统与数据基座的建设，包括研发、制造、售后三大数据仓库。所有数据对AI研究院开放，并设置相应的数据沙盒，供研究员进行安全的探索性分析。同时，在实际AI应用中，权限设置清晰明确，信息安全部门与AI研究院紧密协同，确保组织分工与技术对齐，从而支撑数据与AI的良性协作。

赵力：针对企业内部推进AI落地，东山精密主要围绕组织协同、制度保障与能力培养展开。在组织层面，企业成立了专门的COE团队，负责高难度场景、自研算法及整体AI战略。在具体项目中，设有AI项目经理，并组建由业务专家、数据、算法（依项目复杂度设置）等人员组成“AI领航团”推进，安全团队全程保驾护航。在制度与平台方面，企业建立了相对完善的AI管理制度；最后，注重工具推广与员工能力提升，通过持续培训实现技能升级，以体系化方式支撑AI在制造业中的安全、高效应用。

刘汨春：从Cloudera更广泛行业的经验来看，企业组织AI能力、推动落地，很大程度上取决于其业务发展状态以及AI在细分赛道中所扮演的角色。高科技创新型制造业的AI应用，往往具有颠覆性创造力，是核心竞争力所在，因此需要一把手高度重视。而像快消品等规模经济型制造业，AI并不具备颠覆性影响，实际业务问题相对不严重，组织方式也无需调整。从“数据飞轮”角度看，未来可能出现“强者恒强”的局面。

王雪娜：传统BI的数据强调可读性、聚合与可视化，而AI时代的数据更强调原始性、规模性、实时性与高质量标注。这两套数据底层逻辑存在哪些不同？

刘汨春：多模态、结构化与非结构化数据、知识图谱、本体等概念并非因大模型才出现，无论是数据还是知识，都是对客观世界的描述，应用始终是由业务驱动。与BI时代追求高度准确、经过严格瀑布式流程治理的数据不同，大模型的Token数据或文档类数据，完全沿用原有数据治理体系，治理成本会非常高。当前，向量库、知识图谱等应用仍较为离散、部门级为主，缺乏集中管理，容易产生数据围栏缺失、安全合规不足甚至数据污染等问题，影响严重。尽管BI数据与AI导向的数据在形态上有所不同，但其管理方式和手段本质上是相通的，传统数据治理的经验完全可以迁移到新的AI场景中。

赵力：人工智能所需的数据与传统BI存在显著差异。在AI训练中，异常值、错误和多样性反而有助于提升模型准确率，而BI则强调清洗并移除异常值。此外，大语言模型类应用依赖语义标注、嵌入、向量数据库和检索等能力，不同于BI关注的数据聚合与维度分析。在管理层面，BI主要关注周期性的ETL链路验证，将数据导入平台即可；而AI需要持续验证、数据版本管控以及全链路的输入输出持续观察。因此，建立一个完善的AI治理与管理平台，是确保企业安全使用AI的关键。

徐晓卓：除人才投入之外，技术层面的AI三要素（算法、算力、数据）需要根据企业自身情况和具体场景具体分析，不同场景下三要素的作用不同，投资策略也应差异化。同时，算力面临价格波动与管制问题，可能导致短期决策快速变化，但最终仍回归到三要素对于所要解决的实际问题的作用核心逻辑上来。

王雪娜：大模型时代，企业IT投入的重点方向发生了明显变化，需要在算力、大模型训练/token消耗，以及内部专有数据治理做出权衡。如何看待企业投入平衡的问题？

刘汨春：对企业而言，其投入可能有两种方式：一是小规模试错，通过具体业务拉动，愿意承担一定成本去尝试AI；二是与大厂全面战略合作，但效果未必理想，因为技术、场景及整体体系尚未成熟，各种技术仍在快速迭代，难以找到固定公式确保投入算力、人才或模型研发就能产生明确回报。不过可以确定的是，数据始终是基础。

赵力：技术始终处于更新迭代之中，东山精密坚持技术为业务服务的采购原则，任何AI投入的前提基于明确的应用价值场景并计算ROI。此外，随着AI项目开展，企业愈发意识到AI工程化平台与AI管理的重要性，当下搭建AI管理平台成为工作重点。与此同时，数据治理作为基础工作，已持续多年不断推进。

徐晓卓：在AI发展趋势中，“龙虾”带来了AI智能体新范式，工作方式发生了根本性变化。传统BI是将数据以各种形式展现出来，人从中洞察并决策；而AI时代更希望“提出问题，AI解决问题”，分析洞察的工作由AI完成，人不再介入。未来甚至可能出现多个智能体之间直接通过数据模型层面建立连接进行通讯，不再依赖传统的图形界面，也不需要token的输入输出形式，类似于“心灵感应”的方式，这一变化正在快速发生并深远演进。

王雪娜：企业在 AI 落地应用时，若当下只能做一件事，最应该着手做的事情是什么？

赵力：基于过往经验，企业应组建业务 + IT 联合战队，优先聚焦高价值 AI 场景，梳理该场景相关数据并开展数据治理。

徐晓卓：从技术角度看，企业落地 AI 的核心就是先做数据积累与治理。数据是 AI 的基础，更早时间数据治理和积累，就将形成未来时间维度上的竞争优势，这是最稳妥、最具长期价值的第一步。

刘汨春：AI 对软件行业带来颠覆性冲击——市场担忧 AI 替代人工编码，客户也将传统数据加工人员转岗，人机交互正从过程导向转向直接结果导向。Cloudera作为大数据平台企业，正升级技术栈以适配多类型数据与向量库、记忆体等存储能力，力求打造无需人工定义类型、自带 AI-ready 能力的智能平台，助力行业转型。

本次【云端会客厅】直播汇聚了泛制造业与数据智能领域的多位实战专家，从数据治理、组织协同到技术平台，系统拆解了构建 AI-ready 数据底座的难点与路径。嘉宾们一致认为：AI 的价值上限，取决于数据的质量与治理深度；而迈向智能化的第一步，不在于追逐最热的模型，而在于沉下心来梳理、治理并开放自己的数据资产。当企业完成从“用 BI 看数据”到“让 AI 用数据”的思维跃迁，数据底座便不再是技术负担，而是持续释放智能红利的核心引擎。

END