乐于分享
好东西不私藏

五大质量工具之FMEA失效模式分析

五大质量工具之FMEA失效模式分析

FMEA失效模式与影响分析

深度实战指南|DFMEA · PFMEA · AP体系·车载控制器生产全流程案例

AIAG-VDA FMEA 手册(2019版)·IATF 16949·汽车电子质量管理

─────────基础认知─────────

基础认知

FMEA 究竟是什么?

FMEA(Failure Mode and Effects Analysis,失效模式与影响分析)是一种系统性、结构化的预防性质量工具,用于在产品设计或制造过程中,提前识别所有潜在的失效模式,分析其可能造成的后果,并制定有效的预防和探测措施,将风险消灭于萌芽状态。

对于车载控制器(ECU/VCU/BMS 等)而言,FMEA 尤为重要——控制器是汽车的”大脑”,一旦发生失效可能直接引发安全事故。IATF 16949 和 ISO 26262 均强制要求对车载电子控制器开展系统性的 FMEA 分析。

为什么车载控制器 FMEA 更复杂?车载控制器的 FMEA 涉及硬件设计(PCB 布局、元器件选型)、软件逻辑(固件/嵌入式代码)、生产制造(SMT 贴片、焊接、老化测试)三个维度,任意一个维度的失效都可能导致控制器失效。此外,车载控制器需满足 AEC-Q100(汽车级芯片标准)和车规环境要求(-40℃~125℃工作温度、振动冲击),失效后果往往与整车安全直接相关。

FMEA 三大类型(车载控制器视角)

DFMEA(设计失效模式分析)

针对控制器硬件设计和软件架构阶段,分析电路设计、元器件选型、散热方案等可能存在的设计缺陷。由硬件工程师 + 软件工程师联合主导,在原理图评审前完成。

PFMEA(过程失效模式分析)

针对控制器生产制造过程(SMT 贴片 → 回流焊 → ICT 测试 → 功能测试 → 老化测试 → 出货检验),分析每道工序可能出现的操作失误和设备异常。由工艺工程师主导,在量产前完成。

FMEA-MSR(监控与系统响应)

2019 新版新增类型,专门针对控制器在整车使用阶段的诊断功能和失效响应机制(如 OBD 故障码、Limp-home 跛行模式、安全状态进入逻辑)进行分析,是功能安全(ISO 26262)分析的重要输入。

System FMEA(系统级)

在项目立项阶段对控制器在整车系统中的功能架构进行分析,如 VCU(整车控制器)需分析与 BMS、MCU、OBC 等系统的接口失效模式。是 DFMEA 的前置分析步骤。

─────────新旧版本差异─────────

版本演进

2019版 AIAG-VDA 与旧版核心差异

2019 年 AIAG 与德国 VDA 联合发布全新版本,最核心的变化是废除 RPN 评分,引入 AP 行动优先级。对于车载控制器这类高安全性产品,新版体系更能保证安全风险不被低估。

对比维度

旧版(AIAG 第四版 RPN)

新版(AIAG-VDA 2019 AP)

风险评价

RPN = S×O×D,最大 1000

AP = H/M/L,基于 S/O/D 组合矩阵

安全风险识别

S=10 但 O=1 D=1,RPN 仅=10,可能被忽略

S=9 或 10,无论 O/D 如何,AP 自动=H,安全风险不可被压制

措施要求

RPN>100 建议改善(阈值各厂不同)

AP=H 必须有措施,AP=M 建议有措施,无法靠调整阈值规避

分析步骤

6步

7步(新增结构分析),逻辑更系统

预防与探测

合并在控制措施

明确区分预防措施(降O)和探测措施(降D)

行动跟踪

仅记录措施内容

须记录责任人、完成日期,并做实施后重新评分

重要提示大众、宝马、奔驰等德系主机厂及大多数合资主机厂均已要求供应商切换至 AIAG-VDA 2019 新版。车载控制器供应商若仍使用旧版 RPN 体系,将在供应商质量审核中产生不符合项。 本文后续内容全部基于 2019 新版讲解。

─────────七步分析方法─────────

方法论

FMEA 七步分析法(AIAG-VDA 2019版)

新版 FMEA 规定严格的七步流程,必须按顺序推进,每步有明确输入和输出。以下以车载控制器为背景说明各步骤的具体操作。

01

规划与准备

确定分析对象: 如”新能源汽车整车控制器(VCU)PCB 设计 DFMEA”或”VCU SMT 生产线 PFMEA”,画出分析边界。

组建 CFT 团队: 硬件工程师、软件工程师、热设计工程师、可靠性工程师、质量工程师、SMT 工艺工程师,共 6~8 人。

输入历史数据: 收集同类控制器的市场失效报告(FFA)、OBD 故障码统计、历史 DFMEA/PFMEA 经验教训。

02

结构分析

DFMEA 结构树: 整车系统 → VCU 控制器总成 → PCB 单板 → 各功能模块(电源模块、MCU 模块、CAN 通信模块、IO 接口模块)→ 关键元器件。

PFMEA 过程流程: 来料检验 → SMT 贴片 → 回流焊 → AOI 检测 → ICT 在线测试 → 功能测试 → 老化测试(BURN-IN)→ 最终检验 → 包装出货,工序编号与 PFD、控制计划对应。

03

功能分析

DFMEA 功能描述(动词+名词+量化指标):

·电源模块:将 12V 车载电源转换为 3.3V/5V(精度±1%,纹波<50mVpp)

·CAN 收发器:以 500kbps 速率收发 CAN 报文(误码率<10⁻⁹)

·MCU:在 -40℃~125℃ 环境下执行控制逻辑(响应时间<10ms)

PFMEA 工序功能: 如”回流焊工序:将 PCB 上所有焊盘焊点形成可靠连接(焊点强度≥5N,无虚焊/桥连)”。

04

失效分析

失效链三要素:失效原因 → 失效模式 → 失效后果

DFMEA 示例:

·去耦电容选型容量不足(原因)→ 电源纹波超标(模式)→ MCU 复位/死机(后果)

·PCB 走线阻抗不匹配(原因)→ CAN 信号完整性差(模式)→ 通信丢包/误码(后果)

PFMEA 示例:

·锡膏印刷量偏少(原因)→ 焊点虚焊(模式)→ ICT/功能测试失效,漏至客户端失效(后果)

05

风险分析

S(严重度): 仅与失效后果挂钩——VCU 失效导致车辆无法行驶 S=8;VCU 误判导致制动异常 S=10。

O(频度): 与元器件失效率(FIT 值)、过程能力(Cpk)挂钩——使用 AEC-Q100 认证芯片可降低 O 评分。

D(探测度): 防错传感器/100% 在线测试 D=1~2;仅靠人工目检 D=7~8;无任何检测 D=9~10。

AP 行动优先级: S=9/10 → 无条件 AP=H;S=7/8 且 O≥4 且 D≥7 → AP=H。

06

优化

优先降低 S(最难但最有效): 通过冗余设计、功能安全机制(ISO 26262)降低失效后果严重程度。

其次降低 O(预防措施): 选用更高可靠性的汽车级元器件、优化 PCB 布局规则、改善 SMT 锡膏工艺参数。

再次降低 D(探测措施): 增加 ICT 覆盖率、引入 AOI+AXI(X 射线检测)、100% 老化测试筛选。

措施闭环: 措施实施后重新评分,AP=H 项目必须降至 M 或 L,形成闭环记录。

07

结果文件化

FMEA 工作表归档: 纳入设计评审(Design Review)输出文件包,与硬件原理图、BOM、测试规范配套存档。

与控制计划对齐: PFMEA 中的探测措施须逐条映射到量产控制计划(ICT 测试项目、老化测试参数、最终检验规程)。

持续更新触发机制: 每次 ECU 硬件版本升级、工艺变更、或客户端失效(OBD 故障码异常)都须触发 FMEA 评审更新。

─────────评分体系详解─────────

评分体系

S / O / D 评分标准(车载控制器专用版)

严重度 S 评分——车载控制器后果对照

S 分仅与失效后果挂钩,与发生概率和探测能力无关。对车载控制器,需特别关注安全等级(ASIL)的映射关系。

S分

失效后果描述

车载控制器典型示例

9-10

安全/法规相关失效,可能导致人身伤害

VCU 误判导致意外加速(S=10);BMS 失效导致电池热失控(S=10);EPS 控制器失效导致转向失控(S=9)

7-8

主要功能完全丧失,无人身危险但严重影响驾驶

VCU 失效导致车辆完全无法行驶(S=8);ABS 控制器失效(S=7);仪表控制器失效导致所有仪表黑屏(S=7)

5-6

主要功能降级,用户不满但可安全行驶

OBC 控制器失效导致无法充电(S=6);空调控制器失效(S=5);座椅控制器失效(S=4)

3-4

次要功能受影响,用户轻微不满

车窗控制异常(S=4);氛围灯控制器失效(S=3);后视镜加热功能失效(S=3)

1-2

几乎无影响,仅对生产或维修有轻微影响

调试接口偶发超时(S=2);非关键 CAN 报文偶发延迟(S=1)

频度 O 评分——元器件失效率与过程能力对照

O 分评估失效原因出现的可能性,车载控制器硬件设计侧可参考元器件 FIT(每 10⁹ 小时失效数)值;生产过程侧参考 Cpk 或历史不良率。

O分

发生可能性

硬件设计参考(FIT值)

生产过程参考(Cpk/PPM)

9-10

极高,过程/元件几乎不可控

FIT > 1000(非车规元器件)

Cpk < 0.67 / >10000 PPM

7-8

高,经常发生

FIT 100~1000

Cpk 0.67~1.00 / 1000~10000 PPM

5-6

中等,偶发

FIT 10~100

Cpk 1.00~1.33 / 100~1000 PPM

3-4

低,少量历史记录

FIT 1~10(AEC-Q100 认证芯片)

Cpk 1.33~1.67 / 10~100 PPM

1-2

极低,几乎不可能

FIT < 1(高可靠性元器件)

Cpk ≥ 1.67 / < 10 PPM

探测度 D 评分——车载控制器生产检测方法对照

D 分越低表示探测能力越强。车载控制器生产线的探测手段从弱到强依次为:目检 → ICT 抽检 → ICT 100% → AOI → AXI → 功能测试 → 老化筛选 → 防错装置。

D分

探测能力

车载控制器生产线典型方法

9-10

无法探测,完全依赖人工目检或不检

无在线检测,仅依赖操作员肉眼检查 PCB,虚焊/桥连漏检率>80%

7-8

过程末端随机抽检

ICT 按 AQL 抽检(如每批抽 5 件),漏检概率高;出货前外观抽检

5-6

过程中人工检验或仪器抽检

AOI(自动光学检测)100%检,检出率 85~95%;ICT 100% 测试但覆盖率<80%

3-4

过程中自动化检测,高覆盖率

AOI + ICT 100% 测试(覆盖率>95%);功能测试 100% 覆盖;AXI(X射线)检测焊点内部缺陷

1-2

防错/自动100%检测,几乎不可能漏检

防错传感器(载具识别/极性防错);老化测试(BURN-IN)100% 筛选早期失效;自动化测试无法通过则阻止流转

AP 行动优先级判定规则

AP

判定条件(核心规则)

车载控制器行动要求

H(高)

S=9 或 10(无论 O/D);S=7/8 且 O≥4 且 D≥7;或其他高风险组合

必须制定改善措施,指定责任人和完成日期。不得以”暂无合适措施”为由留空。安全类失效(S=9/10)须联动 ISO 26262 功能安全分析

M(中)

S=5~8 且风险中等;或 S=9/10 但 O≤2 且 D≤3

建议制定改善措施,或文件化”当前措施充分”的理由,须经 CFT 团队确认签字

L(低)

S≤4 的轻微后果;或所有分值均低

无需强制行动,持续监控即可

─────────DFMEA 实战案例─────────

DFMEA 案例

案例一:新能源汽车 VCU(整车控制器)DFMEA 分析

以下为某 Tier 1 汽车电子供应商对新能源汽车整车控制器(VCU)硬件设计开展 DFMEA 的真实过程(已脱敏处理)。VCU 是新能源汽车的核心控制节点,负责协调驱动、制动、能量回收、充电等整车功能,为 ASIL-D 安全等级。

案例一:VCU 整车控制器 DFMEA 分析(硬件设计阶段)

产品:新能源汽车 VCU·功能安全等级:ASIL-D·工作电压:9~16V·工作温度:-40℃~105℃(PCB)

项目背景 与准备

分析对象: VCU PCB 硬件设计,重点覆盖电源管理模块、MCU 双核冗余模块、CAN/LIN 通信模块、高压隔离接口模块。

CFT 团队: 硬件工程师(主导)× 2、嵌入式软件工程师 × 1、功能安全工程师 × 1、可靠性工程师 × 1、质量工程师 × 1,共 6 人,历时 3 天完成初版 DFMEA。

历史数据输入: 上一代 VCU 市场失效数据(3 年内共 47 件失效,其中电源模块 22 件、CAN 通信 15 件、MCU 死机 10 件),全部作为本次 DFMEA 的失效原因输入。

结构分析 (步骤2)

结构树(部分): 新能源整车系统 → VCU 控制器总成 → PCB 单板 → 电源管理模块 / MCU 双核模块 / CAN 收发模块 / 高压检测隔离模块 / IO 驱动模块。

特殊特性确认: 与主机厂确认 CC 级特殊特性:① 12V→5V 电源纹波(≤50mVpp)② MCU 双核一致性检测响应时间(≤5ms)③ 高压隔离耐压(≥DC 2500V/1min)。

功能分析 (步骤3)

电源管理模块功能: 将车载 9~16V 电源转换为 MCU 所需 3.3V(精度±1%,纹波<50mVpp,过压/欠压保护)。

MCU 双核模块功能: 主核执行控制逻辑,监控核实时校验主核输出,差异超限(>5ms)触发安全状态进入(输出 0 扭矩)。

CAN 收发模块功能: 以 500kbps 速率在 -40℃~125℃ 下稳定收发 CAN 2.0B 报文(误码率<10⁻⁹)。

VCU DFMEA 工作表(节选 5 条关键失效模式)

功能/部件

失效模式

失效后果

S

失效原因

O

预防措施

探测措施

D

AP

改善措施

电源管理 (5V输出)

5V 输出纹波超标(>50mVpp)

MCU 频繁复位,VCU 功能异常,整车无法行驶

8

去耦电容容值选型不足,未考虑温度降额(105℃时电容量下降 40%)

4

温度降额设计规则:105℃ 环境下电容量须>标称值×2.5 倍;设计评审 Checklist

PCB 设计仿真(SPICE)验证纹波;样品 EMC 测试

3

H

追加 2 颗 10μF X5R 陶瓷电容;更新设计规则库,责任:硬件工程师张某,2024-03-20

MCU 双核模块

主核与监控核 输出不一致 (差异>5ms)

VCU 误进入安全状态,输出零扭矩,车辆在高速行驶中突然失去动力(危险)

9

MCU 内部时钟同步误差超规格;高温下 MCU 时序裕量不足

3

选用满足 ASIL-D 要求的 MCU(Aurix TC3xx);-40℃~125℃ 全温度范围仿真验证

ISO 26262 功能安全分析;样品高低温功能测试

3

H

联动 ISO 26262 FMEA;增加看门狗复位后的失效安全处理逻辑;责任:功能安全工程师李某,2024-04-01

CAN 收发模块

CAN 总线 通信丢包率 >10⁻⁶

VCU 与 BMS/MCU 通信异常,驱动扭矩响应滞后或错误

7

CAN 收发器 ESD 保护不足,整车电磁干扰(EMI)导致误码

5

选用车规 CAN 收发器(±8kV ESD 保护);PCB 布局:CAN 信号线远离高压区域

整车 EMC 测试(ISO 11452);CAN 总线负载测试

4

H

增加 TVS 管保护;更新 PCB 布线规则(CAN 线间距>3mm 与动力线);责任:硬件工程师,2024-03-25

高压隔离 接口

隔离耐压 击穿 (<2500V)

高压电池侧漏电至低压 VCU,烧毁控制器及周边线束,存在触电风险

10

隔离变压器绝缘材料耐压等级选型不足(仅 1500V 级)

2

严格执行器件选型规范:高压隔离器件额定耐压≥3750V(1.5 倍余量);设计 BOM 评审

样品高压绝缘耐压测试(DC 3000V/1min);第三方实验室认证测试

2

H

更换为 DC 4000V 额定隔离变压器;100% 样件高压测试纳入设计验证计划;责任:硬件工程师,2024-03-15

IO 驱动模块

输出端口 短路保护 失效

外部负载短路时无法保护,持续大电流损坏 VCU 内部电路

6

IO 驱动芯片短路保护阈值设置偏高(>5A),超出 PCB 走线和器件额定值

4

IO 驱动芯片选型:内置电流限制(≤3A)及热关断功能;限流电阻串联设计

样品短路耐受测试;设计仿真验证过流响应时间

4

M

更新 IO 驱动芯片选型规范,要求内置过流保护功能;责任:硬件工程师,2024-04-10

DFMEA 案例分析要点注意第 2 条”主核与监控核输出不一致”:S=9(功能安全相关),AP 无条件为 H,且改善措施明确要求联动 ISO 26262 功能安全分析——这是车载控制器 DFMEA 的特殊之处,S=9/10 的条目通常需要同步触发功能安全(HARA)分析和安全机制设计。第 4 条”隔离耐压击穿”S=10,即便 O=2 D=2,AP 仍为 H,体现了新版 AP 体系对安全风险的零容忍原则。

─────────PFMEA 实战案例─────────

PFMEA 案例

案例二:VCU 控制器 SMT 生产线 PFMEA 分析

以下为同一 VCU 控制器产品在 SMT(表面贴装技术)生产线上的 PFMEA 分析,重点覆盖锡膏印刷、元件贴片、回流焊、AOI 检测四道关键工序。

案例二:VCU 控制器 SMT 生产线 PFMEA(关键工序节选)

生产线:SMT 自动化产线·板型:双面 PCB 8 层板·关键器件:BGA 封装 MCU、QFN 封装 CAN 收发器、电解电容

生产过程 背景

过程流程(PFD): OP-010 来料检验 → OP-020 锡膏印刷 → OP-030 SMD 贴片 → OP-040 回流焊 → OP-050 AOI 检测 → OP-060 ICT 在线测试 → OP-070 功能测试 → OP-080 BURN-IN 老化测试 → OP-090 最终检验 → OP-100 包装出货。

特殊特性确认: BGA 焊点质量(100% AXI 检测,CC 级)、ICT 测试覆盖率(≥95%,SC 级)、老化测试通过率(100%,CC 级)。

历史失效输入: 上季度 VCU 生产不良:锡膏印刷不良 38%、BGA 虚焊 26%、极性错误 12%、ICT 漏测 15%、其他 9%。

CFT 分析 过程

团队组成: SMT 工艺工程师(主导)、设备工程师、质量工程师、生产班组长各 1 名,历时 1.5 天完成初版 PFMEA。

分析方法: 以 PFD 为骨架,按工序逐一分析,重点输出不良率最高的锡膏印刷(OP-020)和 BGA 回流焊(OP-040)工序的失效链。

VCU SMT 生产线 PFMEA 工作表(节选 6 条关键工序失效)

工序

失效模式

失效后果

S

失效原因

O

预防措施

探测措施

D

AP

OP-020 锡膏印刷

锡膏印刷量不足(<80%额定量)

BGA/QFN 焊点虚焊,ICT/功能测试失效,严重时漏至客户端失效

8

钢网堵孔(锡膏残留未清洁);锡膏粘度超期变化(开封>8h 未使用)

5

钢网每 1000 次印刷清洁一次;锡膏开封后 8h 内用完,贴标记录时间;印刷参数(速度/压力)锁定不允许手动修改

SPI(锡膏检测仪)100% 检测印刷量,超出±20% 自动报警停线

2

H

OP-030 SMD 贴片

BGA 芯片 贴装偏移 (>0.1mm)

BGA 焊点错位,回流焊后桥连或虚焊,ICT 测试短路/断路

8

贴片机视觉对位系统校准漂移;Mark 点识别光源老化影响精度

4

贴片机 Mark 点每日校准记录;视觉光源每季度更换;贴装程序变更需 3 件首件确认

贴片后 AOI 检测 BGA 位置偏移,偏移>0.05mm 报警;首件 100% 坐标测量

3

H

OP-040 回流焊

BGA 焊点 内部空洞率 (>20%)

BGA 焊点强度下降,振动/冲击条件下焊点开裂,客户端失效(振动寿命不达标)

7

回流焊温度曲线偏离规格(峰温<240℃或升温速率过快);PCB 受潮未烤板

5

每班开机回流炉温度曲线 Profile 确认(5 点记录);PCB 来料 MSL 管控,开封后 48h 内完成焊接

AXI 100% 检测 BGA 焊点空洞率(<15% 合格);每批抽 3 件截面分析

2

H

OP-040 回流焊

电解电容 极性反向焊接

反向偏置电容在上电测试时爆炸,损坏 PCB 及周边器件,人员安全风险

9

电容极性标识不清晰;操作员培训不足;物料摆放无极性防错

3

载具设计极性防错(电容极性方向槽口);丝印层增加极性标识颜色区分;操作员极性培训考核

IOT(光学极性检测)100% 检测电容极性,极性错误自动锁线

1

H

OP-060 ICT 测试

ICT 测试 覆盖率不足 (<95%)

电路缺陷(开路/短路/阻值偏差)未被检出,流入功能测试或漏至客户

7

测试夹具探针磨损接触不良,部分测试点覆盖缺失;ICT 测试程序长期未更新

4

探针每 5000 次检查磨损量,磨损>0.3mm 强制更换;ICT 程序随 BOM 变更同步更新,变更后需覆盖率验证

每批次 ICT 测试覆盖率报告自动生成,<95% 停线评估;每季度 ICT 夹具评估

3

H

OP-080 BURN-IN 老化测试

老化测试 参数设置错误(温度/电压/时长不足)

早期失效漏筛,弱质品流入客户端,增加客户端失效率(早期 PPM 高)

6

老化测试程序参数人工设置错误;BURN-IN 设备老化,实际温度与设定偏差>5℃

3

老化测试参数由 MES 系统自动下载,不允许手工修改;老化箱温度每日校准

MES 系统自动记录老化测试实际参数(时间/温度/电压),超出规格自动报警和阻止判定通过

2

M

PFMEA 与控制计划对齐检查上表 PFMEA 中的所有探测措施,必须在控制计划(CP)的对应工序中逐条体现: · OP-020 “SPI 100% 检测锡膏量” → CP OP-020 探测方法栏 · OP-040 “AXI 100% 检测 BGA 空洞率” → CP OP-040 探测方法栏 · OP-060 “ICT 覆盖率报告自动生成” → CP OP-060 频次和反应计划栏 PFMEA 中有探测措施、控制计划中找不到对应检测——这是审核中最高频的不符合项,务必三表对齐后再提交 PPAP。

─────────落地实施清单─────────

实施指南

VCU 控制器 FMEA 落地 12 步行动清单

无论是 DFMEA 还是 PFMEA,以下 12 步是车载控制器 FMEA 从零搭建的标准路径,按顺序执行,不可跳步。

步骤

行动项目

车载控制器关键检查点

1

确定分析范围和边界

明确是整个 VCU 系统、PCB 硬件设计、还是某条生产工序;确认与功能安全(ISO 26262)的分析边界

2

组建 CFT 跨职能团队

硬件/软件/可靠性/功能安全/工艺/质量工程师全部参与;车载控制器必须包含功能安全工程师

3

收集历史失效数据

整理现有 VCU/ECU 的市场失效报告、OBD 故障码统计、台架测试失效记录、上一版本 FMEA

4

完成结构分析

DFMEA:绘制控制器系统结构树(系统→模块→元器件);PFMEA:确认 PFD 并与控制计划对齐

5

完成功能分析

每个模块/工序用”动词+名词+量化指标”定义功能,如”将 12V 转换为 5V(精度±1%,纹波<50mVpp)”

6

识别完整失效链

失效原因→失效模式→失效后果,安全件失效后果须与 ISO 26262 HARA 分析交叉验证

7

CFT 集体评分 S/O/D

团队集体讨论,S=9/10 项目须联动功能安全工程师确认;不允许一人独立评分

8

生成 AP 优先级清单

列出所有 AP=H 项目,这是改善行动的优先清单,S=9/10 的项目须在 2 周内完成措施制定

9

制定改善措施

AP=H 必须有具体措施+责任人+完成日期,硬件类措施须配合原理图/PCB 布局版本变更记录

10

措施实施与重新评分

措施落地后重新评估 S/O/D,AP=H 项目应降至 M 或 L,并由 CFT 团队确认签字闭环

11

与控制计划/设计规范对齐

PFMEA 探测措施在量产控制计划逐行核对;DFMEA 措施在硬件设计规则库/器件选型规范中体现

12

建立持续更新机制

硬件版本升级/工艺变更/客户端失效(任何 OBD 故障码新增),5 个工作日内触发 FMEA 评审

─────────避坑指南─────────

避坑指南

车载控制器 FMEA 最常见的 7 大执行误区

误区

错误表现

正确做法

FMEA 与功能安全割裂

DFMEA 和 ISO 26262 HARA 分析由两个团队独立进行,结果互不参照,S=9/10 的失效模式没有对应的功能安全措施

S=9/10 的 DFMEA 条目必须与 ISO 26262 HARA/FTA 分析交叉验证,安全机制设计须在 FMEA 的改善措施中明确体现

软件逻辑未纳入 DFMEA

DFMEA 只分析硬件电路,忽略软件逻辑错误(如整数溢出、状态机死锁、看门狗超时处理缺失)带来的失效风险

VCU 控制器 DFMEA 必须同时覆盖硬件设计和软件架构层面的潜在失效,软件工程师必须参与 DFMEA

BGA 焊点失效被低估

PFMEA 中 BGA 回流焊工序仅设置 AOI 目检,未考虑 BGA 焊点内部空洞(AOI 无法检测),D 评分给 3 分(实际应给 7 分)

BGA 封装焊点必须配置 AXI(X 射线)检测,没有 AXI 则 BGA 焊点内部空洞的探测度 D 应评 7~8 分

老化测试漏写入 PFMEA

PFMEA 中未包含 BURN-IN 老化测试工序,认为老化是”可选”环节而非质量控制点

BURN-IN 老化测试是车载控制器筛除早期失效的关键工序,必须纳入 PFMEA 分析,老化参数偏差是高频失效原因

AP=H 填”待定”应付审核

AP=H 的条目在”改善措施”栏填写”后续跟进”或”待评估”,无具体内容

AP=H 必须有明确的措施内容、责任工程师姓名和完成日期,”待定”是审核必开不符合项

S 分主观压低

为了避免 AP=H 的行动压力,把 VCU 失效导致车辆无法行驶的 S 从 8 降到 6

S 分须与主机厂 CSR 或 AIAG-VDA 标准评分表对齐,降 S 行为可能被审核员识别为故意操纵,严重影响供应商信用

FMEA 止于 PPAP 提交

PPAP 获批后 FMEA 文件锁定不再维护,量产后 VCU 出现新的 OBD 故障码也不触发 FMEA 更新

FMEA 是动态活文件,每次 ECU 软硬件版本变更、每条新的客户端失效记录,都须在 5 个工作日内触发 FMEA 评审

─────────常见问题解答─────────

常见问题

车载控制器 FMEA 高频问题解答

Q车载控制器 DFMEA 和 ISO 26262 功能安全分析是什么关系?

ISO 26262 的 HARA(危害分析与风险评估)是系统级的安全目标分析,DFMEA 是产品级的硬件失效分析,两者互为输入:HARA 输出的安全目标(Safety Goal)和 ASIL 等级,是 DFMEA 中 S 分评定的重要参照;DFMEA 识别的潜在硬件失效模式,是 ISO 26262 故障树分析(FTA)和故障模式影响摘要(FMEA-MSR)的基础输入。ASIL-C/D 等级的控制器,DFMEA 和 ISO 26262 分析必须由同一个跨职能团队协同推进,而非各自独立。

QBGA 封装器件的 PFMEA 如何评定探测度 D?

BGA 封装焊点的检测分三层:① AOI(光学)只能检测 BGA 外观和位置偏移,无法检测焊点内部空洞,如果只有 AOI,D 应评 6~7 分;② AXI(X 射线)可以检测焊点内部空洞率,100% AXI 检测 D 可评 3~4 分;③ 截面分析(破坏性)可以看到焊点内部结构,但不能 100% 检,通常作为 SPC 监控手段。对于 BGA 封装的 MCU 等关键器件,建议在控制计划中明确要求 AXI 100% 检测,否则 BGA 虚焊的 D 分偏低会导致 AP=H,强制要求改善。

QPFMEA 中老化测试(BURN-IN)工序应该怎么分析?

BURN-IN 老化测试是一道主动筛选工序(目的是筛出早期失效品),PFMEA 中的失效模式应聚焦在”老化测试本身失效”,而非产品本身:① 老化温度设置偏低/时间不足 → 早期失效品未被筛出 → 漏至客户端(高 S);② 老化设备温度均匀性差 → 不同位置样品受到不同温度应力 → 筛选效果不一致;③ 测试台数据采集异常 → 失效记录丢失 → 无法追溯排查。BURN-IN 工序的预防措施重点是:老化参数由 MES 自动下载(防止人工输入错误)、老化箱温度均匀性每季度校准。

Q车载控制器 FMEA 条目通常有多少条?

没有固定数量要求,但以下参考值供参考:VCU/BMS 等复杂控制器 DFMEA 通常有 80~200 条失效模式;SMT 生产线 PFMEA 通常每道关键工序 8~20 条,整条线 100~200 条。评价 FMEA 是否”完整”的标准不是条目数量,而是:① 所有特殊特性(CC/SC)都有对应的 FMEA 条目;② 历史客户抱怨和内部失效都能在 FMEA 中找到对应原因;③ AP=H 的条目都有具体措施和闭环记录。

本文内容依据 AIAG-VDA FMEA 手册(2019版)、IATF 16949:2016 及 ISO 26262:2018 整理,仅供学习参考。如有疑问请以最新版标准原文为准。

往期回顾:

五大质量工具之PPAP生产件批准程序全解析

五大质量工具之APQP产品质量先期策划全解析

汽车行业五大质量工具全面解析

实用CAN总线知识(3)—-CAN总线的错误帧检测及处理

实用CAN总线知识(2)—-CAN总线数据收发机制

《实用CAN总线知识(1)—-CAN报文解析》

全网最简单的Linux 操作教程——Linux用户和权限(3)

全网最简单的Linux 操作教程——基础命令(2)

什么是Linux ?全网最简单的Linux 操作教程(1)

如何使用CANoe.NET API

VT System _VT板卡功能使用说明

第四讲 CAPL基础—-使用CANoe的Diagnostics工具进行诊断

CANoe与MATLAB/Simulink联合使用

GB/T 27930.2-2024标准解读–2015+国标直流快充通信协议

诊断概述(1)

诊断概述(2)

诊断概述(3)

  车软学堂技术交流群,有兴趣的朋友请添加群主:real8608,备注:从事岗位,仅限汽车行业相关人员。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 五大质量工具之FMEA失效模式分析

猜你喜欢

  • 暂无文章