引言

在船用柴油机燃烧室故障诊断中,我们经常面临三个现实困境:

1.真正的故障样本极少,深度学习很难训练

2.纯物理模型过于复杂,难以工程落地

3.模型给出结论,却无法解释“为什么是这个故障”

而近期发表在《Measurement》上的前沿论文:《Thermodynamic Simulation-assisted Random Forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines》尝试了一种反直觉但有效的思路:不是用数据拟合物理,而是让物理“教会”机器学习如何判断故障。

基于这一思路,该文章提出了Thermodynamic Simulation-assisted Random Forest(TSRF),一种融合热力学仿真辅助随机森林与可解释性故障诊断框架。


技术路线与实施步骤

首先,建立船用柴油机一维热力学模型,并利用数据采集模块(DCM)获取的实际数据校准模型,确保模型的准确性。

柴油机一维热力学模型示意图

DCM获取数据流程图                                              

其次,对船用柴油机燃烧室建模参数进行微调,进而实现燃烧室缸盖裂纹、活塞烧蚀、缸套磨损、活塞环磨损、活塞环卡死这五种故障的仿真,并分析其故障机理和物理原理。

  1. 故障类型 物理机制 参数调节
    F1: 缸盖裂纹 缸盖燃烧室的热机械载荷会导致裂纹,从而破坏结构和散热。 将气缸盖表面温度(TH)提升至346°
    F2: 活塞烧蚀 活塞表面材料退化引发热烧蚀,破坏界面并加剧窜气。 提高活塞温度(TP)+轻微窜气(0.01kg/s)
    F3: 缸套磨损 磨粒侵入导致缸套磨损,几何变形破坏密封并加剧窜气。

    增大缸径+大量窜气(0.03kg/s)

    F4: 活塞环磨损 磨粒导致活塞环磨损变形,破坏密封并形成窜气正反馈循环。

    调节窜气质量流量(0.02kg/s)

    F5: 活塞环粘着 过多的积碳沉积、润滑油膜形成不足和油泥堆积。 缸径变化+缸套温度升高 +窜气
  2. 然后,从故障仿真输出中筛选具有潜在诊断意义的热力学参数组成初步数据集,将数据集输入随机森林进行预识别,让模型初步学习参数和故障之间的关联,得到参数经过随机森林以后的预测得分,进而计算出参数的边际贡献。再采用Tree SHAP方法,计算SHAP值定量评估各参数的贡献权重,生成精炼数据集,随后重新通过随机森林模型进行分析,以确保诊断的准确率。SHAP在这里不是解释结果,而是反过来决定“哪些参数值得被监控”。

  3. 参数筛选流程图

最后,将筛选后的参数通过随机森林(RF)进行分类,确定其故障种类,并借助热力学模型提供机理基础和物理可解释性。


结果展示

以活塞环磨损(F4)为例,文章同时从单样本视角全局视角观察模型决策过程,下图的图(a)为瀑布图,图(b)为蜂群图。

瀑布图(单样本视角

瀑布图是对某一个F4故障样本的解释,能看清该样本被判定为F4故障的具体原因。该图的基本逻辑是从模型对所有样本的平均预测水平E(X)=-1.797上进行叠加每个参数的SHAP值,最终得到该样本的预测得分1.464。其中,红色表示对于判断该故障参数的取值起到了正向作用,蓝色表示起到了负向作用。

从图中可以明显看出,P12涡轮增压器前排气温度、P6窜气热流、P14涡轮增压器后排气温度、P7涡轮增压器后排气温度这四个热力学参数的数值绝对值最大,在该样本上对于活塞环磨损起到了主要作用。(注意,只是在该样本上,不代表普遍规律,需要看大量样本才能得到最终结论)

蜂群图(全局视角

蜂群图是展示所有F4故障样本的全局参数重要性,能看清哪些参数是 F4 故障的全局关键指标。图中的每个点表示一个样本在对应参数的取值,颜色表明它的取值高低,纵轴是各个参数,下横轴是散落在行上面的点的边际贡献大小,上横轴是该参数的平均的SHAP值大小,参数越靠上表明对判断该故障越起到重要作用。

P11涡轮增压器前排气压力的平均SHAP值最高,表明在判断故障F4上起到主要作用。且P11的大多的高值样本在0的左侧,低值样本在0的右侧,表明大多的故障F4都有P11的低值,而没有故障F4的时候P11取高值。P11的低值对判断故障F4起到了正向作用,而高值起到了负向作用。从物理学角度解释,活塞环磨损的密封失效使窜气加剧,进而导致排气系统热力学失衡,涡轮增压器前排气压力降低,故表现出了P11的低值。(经过大量样本得知,P11涡轮增压器前排气压力的取值在判断故障F4活塞环磨损时起到了突出作用,也符合物理机制)


方法对比

在与 KNN、SVM 等方法的对比中,随机森林在小样本、多参数场景下表现最稳定;进一步结合 SHAP 后:

  • 在多种特征选择方法中,仅 SHAP 同时保证了高精度与物理一致性;
  • 对 F4 与 F5 等高度相似故障仍具备可区分能力;
  • 模型鲁棒性和工程可解释性显著增强。

原始文献

C. Luo, M. Zhao, X. Fu, S. Zhong, S. Fu, K. Zhang, X. Yu. Thermodynamic simulation-assisted random forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines[J]. Measurement, 2025, 251: 117252.

查看原文、代码及数据☞   TSRF: 船用柴油机可解释性故障诊断研究

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐