不定期遴选一些高质量期刊论文,进行介绍,内容不详加解释,重在学习文章的思路。
  模糊隶属度来描述单个经典模型预测值和实际值的接近程度,目前,隶属度函数的构造还没有一个可遵循的一般性准则。在对实际情况进行处理时,通常需要根据经验针对具体问题来确定合理的隶属度函数。因此,本文为了更好的对航空发动机整机振动进行故障诊断和识别,对传统FSVM 隶属度函数改进基础上,建立了一种更有效的隶属度函数。
论文出处:白斌, 李涵, 孔维凯. 基于FSVM改良隶属度的发动机振动故障识别[C]//.第十八届全国非线性振动暨第十五届全国非线性动力学和运动稳定性学术会议(NVND2021).

1、传统FSVM 隶属度分析

  目前FSVM 主要采用样本到类中心距离,基于样本间紧密度的隶属度或S 型函数以及π 型函数来度量其隶属度大小,假设给定振动数据训练样本集为:

T = { ( x 1 , y 1 , s 1 ) , ( x 2 , y 2 , s 2 ) , ⋯   , ( x n , y n , s n ) }  s.t.  x i ∈ R N , y i ∈ { − 1 , 1 } , ( i = 1 , ⋯   , n ) \begin{array}{l} T=\left\{\left(x_{1}, y_{1}, s_{1}\right),\left(x_{2}, y_{2}, s_{2}\right), \cdots,\left(x_{n}, y_{n}, s_{n}\right)\right\} \\ \text { s.t. } \quad x_{i} \in R^{N}, y_{i} \in\{-1,1\},(i=1, \cdots, n) \end{array} T={(x1,y1,s1),(x2,y2,s2),,(xn,yn,sn)} s.t. xiRN,yi{1,1},(i=1,,n)

其中: x i x_{i} xi为样本, y i y_{i} yi为类别, s i s_{i} si为模糊隶属度, ε ⩽ s i ⩽ 1 \varepsilon \leqslant s_{i} \leqslant 1 εsi1 ε \varepsilon ε 是一个任意小的正数保证 s i s_{i} si不为零, R N R^{N} RN N N N 维的高斯特征空间, n n n为样本个数。则该问题实质是如下的优化问题:

min ⁡ 1 2 ∥ ω ∥ 2 + C ( ∑ i = 1 n s i ξ i )  s. t.  y i ( ω z i + b ) + ξ i − 1 ⩾ 0 } \left.\begin{array}{l} \min \frac{1}{2}\|\omega\|^{2}+C\left(\sum_{i=1}^{n} s_{i} \xi_{i}\right) \\ \text { s. t. } \quad y_{i}\left(\omega z_{i}+b\right)+\xi_{i}-1 \geqslant 0 \end{array}\right\} min21ω2+C(i=1nsiξi) s. t. yi(ωzi+b)+ξi10}

其中: ω \omega ω分类界面向量, ξ i \xi_{i} ξi为松弛因子, C C C为惩罚因子, b b b为分类阀值, z i = φ ( x i ) z_{i}=\varphi\left(x_{i}\right) zi=φ(xi)为从输入空间到高维空间映射。
  将上述转化为对偶形式为:

max ⁡ h ( α ) = ∑ i = 1 n α i − 1 2 ∑ i = 1 n ∑ j = 1 n α i α j y i y j K ( x i , y i )  s.t.  ∑ i = 1 n y i α i = 0 , 0 ⩽ α i ⩽ s i C K ( x i , y i ) = exp ⁡ ( − ∥ x i − y i ∥ 2 s i 2 ) } \left.\begin{array}{c} \max h(\alpha)=\sum_{i=1}^{n} \alpha_{i}-\frac{1}{2} \sum_{i=1}^{n} \sum_{j=1}^{n} \alpha_{i} \alpha_{j} y_{i} y_{j} K\left(x_{i}, y_{i}\right) \\ \text { s.t. } \quad \sum_{i=1}^{n} y_{i} \alpha_{i}=0,0 \leqslant \alpha_{i} \leqslant s_{i} C \\ K\left(x_{i}, y_{i}\right)=\exp \left(-\frac{\left\|x_{i}-y_{i}\right\|^{2}}{s_{i}^{2}}\right) \end{array}\right\} maxh(α)=i=1nαi21i=1nj=1nαiαjyiyjK(xi,yi) s.t. i=1nyiαi=0,0αisiCK(xi,yi)=exp(si2xiyi2)

其中,式( 4) 为核函数,α 为拉格朗日乘子。
  对任给的测试样本可由下式(5)计算:

W ( x ) = sgn ⁡ [ ∑ i = 1 n α i y i K ( x i , y i ) + b ] W(x)=\operatorname{sgn}\left[\sum_{i=1}^{n} \alpha_{i} y_{i} K\left(x_{i}, y_{i}\right)+b\right] W(x)=sgn[i=1nαiyiK(xi,yi)+b]

  假设给定训练样本集为: { ( x i , y i , s i ) } i = 1 n \left\{\left(x_{i}, y_{i}, s_{i}\right)\right\}_{i=1}^{n} {(xi,yi,si)}i=1n,采用包围样本集的最小球半径来度量样本集的紧密度,设 x + x^{+} x+为球正样本 o + o^{+} o+中心, 设 x − x^{-} x为球负样本 o + o^{+} o+中心, 则任意 样本点离所在球心的最大距离(6)分别为:

d + = max ⁡ ∥ x + − x i ∥ , x i ∈ o + d − = max ⁡ ∥ x − − x i ∥ , x i ∈ o − } \left.\begin{array}{l} d^{+}=\max \left\|x^{+}-x_{i}\right\|, x_{i} \in o^{+} \\ d^{-}=\max \left\|x^{-}-x_{i}\right\|, x_{i} \in o^{-} \end{array}\right\} d+=maxx+xi,xio+d=maxxxi,xio}

则第 i i i类样本模糊隶属度(7)为:

s i = { 1 − ∥ x + − x i ∥ d + + δ x i ∈ o + 1 − ∥ x − − x i ∥ d − + δ x i ∈ o − s_{i}=\left\{\begin{array}{ll} 1-\frac{\left\|x^{+}-x_{i}\right\|}{d^{+}+\delta} & x_{i} \in o^{+} \\ 1-\frac{\left\|x^{-}-x_{i}\right\|}{d^{-}+\delta} & x_{i} \in o^{-} \end{array}\right. si=1d++δx+xi1d+δxxixio+xio

式中: δ是任意小的正数。
  这种方法不能很好地将含有噪声或异常样本从有效样本中区分出来。如图1所示,x 点到类中心的距离相等,根据式(7) 可得这点的两类隶属度是相同的。但是从各样本的排列紧密程度考虑,左图的x点可能是支持向量,而右图中的x点更可能为异常样本。故仅用点到类中心的距离来确定隶属度是不够全面的,影响了FSVM 算法的分类精度,需要对该隶属度做进一步改进。
在这里插入图片描述
图1中, D D D表示样本 x x x到其类中心距离, D 1 − D 8 D_{1}-D_{8} D1D8:相邻点之间的距离。

2、改进的FSVM 隶属度分析

  结合 k k k近邻法思想,考虑样本之间的紧密程度,改进传统隶属度函数。本文中提出了一种在核空间中计算每个样本隶属度的模糊隶属函数。
  设 φ ( x + ) φ(x^{+}) φ(x+)为球正样本 o + o^{+} o+中心,设 φ ( x − ) φ(x^{-}) φ(x)为球负样本 o − o^{-} o中心,则任意样本点离所在球心的最大距离(8)分别为:

d ker  + = max ⁡ ∥ φ ( x + ) − φ ( x i ) ∥ , x i ∈ o + d ker  − = max ⁡ ∥ φ ( x + ) − φ ( x i ) ∥ , x i ∈ o − } \left.\begin{array}{rl} d_{\text {ker }}^{+} & =\max \left\|\varphi\left(x^{+}\right)-\varphi\left(x_{i}\right)\right\|, x_{i} \in o^{+} \\ d_{\text {ker }}^{-} & =\max \left\|\varphi\left(x^{+}\right)-\varphi\left(x_{i}\right)\right\|, x_{i} \in o^{-} \end{array}\right\} dker +dker =maxφ(x+)φ(xi),xio+=maxφ(x+)φ(xi),xio}

则第 i i i类样本且属于该类的模糊求属度(9)为:

s keri  = { 1 − ∥ φ ( x + ) − φ ( x i ) ∥ d ker  + + δ x i ∈ o + 1 − ∥ φ ( x + ) − φ ( x i ) i ∥ d ker  − + δ x i ∈ o − s_{\text {keri }}=\left\{\begin{array}{ll} 1-\frac{\left\|\varphi\left(x^{+}\right)-\varphi\left(x_{i}\right)\right\|}{d_{\text {ker }}^{+}+\delta} & x_{i} \in o^{+} \\ 1-\frac{\left\|\varphi\left(x^{+}\right)-\varphi\left(x_{i}\right)_{i}\right\|}{d_{\text {ker }}^{-}+\delta} & x_{i} \in o^{-} \end{array}\right. skeri =1dker ++δφ(x+)φ(xi)1dker +δφ(x+)φ(xi)ixio+xio

于是, 第 i i i个样本和第 j j j个样本在核空间距离(10)为:

d kerij  = ∥ φ ( x i ) − φ ( x j ) ∥ , 1 ⩽ i ⩽ n , 1 ⩽ j ⩽ n ,  且  i ≠ j \begin{array}{c} d_{\text {kerij }}=\left\|\varphi\left(x_{i}\right)-\varphi\left(x_{j}\right)\right\|, \\ 1 \leqslant i \leqslant n, 1 \leqslant j \leqslant n, \text { 且 } i \neq j \end{array} dkerij =φ(xi)φ(xj),1in,1jn,  i=j

且满足下列条件(11):

d keril  ⩽ d keri  2 ⩽ ⋯ ⩽ d keri  ( l − 2 ) ⩽ d keri  ( l − 1 ) d_{\text {keril }} \leqslant d_{\text {keri } 2} \leqslant \cdots \leqslant d_{\text {keri }(l-2)} \leqslant d_{\text {keri }(l-1)} dkeril dkeri 2dkeri (l2)dkeri (l1)

则紧密度模糊隶属度(12)~(14)为:

μ keri  = b keri  / B b keri  = 1 ∑ j = 1 m d kerij  B = max ⁡ ( b kerl  , b ker  2 , ⋯   , b ker  ) \begin{array}{c} \mu_{\text {keri }}=b_{\text {keri }} / B \\ b_{\text {keri }}=\frac{1}{\sum_{j=1}^{m} d_{\text {kerij }}} \\ B=\max \left(b_{\text {kerl }}, b_{\text {ker } 2}, \cdots, b_{\text {ker }}\right) \end{array} μkeri =bkeri /Bbkeri =j=1mdkerij 1B=max(bkerl ,bker 2,,bker )

其中: m m m表示离 x i x_{i} xi最近的点数。
  由式(9)~式(11) 可知: 模糊隶属度 μ i μ_{i} μi是由样本与样本之间的关系确定的,考虑了样本的紧度。
  由式(8)~式(14) 可以得出FSVM 的改进模糊隶属度(15)为:
s keri  ′ = s keri  μ k e r i s_{\text {keri }}^{\prime}=s_{\text {keri }} \mu_{\mathrm{keri}} skeri =skeri μkeri
  由式(15) 可以看出: 改进的隶属度为式(9) 和式(12) 两个隶属度的点积,既考虑了样本与所在类中心的关系,又考虑了类中样本与样本之间的关系。这样,有利于改善隶属度确定的合理性。

3、FSVM多类隶属度分析

  模糊支持向量机状态分析方法是利用模糊支持向量机理论中的隶属度确定函数和模糊关系矩阵来描述故障模式与故障原因之间的模糊关系,进而建立隶属度矩阵。然而,发动机振动故障模式与故障原因之间关系是很复杂的,涉及到多故障模式多故障原因,需要提出多类隶属度确定方法。
  假设航空发动机可能产生振动故障原因集合为: Y = { y 1 , y 2 , ⋯   , y l } Y=\left\{y_{1}, y_{2}, \cdots, y_{l}\right\} Y={y1,y2,,yl}, 其中 l l l为故障原因总数。由 l l l个故 障原因引起的振动故障模式集合为: X = { x 1 , x 2 , ⋯   , x m } X=\left\{x_{1}, x_{2}, \cdots\right.,\left.x_{m}\right\} X={x1,x2,xm},其中 m m m为故障模式类别总数。于是,假设第 i i i种故障原因第 j j j种故障模式的样本集 T ( i j ) T^{(i j)} T(ij)为:

T ( i j ) = { ( x 1 ( i j ) , y 1 ( i j ) , s 1 ( i j ) ) , ( x 2 ( i j ) , y 2 ( i j ) , s 2 ( i j ) ) , ⋯   , ( x n ( i j ) , y n ( i j ) , s n ( i j ) ) }  s.t.  x k ( i j ) ∈ R N , y k ( i j ) ∈ Y , k = 1 , ⋯   , n } ( 16 ) \left.\begin{array}{l} T^{(i j)}=\left\{\left(x_{1}^{(i j)}, y_{1}^{(i j)}, s_{1}^{(i j)}\right),\left(x_{2}^{(i j)}, y_{2}^{(i j)}, s_{2}^{(i j)}\right), \cdots,\right. \\ \left.\quad\left(x_{n}^{(i j)}, y_{n}^{(i j)}, s_{n}^{(i j)}\right)\right\} \\ \text { s.t. } \quad x_{k}^{(i j)} \in R^{N}, y_{k}^{(i j)} \in Y, k=1, \cdots, n \end{array}\right\}(16) T(ij)={(x1(ij),y1(ij),s1(ij)),(x2(ij),y2(ij),s2(ij)),,(xn(ij),yn(ij),sn(ij))} s.t. xk(ij)RN,yk(ij)Y,k=1,,n(16)

其中, x k ( i j ) x_{k}^{(i j)} xk(ij)为样本, y k ( i j ) y_{k}^{(i j)} yk(ij) 为类别, s k ( i j ) s_{k}^{(i j)} sk(ij) 为模糊隶属度, R N R^{N} RN N N N维的高斯特征空间, n n n为样本个数。
  由式(8) 和式(9) 可得第 k k k个样本的距离模糊隶属度 s kerk  ( i j ) s_{\text {kerk }}^{(i j)} skerk (ij) , 即:

s kerk  ( i j ) = 1 − ∥ φ ( x ( i j ) ) − φ ( x k i j ) ∥ d ker  i j + δ ( k = 1 , 2 , ⋯   , n ) ( 17 ) \begin{array}{c} s_{\text {kerk }}^{(i j)}=1-\frac{\left\|\varphi\left(x^{(i j)}\right)-\varphi\left(x_{k}^{i j}\right)\right\|}{d_{\text {ker }}^{i j}+\delta} \\ (k=1,2, \cdots, n) \end{array}(17) skerk (ij)=1dker ij+δφ(x(ij))φ(xkij)(k=1,2,,n)(17)

其中: d k e r i j d_{\mathrm{ker}}^{i j} dkerij为样本到类中矢最大距离, φ ( x i j ) \varphi\left(x^{ij}\right) φ(xij)为类中心。
  则由式(8) ∼ \sim 式(11)可得第 k k k个样本的紧密度模糊隶属度 μ k e r k ( i j ) \mu_{\mathrm{kerk}}^{(i j)} μkerk(ij), 即(18):

μ kerk  ( i j ) = b ker  ( i j ) / B ( i j ) \mu_{\text {kerk }}^{(i j)}=b_{\text {ker }}^{(i j)} / B^{(i j)} μkerk (ij)=bker (ij)/B(ij)

  用 s kerl  ( (i)  s_{\text {kerl }}^{(\text {(i) }} skerl ((i) 表示第 k k k个样本的改进模糊隶属度(19),则:

s kerk  , ( i j ) = s kerk  , ( i j ) μ kerk  ( i j ) s_{\text {kerk }}^{,(i j)}=s_{\text {kerk }}^{,(i j)} \mu_{\text {kerk }}^{(i j)} skerk ,(ij)=skerk ,(ij)μkerk (ij)

  可以按照以上改进模糊隶属度的计算思想计算出 n 个样本的改进模糊隶属度。若将 n n n个样本的改进模 糊隶属度相加,则可得故障模式 x i x_{i} xi隶属于原因 y j y_{j} yj的模糊隶属度 s k e r , ( i j ) s_{k e r}^{,(i j)} sker,(ij),即(20)

s k e r , ( i j ) = ∑ k = 1 n s k = r , ( i j ) s_{k e r}^{,(i j)}=\sum_{k=1}^{n} s_{k=r}^{,(i j)} sker,(ij)=k=1nsk=r,(ij)

  若按照以上的计算方法,则可以计算出所有故障 模式隶属于所有故障原因的模糊隶属度 { m kerk  ( i j ) } \left\{m_{\text {kerk }}^{(i j)}\right\} {mkerk (ij)},这 些隶属度可以构造出模糊关系矩阵,即模糊隶属度矩阵:
S = ( m ( i j ) ) m × l = [ s ker  ′ ( 11 ) s ker  ′ ( 12 ) ⋯ s ker  ′ ( 1 l ) s ker  ′ ( 21 ) s ker  ′ ( 22 ) ⋯ s ker  ′ ( 2 l ) ⋯ ⋯ ⋯ ⋯ s ker  ′ ( m 1 ) s ker  ′ ( m 2 ) ⋯ s ker  ′ ( m l ) ] \boldsymbol{S}=\left(m^{(i j)}\right)_{m \times l}=\left[\begin{array}{cccc} s_{\text {ker }}^{\prime(11)} & s_{\text {ker }}^{\prime(12)} & \cdots & s_{\text {ker }}^{\prime(1 l)} \\ s_{\text {ker }}^{\prime(21)} & s_{\text {ker }}^{\prime(22)} & \cdots & s_{\text {ker }}^{\prime(2 l)} \\ \cdots & \cdots & \cdots & \cdots \\ s_{\text {ker }}^{\prime(m 1)} & s_{\text {ker }}^{\prime(m 2)} & \cdots & s_{\text {ker }}^{\prime(m l)} \end{array}\right] S=(m(ij))m×l=sker (11)sker (21)sker (m1)sker (12)sker (22)sker (m2)sker (1l)sker (2l)sker (ml)

4、评估分类效果

  在航空发动机振动状态分析之前,先验证提出的隶属度确定方法的有效性。隶属度的有效性通常是通过它的FSVM 分类效果来体现。于是,通过计算机随机产生两个类别( 分别用 x 1 x_{1} x1 x 2 x_{2} x2表示) 的2维空间500个样本点,假设这些样本点分布在 [ - 5 , 5 ] [-5,5] 55之间。选取200个样本作为训练样本,对FSVM 进行训练,建立FSVM 模型; 然后,再用300个样本点( 含5个异常样本)作为测试样本( 如图2) ,对该模型进行测试。为了体现改进隶属度的优越性,基于相同的训练样本和测试样本,分别与SVM、距离隶属度的FSVM 的分类结果进行比较,其分类效果如图2所示,结果如表1所示。
在图片描述
 样本   SVM   距离 FSVM   改进 FSVM   测试样本点  300 300 300  无错样本点  267 281 295  准确率  / % 89 93.67 98.33 \begin{array}{cccc} \hline \text { 样本 } & \text { SVM } & \text { 距离 FSVM } & \text { 改进 FSVM } \\ \hline \text { 测试样本点 } & 300 & 300 & 300 \\ \text { 无错样本点 } & 267 & 281 & 295 \\ \text { 准确率 } / \% & 89 & 93.67 & 98.33 \\ \hline \end{array}  样本  测试样本点  无错样本点  准确率 /% SVM 30026789 距离 FSVM 30028193.67 改进 FSVM 30029598.33
  提出的紧密度隶属度的FSVM 分类的正确率达98.33%,其精确度分别比传统SVM 的89%和基于距离模糊隶属度FSVM 的93.67%提高了9.33%和4.66%。由此可见,本文提出的隶属度函数在隶属度确定方面具有良好的效果。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐