基于卷积胶囊网络的滚动轴承故障诊断研究_杨平(1).pdf

返回 相似 举报
基于卷积胶囊网络的滚动轴承故障诊断研究_杨平(1).pdf_第1页
第1页 / 共9页
基于卷积胶囊网络的滚动轴承故障诊断研究_杨平(1).pdf_第2页
第2页 / 共9页
基于卷积胶囊网络的滚动轴承故障诊断研究_杨平(1).pdf_第3页
第3页 / 共9页
基于卷积胶囊网络的滚动轴承故障诊断研究_杨平(1).pdf_第4页
第4页 / 共9页
基于卷积胶囊网络的滚动轴承故障诊断研究_杨平(1).pdf_第5页
第5页 / 共9页
点击查看更多>>
资源描述:
 振动与冲击 第 39 卷第 4 期JOURNAL OF VIBRATION AND SHOCKVol. 39 No. 4 2020 收稿日期2018 -07 -26修改稿收到日期2018 -11 -05 第一作者 杨平 男, 硕士生, 1994 年生 通信作者 苏燕辰 男, 硕士, 副教授, 1964 年生 基于卷积胶囊网络的滚动轴承故障诊断研究 杨平,苏燕辰,张振 西南交通大学机械工程学院, 成都 610031 摘要针对目前许多基于深度学习的滚动轴承故障诊断方法在检测含有噪声的信号以及载荷变化时, 其诊断性 能会有所下降的问题。提出一种基于卷积胶囊网络的故障诊断方法; 该模型使用两个卷积层的卷积网络直接对原始的一 维时域信号进行特征提取, 并将其送入胶囊网络, 输出每种故障类型的诊断结果; 为了验证该模型的诊断性能, 选用凯斯 西储大学轴承数据库来进行验证, 并与常见的卷积神经网络和深度神经网络进行对比。试验结果表明, 相比于其它深度 学习方法, 该方法在载荷变化以及信号受到严重噪声污染时, 依然拥有良好的诊断性能。 关键词卷积网络; 胶囊网络; 故障诊断; 滚动轴承 中图分类号TH133. 3文献标志码ADOI 10. 13465/j. cnki. jvs. 2020. 04. 006 A study on rolling bearing fault diagnosis based on convolution capsule network YANG Ping,SU Yanchen,ZHANG Zhen School of Mechanical Engineering,Southwest Jiaotong University,Chengdu 610031,China AbstractAiming at the phenomenon that the diagnostic perance of many rolling bearing fault diagnosis s based on deep learning will be degraded when the noise- containing signal was detected and load variation,a fault diagnosis based on convolution capsule network was proposed. The model uses a convolutional network with two layers of large convolution kernels to extract features from the original one- dimensional time domain signal and send it to the capsule network. The output of the model was the diagnostic results for each type of fault. In order to verify the diagnostic perance of the model,the Case Western Reserve University bearing database was selected for experiment, and compared the model with common convolutional neural network and deep neural network. The experimental results show that this still has superior diagnostic perance in the test signals with serious noise and load variation compared with other deep learning s. Key wordsconvolution network;capsule network;fault diagnosis;rolling bearing 轴承是当代机械设备中一种重要零部件。其功能 是支承旋转体, 降低旋转体相对运动过程中的摩擦因 数, 并保证其回转精度。轴承发生故障可能会致使整 个设备损坏, 造成经济损失 [1 ]。因此为了保证设备运 行的可靠性, 减少安全隐患, 十分有必要对轴承的健康 状态进行实时的监测[2 ]。 传统的故障诊断方法中, 都是通过人工提取故障 特征来判别轴承是否发生故障。例如使用经验模态分 解 [3 ]、 希尔伯特 - 黄变换[4 ]、 小波变换[5 ]等数学工具对 原始信号进行变换来提取其故障特征。随着机器学习 的发展, 一些学者开始尝试将其运用到故障诊断领域。 例如使用贝叶斯分类器[6 ]、 支持向量机 [7 ]、 神经网络[8 ] 等机器学习方法来对所提取的故障特征进行识别和分 类。这些方法虽然拥有不错的性能, 但是轴承故障特 征的提取需要使用复杂的数学工具, 而且针对不同类 型的故障所使用的特征提取方法也不尽相同。因此通 过人工提取故障特征的诊断方法都极度的依赖于故障 诊断专家的经验和知识 [9 ]。随着轴承监测点的增多, 数据量的增大, 使用传统的诊断方法已不能满足大数 据分析的要求。 近年来, 深度学习技术在计算机视觉[10 ], 自然语言 处理 [11 ]、 语音识别[12 ]等领域取得了跨越式的发展。一 些深度学习方法也被使用到轴承故障诊断领域。例 如, 卷积神经网络 [13 -14 ]、 深度信念网络[15 ]、 深度神经网 络 [16 ], 稀疏自编码器[17 ]、 卷积自编码网络[18 ]等。许多 深度学习方法虽然免去了复杂的人工特征提取操作, 但是其依然需要对原始数据进行预处理。例如, 将一 ChaoXing 维的振动信号转化为二维图像信号[19]、 将时域信号 转化为频域信号[20]、 对数据进行归一化[21]等。在 实际的工业应用中, 通过加速度传感器采集到的振 动信 号 会 受 到 各 种 现 场 噪 声 的 污 染, 且 无 法 避 免[22]。此外, 在机械系统中, 轴承的转速会随负载 的变化而改变, 由传感器所测得振动信号也会改变。 许多深度方法虽然拥有良好的识别精度。而在检测 含有噪声的信号以及载荷发生变化时性能会出现显 著的下降[23 - 24]。 胶囊网络由 Sabour 等 [25 ]在 2017 年首次提出。相 比于传统的神经网络, 胶囊网络中的每一个神经元都 是一个向量, 而不是传统的标量。这可以使胶囊网络 可以从输入数据中提取更多细节特征, 同时也减少了 特征信息的丢失。因此, 为了有效地解决深度学习网 络模型在检测含有噪声的信号以及载荷发生变化时, 性能降低的问题。本文提出一种基于卷积胶囊网络的 故障诊断方法。该模型将两层大卷积核的卷积网络与 能够提取更多细节信息的胶囊网络相结合。以此来对 原始信号的故障特征进行充分的提取, 从而使其能够 在检测含有噪声的信号或者载荷发生变化时也依然能 够分辨出轴承是否发生故障以及发生故障的类别。此 外, 该模型将一维的振动信号作为输入, 无需手工提取 故障特征或将原始信号转化为二维信号等数据预处理 操作。在本文中, 使用凯斯西储大学轴承数据来对该 模型的有效性进行验证, 并与传统卷积神经网络进行 对比。实验结果表明, 该模型在含噪声的测试信号中 具有更高的识别精度。 1基础理论 1. 1一维卷积网络 不同于传统的神经网络, 卷积神经网络都包含一 个卷积层和一层池化层来组成特征提取器。通过卷积 核的权值共享和局部连接极大的减少了模型的参数 量。同时也使卷积神经网络的复杂度降低。此外, 也 降低网络模型过拟合的风险。 如图 1 所示, 卷积网络的每层卷积运算过程主要 由卷积运算、 激活运算和池化运算组成。用一个卷积 核作为一个特征探测器, 将其与输入层进行卷积运算, 所得到的结果为一个新的特征层。其计算公式可表 达为 xlj∑ i xl-1 i * wlij blj 1 式中xlj为第 l 卷积层的第 j 个特征通道;xl -1 i 为第 l - 1 层的第 i 个特征通道;wlij为卷积核权值;blj为偏差; * 为卷积操作。 图 1卷积网络结构 Fig. 1Convolution network architecture 为了使模型拥有非线性表达能力, 把卷积层的结 果作一个非线性映射。非线性映射函数也称为激活函 数。在卷积神经网络中, 最常用的激活函数为 ReLU 函 数, 其表达式为 ylj f xlj max 0, xlj 2 在通过卷积运算获得特征层之后, 一般都会连接 一个池化层。池化层也可以视作为一个特殊的卷积操 作。将尺寸为 n 1 的输入层划分为多个尺寸为 k 1 的小单元。分别求每个小单元的最大值作为输出组成 一个尺寸为 n/k 1 的新特征层。记 ylr表示池化后的 特征层。其公式可表达为 ylrmax j-1 k1≤t≤jk y l t 3 1. 2胶囊网络 胶囊网络的核心思想是将传统神经网路的每个神 经元由标量转换成为向量, 将向量作为网络的输入和 输出, 以此来降低特征信息的丢失, 提高模型的特征提 取能力。 整个运算过程可以分为三个阶段 第一阶段的运 算与传统的神经网络运算类似, 都是神经元乘以一个 权重值而得到一个输出, 所不同的是, 胶囊网络的神经 元是一个向量, 而不是一个标量。记上一层第 i 个神经 元为 ui,Wij为与神经元 ui相乘的权重矩阵,u ji为预 测向量。则其公式可表达为 uj i Wijui 4 在第二阶段, 对预测向量 uj i进行加权求和而得到 一个输出向量 sj。其公式可由式 5 表示, 其中为 cij耦 合系数。 sj∑ i cijuj i 5 在第三阶段将输出向量 sj进行一个非线性映射从 而得到最终的输出向量 vj。下标 j 为第 j 个输出神经 元。非线性映射函数如式 6 所示。 vj ‖s j‖ 2 1 ‖sj‖2 sj ‖s j‖ 6 耦合系数 cij由动态路由算法确定, 其目的是让输 入的神经元自主选择最好的路径传输到下一层神经 元。其计算公式如式 7 和式 8 65振 动 与 冲 击2020 年第 39 卷 ChaoXing cij ebij ∑ k ebik 7 bij bij vjuji 8 动态路由算法的运算过程如图 2 所示。在每一次 前向传播中, 都先将 bij初始化为 0, 由式 7 计算出耦 图 2胶囊网络结构 Fig. 2Capsule network architecture 合系数 cij的初始化值, 然后由网络的前向传播计算出 vj。使用式 8 来更新 bij的值, 从而更新 cij的值而通过 前向传播进一步修正 sj的值, 从而改变输出向量 vj的 值, 根据动态路由迭代次数循环这一过程, 最终得到一 组最佳的耦合系数。 2基于卷积胶囊网络的轴承故障诊断方法 2. 1模型的结构 为了从原始振动信号提取更多的有用信息, 避免 手工提取特征, 本文将传统的卷积网络中与胶囊网络 组合在一起构成一个新的网络。并简称为 FD- CCN Fault Diagnosis- Convolution Capsule Network 。其前馈 网络结构如图 3 所示。 图 3 FD- CCN 结构 Fig. 3Architecture of FD- CCN FD- CCN 主要由两个卷积层和一个胶囊层组成。 由于模型结构简单层数相对较少, 为了获取更多的信 息, 卷积层使用了较大尺寸的卷积核。由于在轴承振 动数据的采集过程中, 噪声污染无论如何都无法避免, 较大的卷积核带来的大感受野可以在一定成度避免了 噪声, 提高模型的抗噪能力。模型的具体参数设置见 “ 3. 2” 节。该模型将原始的一维振动信号作为输入, 不 需要做任何变换和预处理操作, 做到了真正意义上的 数据驱动。为了加快模型在训练时的收敛速度, 避免 梯度爆炸以及防止过拟合, 在卷积层中使用 ReLU 作为 激活函数。在每层卷积之后, FD- CCN 依然保留了传统 卷积神经网络的池化层, 这里主要是使用池化操作来 降低模型的参数量, 进一步加速模型的训练速度, 而且 池化层也能有效的防止过拟合, 提高模型的泛化能力。 2. 2模型的前向传播过程 模型的前两层就是传统的卷积运算和池化运算, 其前向传播运算过程见“1. 1” 节。前两层卷积层的作 用是对原始的一维振动信号进行充分的特征提取以及 降低数据的维度。 由于最后一层是一个胶囊层, 在胶囊层中, 神经元 是一个向量而不是标量。而在前面的所进行的两层卷 积操作之后得到的特征层为标量。因此需要将卷积之 后的特征层重构成为向量的形式。构建向量神经元的 方法是将特征层的每 4 个通道合并成为一个新的胶囊 单元, 新组成胶囊单元的每个神经元向量的维度则为 4。而所得到的胶囊单元的通道数将由减少为原来通 道数的 1/4。胶囊单元将作为胶囊层的输入。 将构建好的胶囊单元送入胶囊层, 胶囊层的前向传 播运算见 “ 1.2” 节。胶囊层输出的胶囊单元为10 个维度 为8 的向量, 每个向量代表每一种故障类型, 而向量的模 代表某个故障类别的概率。因此, 需要将输出的胶囊单 元中的每个向量的二范数求出, 其计算公式可表达为 pj ‖vj‖ 9 在前向传播过程中, 经过两层的卷积运算和一层 75第 4 期杨平等基于卷积胶囊网络的滚动轴承故障诊断研究 ChaoXing 的胶囊运算, 以及将胶囊运算后输出的向量转化为标 量之后, 最终输出的是 10 个概率值, 分别对应着十种 类型的故障。 2. 3模型的损失函数 在模型的训练过程中, 模型的权值需要通过反向传 播算法对其进行更新或迭代。而反向传播需要一个能度 量模型输出值与真实值之间距离的损失函数。通过损失 函数, 在训练时就可以通过反向传播算法不断更新迭代 模型的权重值。在本文中, 所使用损失函数的表达式为 Lc Tcmax 0, m - pc 2 λ 1 - Tc max 0, pc- m- 2 10 式中pc为模型最终输出的10 个概率值, 下标 c 为输出 的第 c 个数字;Tc为分类指示函数, 假设输出的第 K 个 数字表示故障类别 K, 即该数字负责预测类别 K 的概率, 则当输入的样本为类别K 且c K 时, Tc1, 否则Tc0; m 为上边界, 这里取值为固定值 0. 9, 当概率值 pc>0. 9 时, 将损失函数置为0;m - 为下边界, 这里取值为固定值 0.1, 当概率值 pc<0. 1 时, 将损失函数置为 0;λ 为一个 比例系数, 用来调整两项比例, 这里取值为0.5。 3实验分析 3. 1实验数据 3. 1. 1数据来源 为了验证 FD- CCN 算法的故障诊断性能。本文选 取了凯斯西储大学滚动轴承数据中心的公开数据集来 进行验证。 图 4凯斯西储大学轴承数据采集系统 Fig. 4Bearing data acquisition system used by CWRU 该数据采集系统由一个的电机 左侧 , 一个转矩 传感器 中间 , 一个功率计 右侧 和电子控制设备组 成。被测试轴承为电机支承轴承, 型号为深沟球 SKF 轴承。使用电火花加工技术在被测轴承的内圈、 滚动 球体以及外圈上设置单点故障。每个位置上的三种直 径故障, 分别为 0. 177 8 mm, 0. 355 6 mm, 0. 533 4 mm。 共九种故障类型。振动信号通过 16 通道的 DAT 记录 器以 12 kHz 的采样频率采集。 3. 1. 2扩充数据集 在深度学习中, 由于人工神经网络所拥有的强大 拟合能力, 训练集的样本过少则会导致模型在训练集 上过拟合, 在测试集上测试精度下降。为了防止或避 免过拟合。通常需要大量的样本作为训练集。因此本 文采用重叠采样的方法来构建数据集。构建训练集样 本和测试集样本的方法, 如图 5 所示。从原始振动信 号的起始点开始采集, 每次采集 2 048 个数据点, 采集 完成之后则向后移动 205 个数据点继续采集。直到采 集完整个原始数据。 图5 从凯斯西储大学的数据中构建训练集样本和测试集样本 Fig.5 Building training set and test set from the data of CWRU 在将所有的原始数据采集完成之后, 构建出的训 练集和测试集如表 1 所示。数据 A 为电机转速等于 1 772 red/min时 的 数 据, 数 据 B 为 电 机 转 速 等 于 1 750 red/min时 的 数 据, 数 据 C 为 电 机 转 速 等 于 1 730 red/min时的数据。每个数据集都包含 9 个故障 类型和一个无故障类型, 总共 10 个类型, 且每个类型 的样本数一样。每个样本都采用一个十维的 one- hot 编码向量来制作标签, 该向量的 10 个数中只有一个值 为 1, 其余为 0, 而数值为 1 的位置索引则表示某个类 别。数据集 D 为 A, B, C 的总和。 表 1训练和测试数据集 Tab. 1Training set and test set 故障 直径 正常 0 内圈 0. 0070. 0140. 021 球体 0. 0070. 0140. 021 外圈 0. 0070. 0140. 021 载荷 A训练8008008008008008008008008008001 hp 测试200200200200200200200200200200 B训练8008008008008008008008008008002 hp 测试200200200200200200200200200200 C训练8008008008008008008008008008003 hp 测试200200200200200200200200200200 D训练2 4002 4002 4002 4002 4002 4002 4002 4002 4002 400 测试600600600600600600600600600600 85振 动 与 冲 击2020 年第 39 卷 ChaoXing 3. 2模型参数设置 FD- CCN 的模型参数设置如表 2 所示。FD- CCN 是 一个相对较浅的网络, 仅使用两层卷积层来提取特征。 为了充分提取信息, 卷积层都使用了较大的卷积核, 第 一层卷积核的尺寸为 127 1, 第二层为 7 1。池化层 在这里最主要的作用是降维, 为了在降维的同时不丢 掉过多的信息, 所设计池化层的尺寸为 2 1。在第二 层池化层之后, 需要构建胶囊单元, 所以表 2 的输出尺 寸 8 48 表示一个胶囊单元的尺寸。8 48 的含义是特征层的宽度为 8, 通道数或深度为 8, 特征 层的每一个向量的维度为 4。同理,10 8 表示 10 个维度为 8 的向量。 在模型的训练过程中, 使用 adam 优化算法进行优 化, 且学习率设置为 0. 001。为了防止模型过拟合, 模 型训练的迭代次数设置为 2 000 次。胶囊层的动态路 由算法的迭代次数为 3 次。由于数据集数量比较大, 每次迭代使用所有的样本数据会使迭代速度过慢, 且 对计算设备的内存要求较高。因此选用 Mini- batches Learning, 即每次迭代仅用一部分数据进行, Mini- batch Learning 的 BatchSize 设置为 64。由于胶囊网络有极强 的拟合能力。因此, 在训练时, 在胶囊层使用 dropout 操作 [26 ], 即在每次迭代中, 对神经元进行随机失活, 而 失活神经元的权值在该次迭代不会被更新, 相当于降 低模型的复杂度, 其目的是防止模型过拟合。 表 2 FD- CCN 结构参数 Tab. 2FD- CCN architecture parameter 序号层类型核尺寸步长 核个数输出尺寸Padding 1卷积层 1 127 1323264 32Yes 2池化层 12 123232 32No 3卷积层 27 123216 32Yes 4池化层 22 12328 48No 5胶囊层10110 8No 3. 3实验对比算法描述 为了验证本文所提出算法的有效性。在实验中, 本文所提出的 FD- CCN 模型将会和常见的深度学习算 法进行对比。 3. 3. 1卷积神经网络 在实验中, CNN Convolutional Neural Network 结 构与 FD- CCN 类似。CNN 将 FD- CCN 的胶囊层替换为 传统的全连接层, 且神经元个数设置为 100, 在该层使 用 dropout 操作来防止过拟合。除此之外, CNN 的参数 与 FD- CCN 完全一致。 3. 3. 2深度神经网络 在实验中, DNN Deep Neural Network 含有两个隐 层, 第一个隐层的神经元个数设置为 1 024, 第二个隐 层的神经元个数设置为 512。在训练时, 每层隐层都使 用 dropout 来防止模型过拟合。 3. 4故障诊断性能实验分析 分别使用构建好的数据集 A, B, C, D 进行实验。 由于模型在训练的过程中, 权值的初始化是随机的。 为了避免实验结果受其影响, 每个模型在每个数据集 上各重复做五次实验, 然后取其平均值。表 3 显示了 不同算法在不同的数据集上的实验结果。从表中可以 可以看出 DNN、 CNN、 FD- CCN 这三种深度学习方法的 识别准确率均达到 98及以上。这也说明深度学习方 法拥有极强的故障诊断能力。在数据集 D 的实验中, FD- CCN 比 DNN 和 CNN 分别提高 1. 43 和 0. 15。 这说明 FD- CCN 相比于其它深度学习模型在面对更大 的数据量时, 其稳定性更好。 表 3不同算法的实验结果 Tab. 3Experimental results of different algorithms MODELABCD DNN99. 499. 2599. 298. 57 CNN10010010099. 5 FD- CCN10010010099. 65 3. 5噪声环境下故障诊断性能分析 3. 5. 1噪声问题描述 在实际应用场景中, 传感器所测得的信号中会不 可避免的受到噪声的干扰。为了验证模型在噪声环境 下的故障诊断性能, 在测试数据集上添加不同信噪比 SNR Signal to Noise Ratio 的加性高斯白噪声。信噪比 SNR 是评价信号中所含噪声大小的重要指标。其计算 公式为 SNR 10lg Psignal Pnoise 11 当原始信号加入噪声之后, 原始信号的特征被噪 声淹没严重, 如图 6 所示。人眼已无法清晰的分辨含 噪声信号与原始信号是否属于同一类型的故障。 图 6原始信号、 高斯白噪声信号以及含信噪比 为 -4 dB 的信号 Fig. 6Raw signal,white gaussian noise,and the composite noisy signal with SNR -4 dB respectively 3. 5. 2噪声环境下故障诊断实验 在抗性噪实验中, 选择数据集 D 来进行实验。为 95第 4 期杨平等基于卷积胶囊网络的滚动轴承故障诊断研究 ChaoXing 了真实反应模型在噪声环境下的故障诊断性能, 实验 训练的数据均为不添加噪声的原始数据。而测试数据 则会添加不同信噪比的高斯白噪声。模型在进行训练 时, 每种算法都对原始数据进行 duopout 操作, 相当于 在训练时添加噪声干扰, 其目的是为了使模型拥有良 好的泛化性能。不同算法在不同噪声环境下的诊断结 果如图 7 所示。 图 7在不同信噪比的测试信号中的识别准确率对比 Fig. 7Comparsion of recognition accuracy under different noisy environment 由图 7 可知, 在噪声环境下 DNN 的诊断性能明显 低于 CNN 和 FD- CCN。在信噪比为 4 时, DNN 相比于 CNN, 其识别准确率下降 1. 28, 相比于 FD- CCN, 下降 1. 49。在信噪比低于 2 的环境下, DNN 与 CNN 的识 别准确率都开始出现严重的下滑, 在信噪比为 - 4 时。 DNN 和 CNN 的准确率仅分别为 83. 82 和 84. 05。 而 FD- CCN 依然保持 96. 51 的识别准确率。相比于 DNN 和 CNN 分别提升了12. 69和12. 46。FD- CCN 相比于 CNN, 只是将全连接层替换为胶囊层。抗噪性 却有了大幅度的提升。这也说明了使用向量神经元能 提取更多的细节信息, 使其在噪声污染比较严重的信 号中也依然保持较高的识别率。 3. 6载荷改变时的故障诊断性能分析 3. 6. 1载荷变化问题描述 在机械系统中, 当其载荷发生改变时, 转速也会跟 随改变。这会造成传感器所测得的信号会发生改变。 图8 显示了缺陷大小为0. 533 4 mm 在不同载荷下的外 圈故障时域信号。由图 8 可知, 在不同的载荷下的信 号的幅值和相位都会有所差异。深度学习是一种自适 应提取特征的方法, 即通过大量的数据对其进行训练, 使其能够自行提取每种故障类别的相同的特征。当载 荷发生改变时, 同种类型故障相同的特征会变少。这 也导致许多基于深度学习的智能故障诊断系统的诊断 性能降低。 图 8载荷分别为 1 hp, 2 hp, 3 hp 的信号 Fig. 8The signal of the loads were 1 hp, 2 hp and 3 hp respectively 3. 6. 2载荷改变时的故障诊断实验 为了验证模型在载荷变化下的诊断性能, 模型训 练与测试用的数据均为不同载荷下的数据集。例如, 选用载荷为 1 hp 和 3 hp 的数据集来进行训练, 选用 2 hp的数据集来进行测试。为了使模型拥有良好的泛 化性能, 在进行训练时, 对原始数据进行 duopout 操作, 实验结果如图 9 所示。图中的 BC→A 表示使用数据集 B 和数据集 C 来训练, 使用数据集 A 来进行测试。AVG 表示三组实验结果的平均值。 图 9载荷变化情况下的准确率对比 Fig. 9Comparsion of recognition accuracy under load variation 由图 9 可知, 当载荷发生改变时, DNN 的识别准确 率出现严重的下降, 三组实验平均的识别准确率不到 60。这也说明了 DNN 容易过拟合, 导致其识别准确 率下降。CNN 与 FD- CCN, 则依然保持较高的识别率。 但是, 在三组实验中, FD- CCN 的准确率均高于 CNN。 相比于 CNN, FD- CCN 平均提高 1. 48。这也说明了 FD- CCN 拥有更好的泛化性能。 3. 7载荷改变时的抗噪性分析 在实际工业应用中, 轴承的工作条件十分复杂, 轴 承的振动信号也极易同时受到载荷变化和噪声污染的 影响。因此, 为了验证模型在噪声环境下, 且载荷同时 在变化时的诊断性能。在载荷改变时的故障诊断实验 中的测试数据集上添加不同信噪比的噪声。例如, 选 06振 动 与 冲 击2020 年第 39 卷 ChaoXing 用载荷为 1 hp 和 3 hp 的数据集来进行训练, 选用添加 了噪声的 2 hp 的数据集来进行测试。由于 DNN 在变 载时识别率较低, 因此 DNN 不做该实验。CNN 和 FD- CCN 的实验结果如表 4 所示。 从表 4 可知, 在三组实验中, FD- CCN 在载荷改变 以及信号受噪声污染的环境下的识别准确率都优于 CNN。在信噪比为 -4 的测试信号中, CNN 的平均识别 准确率仅为 71. 9, 而 FD- CCN 仍然保持 85. 55的平 表 4变载情况下 CNN 与 FD- CCN 在不同信噪 比测试信号中的准确率 Tab. 4Recognition accuracy of CNN and FD- CCN under different noisy environment and different load MODEL SNR/dB -4-202468 CNNBC→A72.783.792.25 96.3597.497.797.79 AC→B73.759096.45 97.9598.398.398.15 AB→C69.487.895.15 96.0595.596.4596.1 AVG71.987.06 94.61 96.78 97.06 97.48 97.34 FD-CCNBC→A83.85 96.15 98.8599.399.4599.499.5 AC→B85.995.7599.299.799.99100100 AB→C86.992.694.959696.45 96.62 96.63 AVG85.5594.897.67 98.33 98.63 98.67 98.71 均识别准确率, 相比之下提升了 13. 65。这说 CCN 能够提取更细微的细节特征, 因此在载荷发生改变以 及信号受噪声污染时, 拥有更好的泛化性能。 3. 8圆锥滚子轴承故障诊断实验分析 为了验证本文所提出的模型 FD- CCN 在其它类型 轴承应用的可行性, 使用圆锥滚子轴承数据对其进行 验证。数据来源于圆锥滚子轴承实验台架实测数据。 其故障类型如表 5 所示。A 端和 B 端分别表示圆锥滚 子的大端和小端面。图 10 显示了其中的正常、 故障 1 和故障 2 的时域信号。使用重叠采样的方法构建出每 个故障类别样本数为 220 的训练数据集和每个故障类 别样本数为 60 的测试数据集。 图 10正常信号、 故障 1 信号以及故障 2 信号 Fig. 10Normal, fault 1 and fault 2 respectively 表 5圆锥滚子轴承故障类型 Tab. 5Fault type of tapered roller bearing 故障类别正常故障 1故障 2故障 3故障 4故障 5故障 6故障 7 轴承原始故障 无 A 端、 B 端大 端面划伤 B 端大端 面划伤 A 端内滚 道划伤 无 A 端大端 面划伤 A 端大端 面划伤 A 端滚柱 压痕 轴承人工故障 无 外圈内表明 故障 保持架故障滚柱故障 外表面、 保持 架、 滚柱故障 外表面、 保持 架故障 外表面、 滚柱 故障 保持架、 滚柱 故障 训练数据220220220220220220220220 测试数据6060606060606060 利用本文提出的 FD- CCN 对圆锥滚子轴承数据集 进行实验。由于只有七类故障和一类正常的信号, 故 将模型的输出由十类改为八类。此外, 将学习率设置 为 0. 000 1, 迭代次数改为 10 000 次。除此之外, 其它 参数与“3. 2” 节所设置参数一致。试验结果如表 6 所示。 表 6不同算法的诊断结果对比 Tab. 6The diagnostic results os different algorithms were compared 正常 故障 1 故障 2 故障 3 故障 4 故障 5 故障 6 故障 7 综合识 别率 DNN53.33 98.33 26.67 28.33956.6710091.6762.5 CNN10096.6710098.33 98.3310096.6710098.75 FD-CCN 100100100100100100100100100 由表 6 可知, FD- CCN 的综合识别率相比 CNN 提 升了1. 25, 相比 DNN 提升了37. 5。这说明了卷积 胶囊网络相比于传统的卷积神经网络和深度神经网络 拥有更好的通用性。通过该实验, 验证了本文所提出 的故障诊断方法在其它类型轴承的可行性。 4结论 本文提出一种基于卷积网络和胶囊网络的新型轴 承故障诊断模型。该模型直接使用一维的时域信号作 为的输入, 通过大量的数据进行学习, 该模型能够自适 应的提取轴承的故障特征, 而无需对原始数据进行手 工特征提取; 此外, 该模型也无需对输入数据进行任何 预处理操作。实验结果表明, 相比于传统卷积神经网 络和深度神经网络, 该模型在噪声环境下、 载荷变化情 况下以及噪声污染与载荷变化同时存在的情况下, 仍 然拥有良好的故障诊断性能。相比于其它深度学习模 16第 4 期杨平等基于卷积胶囊网络的滚动轴承故障诊断研究 ChaoXing 型, 该模型结构简单, 虽然只有两个卷积层和一个胶囊 层, 但其表达能力依然较强。且模型参数较少, 易于设 计和训练。 参 考 文 献 [1] LI S, LIUG, TANGX, etal.Anensembledeep convolutional neuralnetworkmodelwithimprovedD- S evidence fusion for bearing fault diagnosis[J] .Sensors, 2017, 17 8 1729 -1750. [2] LU C,WANG Z Y,QIN W L,et al. Fault diagnosis of rotary machinerycomponentsusingastackeddenoising autoencoder- based health state identification [J] .Signal Processing, 2017, 130 Sup 1 377 -388. [3] MOHANTY S,GUPTA K K,RAJU K S,et al.Vibro acoustic signal analysis in fault finding of bearing using empirical mode decomposition[C]/ /International Conference on Advanced Electronic Systems. PilaniIEEE, 2013. [4] 马风雷, 陈小帅, 周小龙. 改进希尔伯特 - 黄变换的滚动 轴承故障诊断[ J] . 机械设计与制造, 2018 5 75 -78. MA Fenglei,CHEN Xiaoshuai,ZHOU Xiaolong.Rolling bearing fault diagnosis based on improved hilbert- huang trans[ J] . Machinery Design & Manufacture,2018 5 75 -78. [5] WANG L N,WANG H B,CAI Y H,et al. Fault diagnosis system of rolling bearing based on wavelet analysis[J] . Applied Mechanics & Material
展开阅读全文

资源标签

最新标签

长按识别或保存二维码,关注学链未来公众号

copyright@ 2019-2020“矿业文库”网

矿业文库合伙人QQ群 30735420