基于KD-DenseNet的旋转机械故障诊断模型_王太勇.pdf

返回 相似 举报
基于KD-DenseNet的旋转机械故障诊断模型_王太勇.pdf_第1页
第1页 / 共8页
基于KD-DenseNet的旋转机械故障诊断模型_王太勇.pdf_第2页
第2页 / 共8页
基于KD-DenseNet的旋转机械故障诊断模型_王太勇.pdf_第3页
第3页 / 共8页
基于KD-DenseNet的旋转机械故障诊断模型_王太勇.pdf_第4页
第4页 / 共8页
基于KD-DenseNet的旋转机械故障诊断模型_王太勇.pdf_第5页
第5页 / 共8页
点击查看更多>>
资源描述:
振动与冲击 第 卷第 期 基金项目 中国兵器工业集团公司基础性创新团队项目 收稿日期 修改稿收到日期 第一作者 王太勇 男教授博士生导师 年生 通信作者 王鹏 男博士助理教授 年生 基于 的旋转机械故障诊断模型 王太勇 宫立明 王鹏 乔卉卉 任栋 天津大学机械工程学院天津 摘要针对传统旋转机械故障诊断算法在复杂多变的工况下缺乏良好的自适应与泛化性的问题提出了基于 的卷积核 智能故障诊断模型 将各类故障状态的原始振动信号进行重叠分段预处 理并将预处理得到的数据作为 的输入进行训练使用训练得到的模型对不同工况下的振动信号进行自适 应特征提取与分类并将 应用于卷积核中以提高模型对振动信号的处理速度及抗干扰性最终得到故障类型判定 结果 的应用避免了梯度弥散现象提高了有效特征的提取效率解决了传统特征提取方法中无法有效挖 掘特征无法自适应于任务进行调整等问题 关键词故障诊断滚动轴承变工况深度学习卷积核 中图分类号 文献标志码 滚动轴承作为旋转机械设备的重要组成部分在 国民经济各个行业中有着广泛的应用对滚动轴承故 障进行及时有效的诊断意义重大轴承故障诊断的 常见方法是在旋转机械运行时对不同工况下传感器 采集到的振动信号进行实时监测并采用智能故障诊 断方法对其故障类型进行识别通常采集得到的 振动信号由设备正常工作产生的振动故障特征振动 以及噪声组成因此对故障信号进行特征提取是轴承 故障诊断中的重点问题也是影响故障诊断结果的关 键因素特征提取的常用方法包括频域统计分析 小波变换傅里叶频谱分析在对特征进行有效 提取之后要进行特征选择主要目的是对信号中的无 用及不敏感信息进行筛选进一步缩减有效特征的数 量常采用的方法有主成分分析 独 立 分 量 分 析 等方法随着上述过程的 进行有效特征从原始信号中逐渐被提取出来最后将 提取到的特征作为分类器的输入训练分类器实现网 络对轴承故障类型的识别支持向量机 决策树 以 及多层感知机 因其具 有良好的鲁棒性常被作为故障诊断网络的分类器近 年来上述方法在智能故障诊断领域已经取得了一定 的成果但仍受制于特征提取质量的影响存在一些不 可忽视的弊端 环境的多变性使得工作负载不恒定 ChaoXing 在某一负载下提取到的特征应用于不同负载时将导 致诊断精度产生偏差大大降低了传统故障诊断模型 的泛化性能 为了提取到与故障具有强相关性的特 征当对噪声和工况不敏感的故障特征进行提取时需 要依赖专家知识与人工经验 由于有效特征在信号 预处理与特征提取两个过程之间具有一定的关联性 如果将故障诊断各个阶段孤立进行势必造成一部分 故障信息的损失因此将预处理特征提取和故障分 类归一到一个构架下实现端到端的故障诊断方式逐 渐成为研究热点 深度学习是近几年人工智能领域的研究热点其 中深度卷积模型 作为深度学习的主要模型之一具有较强的数 据信息挖掘能力在旋转机械故障信号的特征提取 方面摆脱了对人工特征提取和专家知识的依赖具有 较大的应用潜力与研究前景然而经典深度卷积模型 针对图像识别问题设计而来将其应用于旋转机械的 故障诊断则需要进一步的模型改进文献提出了 一种针对多传感器时间序列的深度学习故障监测框 架通过对不同时刻原始序列的空间相关性进行合理 的利用改善了低故障识别率问题为了提高故障识 别的鲁棒性文献先对原始振动信号进行短时 傅里叶变换将得到的频域信号输入到卷积神经网 络实现对不同故障类型的分类以上深度卷积模 型性能与传统故障诊断模型相比均有较大的提升 但是此类模型仍存在不足模型故障识别率仍存 在较大的提升空间如果外界环境存在较大噪声 干扰将影响模型对特征的自适应提取效果为了 提取到更多的有效特征不得不增加模型的网络深 度当网络深度加深时意味着更大的参数空间一 方面使优化模型的难度增加另一方面容易产生梯 度弥散现象 针对上述问题本文提出一种基于自适应 的轴承故障诊断模型利 用密集连接的方式构建层数更深的网络加强了特征 的传播提高了特征的复用减少了模型的参数实现 了以原始时域信号为输入以轴承故障诊断结果为输 出的端到端的故障诊断深度卷积模型 一维深度卷积神经网络模型 典型的深度卷积神经网络常由多个阶段组成对 于其中的每个阶段包括两个层分别是卷积层和池化 层卷积层可以根据样本数据的复杂性合理增加或减 少而最后一个阶段又由全连接层和分类模型构成 在卷积层中使用多个卷积核完成卷积操作加上偏置 后再通过激活函数得到一系列特征输出卷积过程的 数学表达式如所示 式中 为第 层卷积后得到的第个数据点 为卷 积区域 为卷积区域的元素 为对应卷积核的 权重 为偏置项 为激活函数常用的激活函 数是 池化层通常在卷积层之后对卷积层输出的特征 在不重叠大小的 区域进行池化操作主流方法是 保留每个区域内数据点的平均值或者最大值目的是 降低因卷积操作过程而产生的高分辨率在保持特征 尺度不变性的前提下对空间进行降维并且在一定程 度上控制了过拟合在多个卷积层和池化层之后使 用类似于传统多层神经网络的全连接网络将特征展平 成一维向量然后将展平后的一维向量作为分类器模 型的输入本模型采用 分类器完成分类假设 处理的是分类问题则 全连接层的计算公 式为                           式中 为全连接最终的输出结果 与 分别为模 型的待求参数权值矩阵与偏置值 为条件概率 函数 为自然指数函数 基于 回归模型选择最大似然函数作为模 型的损失函数其数学表达式为 [] 式中 为模型的损失函数 为最后的类型数 量 与 分别为模型的待求参数权值矩阵与偏置 值 为事件函数当事件为真则输出为否则输 出 为自然指数函数 由于经典深度卷积模型针对图像识别问题设计而 来对于轴承振动信号的处理则不能完全的匹配与适 振 动 与 冲 击年第卷 ChaoXing 应轴承振动信号和图片维度不同所以本文将一维信 号作为输入所采用的卷积核是一维特征矢量所有卷 积层与池化层的输出特征图也是一维结构 轴承故障诊断模型 深度卷积模型 在深度卷积神经网络中为了对特征进行有效提 取难以避免需要增加网络深度但是随着网络深度的 增加梯度消失或者爆炸现象愈加明显这是一个亟待 解决的问题 网络直接将各个层相连接使 网络的每层输出都作为后层的输入以保证层级间最 大程度的特征重用在加深网络的同时促进特征之间 的相互融合很好的缓解了增加深度卷积模型深度而 产生的梯度弥散现象 密集连接块 作为 的基 本组成单元其结构如图所示在传统深度卷积神经 网络中层数与连接数相等但是在 中当 的层数为时层间的连接数多达 由于 层可以是修正线性单元 卷 积 池化 等操作的组合使得每一 层的输入来自前面所有层的输出即满足式 式中 为网络的输入 为网络中第层的输出 为网络第 层的输入 为作用于第 层的 非线性变换操作 表示归并第 层 输出特征图的通道这样的连接方式加强了特征的传 递改善了网络的信息流削弱了梯度弥散现象 图 结构 样本数据通过密集连接块后输出维度增加在做 归并后的输入通道数急剧增大因此在每个密集连接 块之后加入传导块层 连接传导 块层既可以将各个通道的特征进行融合又减少了网 络训练的负担较小的卷积核可以在对特征进行有效 提取同时减少连接权重的数量因此在本文模型中选 择卷积核大小为 池化方式为平均池化 为避免网络参数数量输出维度对特征提取效率 的影响保证模型每一层的输出不会产生信息损失模 型输入一维原始振动信号张量先后经过一维卷积 标准化处理 以及最大池化 逐层提取高维特征在经 过每一个密集块输出后特征图的张量不变维度增大 的轴承故障诊断模型 本文采用一种简单的有重叠样本预处理方法实现 样本量的扩充目的是在提高参与模型训练样本数量 的前提下尽可能多的保留相邻元素之间的相关性使 模型尽可能多的提取到更具有鲁棒性的特征用于识 别具体的扩充方法如图所示例如原始振动信号 有 个采样点使用的分割长度为每个数据 样本保留 个采样点的时候输入模型的样本最大 量为 图样本重叠扩充示意图 基于 的轴承故障诊断模型如图所 示当轴承正常工作时将加速度传感器安装在带有 图基于 的轴承故障诊断模型 第期王太勇等基于 的旋转机械故障诊断模型 ChaoXing 磁力基座的机架上收集驱动端轴承的振动信号轴承 故障采样频率为 首先将采集到的数据进行有 重叠样本预处理随后选择一维卷积核进行卷积操 作并将 作用在卷积核上提出了卷积核 的方法在每次卷积过程中使卷积核中的 部分数据点随机失活使剩下的数据点进行卷积操 作增强了模型的鲁棒性与抗噪性提高了模型的泛 化能力并且可以起到防止过拟合的目的在实验 中采用变化的 率且 率满足 的均 匀分布即满足公式 将输出特征图进行一维卷积以及归一化后作为 网络的输入经过个 以及个 后输出维度为再经过全连接 层输出轴承的故障类型 实验验证 实验数据 为了检验所提出 故障诊断模型的有 效性采用美国凯斯西储大学电气工程实验中心的振 动数据作为实验数据集实验台设置如图所示 由 的电动机左侧和功率计右侧组成待 检测的轴承包括驱动端和风扇端两种支撑着电动机 的转轴将加速度传感器安装在两种轴承端用于采 集轴承的故障信号采样频率为 该实验台模 拟了轴承的内圈外圈以及滚动体三种类型的故障每 种类型故障有三种不同的损伤尺寸作为不同程度的故 障分别为 和 分别在四 种不同负载负载 负载 负载 负载 采集轴承振动信号用于实验 图轴承故障数据采集实验台 实验分别采用和 两种负载下的七种 轴承状态数据集作为模型验证样本每种状态含有 个数据点使用包含个点的窗口对原始信 号进行有重叠预处理分割每种轴承状态得到个 样本为了证明模型在特征提取方面的优越性每种 状态随机选择作为训练集其余作为测试 集验证模型识别的准确性实验样本详细信息及故 障种类如表所示 表实验数据样本 样本 电机 负载 样本 长度 样本 数量 故障 位置 故障 尺寸 标签 滚珠 滚珠 内圈 内圈 外圈 外圈 正常 滚珠 滚珠 内圈 内圈 外圈 外圈 正常 基于变参数 的模型训练 由于本文所提出的 算法属于深层卷 积神经网络模型为了保证模型具有最优参数解需要 进行实验确定适用于轴承故障诊断的密集连接块数 量首先在数据集中随机选择数据样本作为训 练集进行模型训练并将数据集中其余的数据 样本用于测试将每个密集块中的一个 卷积和 卷积作为一个层级实验采用 处理 器 内存运行环境为位 操作系统下 搭建的 深度学习框架每次迭代次数为输 出为模型的故障识别准确率结果如图 所示为 了证明上述实验所确定的模型参数在变工况下仍然 符合最优解将数据集中的所有数据作为训练集进 行模型的训练将数据集作为测试集重复上述实 验得到变工况下的准确度如图所示 从图中的两种情况可知当密集块数量固定时 随着层级数的增加准确率的波动变大曲线的平稳性 降低并且当密集连接块数量大于的时候波动程度 愈发加大当密集连接块数量增加为时在每一 种层级数量下的准确度都呈现最高状态说明当密 集连接块的数量为时模型具有较好的特征提取 能力经过大量实验尝试选择含有个密集连接 块和个传导块且密集连接块的层级数分别为 的模型作为故障监测模型具体的网络参数 如表所示 振 动 与 冲 击年第卷 ChaoXing 图不同密集块配置方式下准确度的比较 表 网络结构参数 网络层名称具体操作输出大小 初始化层 卷积步长 最大池化步长 密集连接块 卷积 卷积 传导块层 卷积步长 平均池化步长 密集连接块 卷积 卷积 传导块层 卷积步长 平均池化步长 密集连接块 卷积 卷积 传导块层 卷积步长 平均池化步长 密集连接块 卷积 卷积 分类层 全局平均池化 实验结果 确定了输入以及 模型的网络结构之 后分别使用不同的测试集设计了两种试验 验证本 文的网络结构在恒定负载下具有较高的故障识别效 果各选择数据集中的数据作为训练集和测试 集得出故障识别准确度曲线当迭代次数达到次 之后准确度趋于平稳其准确度最高可达到充 分说明了本文所提出的故障诊断模型能够有效的识别 轴承故障完成轴承故障的智能诊断如图所示 验证本文的网络结构在变负载下仍具有较高的故障 识别精度选择数据集中的所有样本作为训练集 将数据集作为测试集得到变负载故障识别准确度 曲线通过图可知对于变负载的情况本文所提出 的故障诊断模型的准确度仍可以达到 充分说 明了本文模型具有较好的抗干扰性与鲁棒性 图不同负载下故障识别结果 为了探究本文所提出的卷积核 方法对诊 断模型故障识别效果的促进作用本文设计四种如表 所示的对比试验其中 代表对卷积核进 行 方法的模型 代表将预处理后的样 本直接输入网络的模型当训练集与测试集都选择 时在数据集中随机选择用于训练其余用于预 测当训练集选择 测试集选择时为了保证数据 样本总量保持不变分别在数据集 中各随机选择 用于训练与预测迭代次数全部设置为得到 结果见表将表前两组实验对比可知在对预处理 后的数据进行卷积的过程中对卷积核进行 操 作可以大大缩短模型的训练时间说明将 应 用于卷积核中可以有效提高模型对振动信号的处理速 度将第第组实验进行对比虽然改变负载前后 训练时间增加了 但是同时分析第第组实验可 知对于实验整体而言时间差别不大说明将 应 用于卷积核中可以使模型具有较好的鲁棒性 表输入数据格式 模型迭代次数测试集训练集训练时间 为了证明卷积核 方法在兼具上述优势外 对有效特征仍可以保持较高的特征提取能力在表 中的条件下进行实验实验结果如图所示图中的虚 线为每种情况准确度的平均值对比次实验结果 可知当对卷积核进行 后在恒负载与变负载 第期王太勇等基于 的旋转机械故障诊断模型 ChaoXing 两种情况下本文的智能故障诊断模型均可以达到 的故障识别准确度进一步说明了卷积核 在对 有效特征提取方面具有促进效果 图使用不同方法的模型性能对比 为进一步验证本文所提出的智能故障诊断算法自 适应提取特征的能力采用 方法对自适应提取的 特征原始输入数据进行分析 是对多维数据主 要能量集中分量进行分析的一种方法常用来对多分类数 据的离散度进行分析并以此来判断数据的分类识别能 力本文利用 的特点选择并提取数据的前两维主 分量作为数据的代表分量对本文所提出的 算法各个密集连接块的输出特征进行数据离散度分析七 种不同的故障特征分别用七种不同的形状表示如图 所示随着网络结构的加深各类不同类型的故障特征变 得越来越分散从图 可知七种故障的原始特征全 部混合在一起难以分辨其中由于算法自身结构的原因 致使每个密集连接块输出后的特征具有极其高的维度导 致部分特征弥散于整个坐标空间从图可知随后 密集连接块使种特征变化趋势全部趋于分散但 是观察发现此时其中的五种特征仍然混在一起难以 分辨从图 图可知随着特征从密集连接 块和的依次输出各种特征变得越来越分散并逐 渐向着个簇类发展最后密集连接块将七种故 障特征最终分成簇有效的完成了故障分类任务 图特征可视化结果 对比分析 为进一步说明本文 模型在轴承故障诊 断中的优势本文采用多种故障诊断模型对其进行对比 分析本次实验均采用表中的数据为减少随机因素的 影响实验中各种方法均重复次图分别是 和 等五种轴承故障诊断模 型在相同负载见图 与不同负载见图两种 情况下的故障分类准确度其中横轴中的前 为次 独立试验最后的值为前次实验的平均值从图 中结果可知基于浅层神经网络模型 和 在故 障识别率上相比于深层卷积神经网络模型 以 及 等三种算法结构存在明显差距从图 可知特别的当负载发生变化时上述深层与浅层两 类故障识别模型之间的识别率差别显著增大并且可以 明显看出本文所提出的 模型故障识别准 确率可以达到 当负载变化时仍具有 的识别精度高于其他算法模型的故障识别精度充分说 明了本文的算法模型具有较好的自适应性与鲁棒性 振 动 与 冲 击年第卷 ChaoXing 图不同方法轴承故障诊断结果 结论 针对变工况下旋转机械故障诊断问题提出了一种 基于一维 深度卷积神经网络的智能故障诊 断模型并利用该模型对轴承进行健康状态评估实验通 过与典型故障诊断方法进行对比验证了 模型在诊断精度和诊断鲁棒性方面优越性结果表明 所提出故障诊断模型具备较强的特征学习能 力不需要人工特征提取直接将原始振动数据作为网 络输入在网络的输出端即为故障的识别结果大大降 低了人工特征提取所来的误差 所提出的 方法在保证高故障 识别精度的前提下可以明显提高网络对原始数据的 处理速度及抗干扰性使模型在识别精度和诊断鲁棒 性方面兼具较好的表现 所提出的算法具有良好的鲁棒性和泛化性 能当负载发生变化时仍然可以保持较高的故障识别 准确率可以将其推广到复杂环境的工程中 加以应用 综上所述本文所提出的 故障诊断 模型在满足对旋转机械故障特征进行有效提取的同 时兼具较高的诊断精度和较好的诊断鲁棒性可满足 旋转机械在复杂多变工况下的故障诊断需求但是本 文所提出的算法仍然存在不足由于算法属于深层卷 积神经网络导致训练时间较长模型的内部参数需要 进行大量尝试才可达到最优在以后的研究中将进一 步对自适应参数匹配问题进行研究 参 考 文 献 下转第页 第期王太勇等基于 的旋转机械故障诊断模型 ChaoXing
展开阅读全文

资源标签

最新标签

长按识别或保存二维码,关注学链未来公众号

copyright@ 2019-2020“矿业文库”网

矿业文库合伙人QQ群 30735420