基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法_叶壮.pdf

返回 相似 举报
基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法_叶壮.pdf_第1页
第1页 / 共12页
基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法_叶壮.pdf_第2页
第2页 / 共12页
基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法_叶壮.pdf_第3页
第3页 / 共12页
基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法_叶壮.pdf_第4页
第4页 / 共12页
基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法_叶壮.pdf_第5页
第5页 / 共12页
点击查看更多>>
资源描述:
振动与冲击 第 卷第 期 基金项目 国家自然科学基金上海科委科技创新行动计 划高新技术领域项目中央高校基本业务经费项目 收稿日期 修改稿收到日期 第一作者 叶壮 男博士生 年生 通信作者 余建波 男博士教授 年生 基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法 叶壮 余建波 同济大学机械与能源工程学院上海 摘要为了解决单通道图像信号输入不能全面表达故障特征的问题提出基于多通道一维卷积神经网络 的故障特征学习方法利用经验模态分解 方法对信号进行处理得到多通道一维信号构建 模型对多通道一维信号进行特 征提取在 的全连接层后接堆叠降噪自编码器 层进一步进行维度缩 减和特征提取并实现特征分类通过某型号齿轮箱故障诊断实验对所提方法进行验证实验结果表明所提方法的特征 提取能力和故障诊断效果显著优于典型的深度学习方法和机器学习分类器 关键词齿轮箱故障诊断多通道信号卷积神经网络堆叠降噪自编码器特征学习 中图分类号 文献标志码 行星齿轮箱作为机械传动系统的核心部件被广 泛的应用于各种机械设备由于齿轮箱的工作环境 通常较为复杂长时间的运转加上温度润滑等各种 因素的影响齿轮箱齿轮极易发生点蚀断齿磨损故 障齿轮箱轴承部分容易发生磨损压弯等故障如果 不能及时发现异常长时间的运转会造成损伤或者异 常逐渐积累造成不可挽回的后果因此要对齿轮箱 状态进行实时监测准确判断故障类型及位置及时对 其进行维护从而达到最小化期望损失的目的 在齿轮箱故障诊断中一般包括信号收集与处理 特征提取和故障诊断三部分振动信号包含齿轮箱各 部件运行状况的丰富特征常常被使用作为各种故障 诊断模型的输入信息常见的信号处理方法有短时 傅里叶变换小波变换 和经验模态 分解 等方法例 如李恒等利用短时傅里叶变换将一维振动信号转化 为二维信号随后输入到分类器实现了轴承故障诊断 等利用 对齿轮箱非平稳振动信号进行转 化获得平稳子信号进行齿轮箱故障诊断即使工作环 境变化仍有着不错的识别效果 深度学习 是近年发展起来的热点 方向是机器学习领域中的重要分支其中深度神经 网络 通过深度的网络结 构与各种非线性转换可以有效地提取数据深层次的 特征信息具有很强的数据表达能力 卷积神经 网络 堆叠降噪 自编码器 和 深度信念网络 作为深度 神经网络的代表在特征提取和识别方面发挥了巨大 的作用它们克服了需要人为选择数据特征的缺点 使机械设备的诊断过程更加智能化陈保家等利用 强大的特征提取能力和其强大的复杂映射表征能 力对故障信号进行故障判别 是典型的深度神 经网络其强大的特征提取能力使得其在图像识别领 域有着广泛地应用一些学者已经将 应用到故障 诊断中 等利用小波变换将振动信号转换 为包含时频信息的二维信号然后将其输入到 中 进行故障诊断研究 等开发了 用来自动 提取信号的故障特征然而上述文献用二维 对 故障信号进行处理没有最大化发挥 在处理原始 振动信号的优势近段时间已有学者成功将一维卷 积神经网络 运用到故障诊断中周奇才等提出 模型使用一维卷积池化层对一维时域信号进 行处理很好地解决了轴承和齿轮箱状态监测的问题 等使用 模型对固定轴齿轮箱和行星齿 轮箱的故障诊断问题进行了研究证明了其具有较强 的特征提取能力和分类能力但是上述方法中使用 单通道信号输入 进行故障诊断的方法没有充分 发挥 提取振动信号特征的能力无法充分地挖掘 设备故障特征信息 基于以上分析多通道信号的输入可以更加全面 的收集故障特征信息同时 在识别 图像领域 取得了很大的成功受到其在处理 图像的启 发本文将多通道 引入到齿轮箱故障诊断中 方法可以将原始信号分解为多个固有模态函数信 号 从而获得更多的故障 特征因此本文将 方法作为原始信号的预处理 器在 方法处理后利用峭度最大化原则筛选 出故障信息明显的 形成多通道信号之后构建多 通道 进 行多通道信号特征融合提取实现了 与 的有效集成 本文提出了一种新的深度神经网络模型 并提出了基于 的齿轮箱故障诊断 方法本文主要贡献点如下 基于 对振动信号的有效分解 使用多通道一维信号输入直接将原始信号作 为输入进行故障特征提取与诊断泛化能力更强识别 准确率更高 多通道输入融合特征比单通道输入的特征更 加全面一维卷积核学习到的特征比全连接层学习的 特征更加抽象可以充分挖掘数据隐含特征 进一步内嵌 可有效过滤特征 集的噪音及缩减其维度提高识别器的故障诊断性能 理论背景 经验模态分解 作为一种时频分析方法可以对收集到的 时变非平稳信号进行自适应分解得到若干线性平稳 信号即 假设待分解信号为 具体的算法 流程如下 步骤利用三次样条拟合函数将所有极大值和极小 值拟合计算得到上包络线 和下包络线 步骤用 减去上下包络线的均值 得到 记为原始信号 的一个分量 步骤判断 是否满足 的两个条件若满 足则将 记为 作为第一个 若不满足则 将 作为待处理信号重复上述步骤假设直至第 次满足条件得到 步骤从 中减去 得到残余分量 将 重复步骤步骤并将得到的新残余分量继续 进行上述步骤的筛选直至满足停止条件后停止筛选 至此得到一系列 记为 最后剩余的一个残余分量为一个单调函数 因此本文中提到的多通道信号并不是传统意义 上的多传感信号而是把 分解得到的多个 当 作多通道信号 一维卷积神经网络 最早被应用于图像识别技术它是受猫科 视觉系统神经机制启发提出的一种生物物理模型 的局部连接权值共享和降采样等特性不仅使得 网络结构的规模大大减小而且可以充分利用数据本 身的局部特征提高运算效率 典型的 包括卷积层池化层全连接层和输 出层 与 主要区别在于特征图的维度 是一维所以其由一维卷积层一维池化层全连接层 和分类器构成其网络结构图如图所示 一维卷积层假设一维信号 为第层某一特征 图的输出其卷积的计算方式为 振 动 与 冲 击年第卷 图 的网络结构 式中 为 层第个输出 为 层第个卷 积区域 为其中的元素 为对应的卷积核 为第 层的偏移向量 为第层卷积层的激 活函数 一维池化层一般采用最大池化方法采样函数为 式中 为第 个特征图 中第个单元所对应的采 样数值 为卷积层中第个卷积特征图的第 个单元的数值 为相邻采样窗口重叠部 分的大小 全连接层将之前卷积和池化层提取的特征重新 排成一列其输出为 式中 为第个输出共有个输出 和分别为第 个神经元的权值和阈值 为激 活函数 分类器层通过 分类器可以直接完成多 分类任务 式中 为每一个输出的概率所有的 之和为 为多分类问题的类别数 的输出可以看作 是一个概率问题 在 训练过程中过拟合是一个不容忽视的问 题其主要有数据和模型两方面原因在样本数据方 面样本数量较少标签混乱和样本噪声干扰大等会造 成过拟合在模型方面模型参数较多模型复杂度太 大等会导致过拟合常见的抑制过拟合方法主要有 增大数据集规模正则化和 方法等本 文为抑制过拟合在全连接层采用 是指在训练过程中以一定的概率随机将部分神经 元置为如图所示带有叉号的神经元表示在 本次训练中被置为不参与本次训练可以看到 使用 后网络规模和训练代价降低有效地 抑制了过拟合 图采用 的网络模型 堆叠降噪自编码器 降噪自编码器 由编 码器和解码器两部分组成假设一组输入数据为 其中 加入随机噪声后 得到 经过编码器隐含 层的映射数据为 经过解码器输出层的映射数据为 式中 为隐含层和解码层的激活函数本 文采用的激活函数为 函数 为编码 部分和解码部分的权值参数 通过最小化输入 与输出之间的重构误差进行训练前向传播的损失 函数为 为了增强对信号的重构能力将多个降噪自编码 器层层堆叠起来前一层的输出作为后一层的输入进 行信号特征的逐层提取这样就构成了 其网 络结构图如图所示 图 网络结构图 多通道一维卷积神经网络 网络结构 可用于多通道信号的融合与处理经 分解得到的三通道信号在经过 后可 以实现滤噪与特征提取如图所示基于 的故障诊断模型由多通道输入层一维卷积层 一维池化层全连接层和 层构成 第期叶壮等基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法 图基于 的故障诊断模型 多通道输入层多通道输入是基于人工设定的样 本特征将不同的有代表性的提取样本输入到特征图 的多个通道使得融合后的特征图可以充分体现图像 的有效信息本文采用的是三通道输入输入信号为 的三通道一维信号为了更加直观地展示 三通道信号与单通道信号的不同将各通道信号映射 到同一幅图中如图所示可以看到三通道信号融 合了各通道的频率和幅值等信息突出了多通道信号 输入的特点经过 分解后的前三个 分量其 包含了原始信号不同频率段的缺陷成分且其频率大 小从前至后依次降低待输入 各通道中 针对各通道特点进行单独卷积计算随后进行加和得 到各通道融合结果由此可见 较单通道 而言可以 更加全面挖掘振动信号的故障特征信息 图多通道信号融合 一维卷积层第一层卷积层有个大小为 的卷积核第二层卷积层有个大小为 的卷积 核第三层卷积层有个大小为 的卷积核第四 层卷积层有个大小为 的卷积核 的卷积操作如图所示 图多通道卷积操作 卷积层的输入特征图为多通道信号与之对应的 是多通道卷积核在各通道分别进行一维卷积操作 为了将各自独立的信号联通在一起达到信号融合的 目的将各通道在同一位置上的结果求和得到该位置 的一维卷积输出 式中 为第 层卷积层的输出 为通道第 层卷积层第个特征输入共有个特征输入 为通 道第 层的卷积核 为通道第 层的偏移 向量 为通道 第 层卷积层的激活函数 为通道数卷积层有效地实现了多通道信号的融合与 关键特征提取 一维池化层在每一层卷积层后面跟随池化层对 获得的特征图进行降采样操作 振 动 与 冲 击年第卷 式中 为池化带宽 为输入 为输出 代表 的第个元素在这 里我们使用最大池化所以 全连接层与后面 分类器组合完成 预训练和进行特征提取其操作过程如式 和式所示 层经过 提取的特征仍然存在 特征纬度高及噪音干扰的问题而 可以进一步 消除信号中的噪声干扰获得较高的鲁棒性所以在全 连接层之后嵌入 层进行特征降维和进一步特征 提取 包含编码和解码部分其运算过程如式 式所示最后接 分类器进行特征 分类 模型训练 模型的训练包括两部分 训练和 训练本节涉及到三个损失函数包括 的 损失函数 的前向传播损失函数以及反向微 调损失函数 接下来将分别从 和 的损失函数出发逐层推导出其参数 更新过程 训练分类器损失函数通过 的 输出向量与样本的实际标签做交叉熵计算得到的其 损失函数的计算公式如下 式中 为实际标签中第个值 为 输出向量 中第个值 全连接层中其基本结构和典型的神经网络相似 其第层的误差 为 式中 为第 层的权值函数 为第 层 的误差 为层输入的激活函数的导数 在池化层的反向传播过程中需要从缩小区域中 反向推导出上一层的误差 { 其它 { 卷积层的反向传播中需要对下一层的权重矩阵 翻转 所以其权重和阈值的梯度为 式中 为第层的输入 为第层第个输入与第 个内核的误差之间的卷积 在反向传播阶段使用 算法对参数进行优 化梯度下降的迭代更新参数如下 式中 为迭代第 次第层的第个神经元与上 一层第个神经元之间的权重 为第 层第个神 经元的阈值 为学习率 训练 的训练包括前向无监督训练和 反向微调操作前向无监督训练是使用无标签数据对 的参数进行调整反向微调是使用有标签的数据 对整个网络结构进行微调 前向无监督训练在进行前向无监督训练时其损 失函数的表达式如式所示 反向微调在经过无监督训练后学习到的网络参 数作为有监督训练网络的初始化参数使用有标签的 数据输入利用 分类器层逐步向前层微调网络 参数将使用反向传播算法对网络进行微调利用梯 度下降法进行权重更新 输出层 的每个神经元 的残差公式为 隐含层 的每个神经元 的残差公式为 式中 为第层的第个神经元 和第 层第个神经元 为神经元的平均激活值 为第 层第个神经元的输出 在进行反向微调时使用最小均方误差 作为损失函数将其对和求偏导 利用梯度下降对参数进行更新 第期叶壮等基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法 整体模型的训练和测试过程如表所示 表故障诊断模型训练过程 输入训练集 训练标签 步骤 训练 设置网络的各层节点和学习率等超参数 随机初始化网络的所有的权重向量和阈值 训练次数 输入 计算卷积层池化层全连接层输出层的特征输出 计算误差梯度 根据式更新每一层的权重和阈值 步骤 训练 无监督训练 设置网络的隐含层神经元数学习率等超参数 随机初始化网络所有的权重向量和阈值 训练次数 输入全连接层提取特征 计算编码部分和解码部分输出 计算误差梯度 更新每一层的权重和阈值 微调 加入 分类器 将无监督学习到的超参数作为初始参数 训练次数 输入有标签数据 计算各层输出 计算误差梯度 根据式更新每一层的权重和阈值 输出故障诊断模型 基于 故障诊断模型 本文提出的基于 的齿轮箱故障诊断模 型如图所示整个实验包括离线训练和在线检测两 部分离线训练时利用有标签的数据训练故障诊断 模型在线检测时利用 对输入数据进行 分类 图基于 的齿轮箱故障诊断模型 实验与结果分析 为了验证 的有效性使用从行星齿轮 箱实验台采集到的振动信号进行故障诊断实验台如 图所示实验装置包括行星齿轮箱含一个齿太 阳轮齿行星轮驱动电机磁力制动器振动信号 由安装在变速箱外壳上的加速度传感器收集采样频 率为 图行星齿轮箱实验台 齿轮箱的健康状况包括齿轮故障和轴承损伤共 计种分别为正常四种不同程度的磨损断齿保 持架缺陷点蚀故障内圈故障滚动体故障外圈故 障带有不同缺陷的齿轮和轴承如图所示实验采 集到的振动信号每类有 个数据点以 个点作为输入样本每一种类型振动信号的波形如图 所示 图不同缺陷的轴承和齿轮 图种健康状态的振动信号 振 动 与 冲 击年第卷 数据预处理 利用 处理信号每条采样数据均可分解得到 个 子信号且每一组分解得到 分量对应着 齿轮箱健康状态的一个类第种故障类型某段信号 分解得到的个 如图所示 图 图 各 子信号携带冲击信号强弱不同需对其选 择峭度是对振动冲击特性的反映因此本文将峭度 作为子信号筛选标准统计各 子信号的峭度值求 均值结果如图所示可以发现前三个 峭度显 著大于其他 因此选择前三个 构建数据集 作为三通道信号输入到 中以训练集为 例数据集的规模为 其中包括种 类别的数据每一类各有个数据其信息与结构分 别如表和图所示 图 峭度图 表数据集描述 类别齿轮箱状况转速 训练集测试集 正常 齿牙磨损 齿牙磨损 齿牙磨损 齿牙磨损 齿牙磨损 齿牙点蚀 齿牙断裂 轴承内圈缺陷 轴承球缺陷 轴承保持架缺陷 图训练集数据结构图 实验部分 的网络结构参数设定如表所示第 一层卷积层采用较宽的卷积核 而其余层采用 较短的卷积核 较宽的卷积核可以在第一层过 滤掉高频噪声干扰同时减少运算成本而较短的卷积 核和较深的网络结构可以充分挖掘振动信号隐含的 故障特征 表 模型主要结构参数 结构 卷积核 形状 输入通 道数 输出通 道数 移动 步长 激活 函数 卷积层 卷积层 卷积层 卷积层 另外每一层卷积层紧跟一层池化层且池化带宽 度均为最后一层池化层后接入全连接层其节点数 为 激活函数为 函数为了抑制过拟合提 高模型的泛化能力加入 函数网络中的神经 元以 的概率被置为另外所有卷积层以 函数进行边缘处理每一批训练的数据量为且将 第期叶壮等基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法 其中作为验证集 整个训练阶段的损失函数下降如图所示可 以看到在训练到 步以后损失接近于虽然在 到 步之间有一定的波动但是网络立刻做 出调整训练阶段的学习正确率如图所示可以看 出在训练到 步时正确率已经超过 图训练过程损失 图训练过程正确率 的网络结构为利用 对 得到的特征矩阵进一步特征降维 和诊断为了证明 的特征提取能力将训 练阶段的 函数下降过程与只使用 特征分类 时进行对比如图所示可以看出在使用了 提取的特征后 的 函数下降速率明 显快于只使用 的方法且 函数波动更小另 图 训练过程损失 外训练阶段的识别正确率如图
展开阅读全文

资源标签

最新标签

长按识别或保存二维码,关注学链未来公众号

copyright@ 2019-2020“矿业文库”网

矿业文库合伙人QQ群 30735420