资源描述:
振动与冲击 第 卷第 期 基金项目 国家重点研发计划 国家自然科学基金 中石油北京天然气管道有限公司项目 中国石化勘探开发研究院项目 收稿日期 修改稿收到日期 第一作者 李涛 男硕士生 年生 通信作者 段礼祥 男博士教授博士生导师 年生 自适应卷积神经网络在旋转机械故障诊断中的应用 李涛 段礼祥 张东宁 赵赏鑫 黄辉 毕彩霞 袁壮 中国石油大学北京安全与海洋工程学院北京 中石油北京天然气管道有限公司北京 中国石化 勘探开发研究院北京 摘要针对基于机器学习模型的故障诊断存在依赖人工特征提取质量维数灾难问题和卷积神经网络 模 型构建缺乏自适应性等问题提出了一种基于粒子群优化 算法的自适应 故障诊断方法并将其应用于旋转机 械故障诊断将一维时域信号变成二维时频图像使用 算法对 模型中的个关键参数进行优化选取以构建深 度学习模型将二维时频图像输入优化后的深度学习模型对旋转机械故障进行诊断结果表明所提方法具有较高的准 确率稳定性和自适应性 关键词旋转机械故障诊断卷积神经网络 深度学习模型粒子群优化 算法 中图分类号 文献标志码 旋转机械是机械设备最为常见的类别之一旋转机 械在运行过程中由于环境的腐蚀和磨损等不利因素滚 动轴承转子等部件故障时有发生能够对整个设备正常 运行产生影响滚动轴承是旋转机械的关键部件据统 计旋转机械的故障是由轴承故障引起的转子 系统也是设备转动系统的重要组成部分之一它们与旋 转机械的安全稳定运行息息相关因此对旋转机械开展 状态监测和故障诊断预测研究至关重要 现代设备的高速化精密化高效化导致设备运行 产生的数据呈现出数量维度增加价值密度降低的特 点中国制造又给智能诊断提出了新要求故 障诊断进入大数据时代 年以前传统支持向 量机 人工神经网络 等机器学习算法作为 故障诊断的有效工具一直是专家学者研究的热点这 些方法多采用特征提取与模式识别结合的框架文献 提出了变分模态分解 和 相结合的滚动轴承故障诊断方法 从 分解出的本征模态分量中提取能量特征作为 的输入判断轴承的工作状态和故障类型文献 将不同故障轴承信号的时间小波能量谱熵作为 向量特征输入建立 模型实现了对轴承的工作状 ChaoXing 态和故障类型的判断文献提出了基于 样本 熵与 的往复压缩机轴承间隙故障诊断方法 分解振动信号形成一系列 分量计算其样本熵形成 有效的特征向量再使用 作为模式分类器诊断 得出轴承间隙故障类型然而就目前来看浅层机器 学习算法难以有效构建故障与信号间复杂的映射关 系且依赖先进的信号处理技术和特征提取的质量针 对不同的诊断问题提取敏感有价值的特征一直是机 器学习面临的难题如在内外多激励干扰情况下传统 故障特征提取方法难以提取到有效的早期故障特 征因而难以适应大数据时代下的故障诊断 自从年 论述了深度学习理论深度学 习算法在学术界和工业界得到了广泛的研究和应用以 卷积神经网络 为代 表的深度学习算法通过逐层抽象学习故障敏感特征具 有强大的特征学习和复杂建模能力在处理大数据方面 展现出巨大的潜力和优势并已在语音识别图像分 类 等领域取得了巨大成果因此许多学者开始将 其应用到故障诊断领域李恒等对轴承振动信号进 行短时傅里叶变换得到时频谱样本然后将训练集输入 卷积神经网络中进行学习最后将学习好参数的 模 型应用于测试集输出故障识别结果 等将齿轮 箱振动信号的峰度偏斜度转频负载和个均方根 值等统计特征组成二维特征图作为 的输入通过 实现了齿轮故障的诊断识别文献提出基于 和 的行星齿轮箱特征提取和故障诊断方法 通过 和奇异值分解 将故障振动时域信号处理成奇异值矩阵作为 的输入完成了行星齿轮箱的模式识别和分类文献 针对前端控制风力发电机早期小故障诊断的难点 将 应用于其诊断文献针对环境含有噪声变 工况等实际应用背景提出了具有训练干扰的深度 用于轴承故障诊断该模型能够在嘈杂和变化的环境下 实现高精度和稳定的性能尽管上述案例已经证明 是解决故障诊断问题的有效手段但其具有超参数 众多结构参数复杂等固有缺点在构建模型时往往需要 反复的实验和人为经验以确定最佳模型而且已构建的 模型重用率不高面对新的诊断问题往往需要重新构建 模型因此一定程度限制了深度学习在故障诊断领域的 应用 模型自适应构建方法可自适应选取最优参数比 手动设置参数具有更高的自适应性和诊断精度当前 已有学者对深度学习模型结构参数和超参数自适应优 化进行了研究多数文献为优化学习速率和卷积核个 数不能涵盖大部分参数 等采用粒子 群算法对深度卷积神经网络的学习速率第一第二层 的卷积核个数进行优化并用滚动轴承数据和电力机 车数据进行了验证结果表明自适应的深度学习模型 诊断精度较高 等 采用加入牛顿动量和个 体学习速率自适应方法自适应地选择学习速率提高 了诊断精度针对机器学习存在严重依赖人工提取特 征质量维数灾难等导致诊断能力不足的缺点和卷积 神经网络需要手动设置其结构参数超参数的固有缺 点本文提出基于 的 自适应构建方法 方法并将其应用于滚动轴承和转子系统故 障诊断旨在取得更高的分类正确率和自适应性 基础理论 卷积神经网络方法 采用卷积层和降采样层交替设置构建多个 能够提取输入数据特征的滤波器逐层挖掘隐藏在数 据之中的敏感特征以实现对数据的高层表示由于 卷积层中输出特征面的每个神经元与其输入进行局部 连接并通过对应的连接权值与局部输入进行加权求 和再加上偏置值得到该神经元输入值该过程等同于 卷积过程 也由此而得名如图所示为经 典卷积神经网络架构输入层为维特征图在卷积 层中经过卷积核进行卷积计算通过激活函数得到特 征图本文激活函数采用 函数卷积层数学模 型可表述为 式中 为第 层第个神经元的输出 为 层第 个神经元的输入为输入特征图为第层网络 为权重矩阵即滤波器 为 层上第个神经元的网络 偏置 为激活函数 降采样层用于提取局部特征加速收敛且能 建立空间和结构不变性通常为最大值混合和平均混 合本文采用最大值混合降采样层数学模型可表述为 式中 为降采样函数 为网络乘性偏置 输出层和全连接层进行全连接用做分类器 使用 图卷积神经网络经典架构 振 动 与 冲 击年第卷 ChaoXing 粒子群优化算法 粒子群优化 算 法源于对鸟群捕食的行为研究目前已被广泛应用于 函数优化神经网络训练模糊系统控制以及其他遗传 算法的应用领域基于 的 参数自适应选取 的流程如下所述 步骤初始化一群粒子包括群体规模随机位置和 速度待优化参数的取值区间 步骤通过每个粒子位置计算粒子的适应度值即分 类正确率 步骤对每个粒子将其适应值与其经过的最好位 置 作比较如果较好则将其作为当前的最好 位置 然后将其适应值与所有粒子的最好位置 作比较如果较好则将其作为当前的最好位 置 步骤每一回合结束后根据式式调整粒子 速度和位置 步骤未达到结束条件则转步骤迭代终止条件 根据具体问题一般选为最大迭代次数或粒子群迄今 为止搜索到的最优位置满足预定最大或最小适应 阈值 式中 为第个粒子的速度为第 个粒子的位置为惯性因子本文令其随迭代次数 线性减少 和 为学习因子本文 为第个粒子的最好位置 为所有粒子的最好 位置 故障诊断流程 数据预处理 原始时域信号频域分辨率为零不能涵盖信息全 貌本 文 将 原 始 时 域 信 号 通 过 经 验 模 式 分 解 和希尔伯特变换 处理得到二维时频图像既含 有时域信息也含有频域信息同时相比一维卷积神经 网络 较小尺寸的二维图像输入尺寸减小了 卷积核尺寸的优化范围提高了优化效率 初始化 文献含有层隐藏层文献降采样层 大小为 且均取得了较好的诊断效果因此所 提方法的 初始结构含有层隐藏层分别为卷 积层 降采样层卷积层降采样层全连接 层 降采样层大小为 且根据后文的实验和分 析本文故障样本有限更深层的网络会带来过拟合 等问题 基于 的 自适应构建 在构建 模型时往往需要反复的实验和人为 经验以确定最佳网络而且模型重用率不高面对新 的诊断问题需要重新构建模型过程耗时耗力而 模型的参数对于其性能至关重要例如学习速率 过小会导致收敛速度过慢过大会导致振荡最小训练 量过小偶然性增大且优化变慢过大训练局部最优 化因此将通过 算法优化选取 初始化后的 所有关键参数构建自适应的 模型自适应地处 理不同的故障诊断问题减小模型设计的难度每个 粒子的个维度分别对应着模型的个关键参数迭 代回合 最小训练量 学习率 第一层卷积层大小 个数第二层卷积层大 小 个数 的主要初始参数设置如表 所示 表 的参数设置 参 数 粒子 群尺寸 粒子 维度 迭代 次数 迭代 回合 学习 速率 最小 训练量 卷积 核个数 大小 每个 寻优回合得到每个粒子的分类正确率 通过比较正确率大小确定粒子位置的更新方向位置 更新后卷积核的尺寸必须满足式 式中 为第一层卷积核尺寸 为第二层卷积核尺 寸 为第二层池化层输出的特征图尺寸 为输入 尺寸本文 取 诊断步骤 步骤设置不同类型故障采集旋转机械振动信号 并通过数据分割构造信号样本集 步骤对原始信号样本集进行 和 预处理 生成二维时频图构造特征图样本集并将其划分为训 练集和测试集 步骤初始化 网络 步骤通过 算法优化选取个关键参数构建自 适应的 模型 步骤用测试集测试自适应的 模型性能 流程图如图所示 第期李涛等自适应卷积神经网络在旋转机械故障诊断中的应用 ChaoXing 图 方法的流程图 旋转机械故障诊断实例 滚动轴承诊断案例 凯斯西储滚动轴承数据集 实验装置为美国凯斯西储大学电气工程实验室的 滚动 轴 承 故 障 模 拟 实 验 台试 验 台 包 括 一 个 的电动机图左边一个扭矩传感器图中 间一个功率测试计图右边见图以驱动端轴 承 为研究对象通过电火花加工单点损伤并 在不同负载和转速等种工况下 进行试验将加速度传感器 安装在轴承座上方采集振动信号为有量纲数据采样 频率为 本文考虑种故障类别如表所 示包含正常内圈故障外圈故障滚动体故障类 健康状况每类健康状况分别包含损伤直径为 种故障严重程度正常除外且 的外圈故障包含点钟点钟点钟种 故障位置每类故障含有个样本每个点数为 的样本经过 处理为 的时频图 像为提高计算效率在保证分类准确率的前提下采 用均匀采样的方式压缩时频图像每隔个像素点 取一个像素点压缩后得到尺寸为 的时频图 像以 为例不同故障类 型的时频图像见图本案例采用折交叉验证评估 各个方法的稳定性和准确性为了充分利用样本取 的样本用于训练 的样本用于测试 图滚动轴承故障模拟试验台 表驱动端轴承数据集 损伤尺寸 故障类型故障位置样本数 正常 内圈故障 滚动体故障 外圈故障 内圈故障 滚动体故障 外圈故障 内圈故障 滚动体故障 点钟 外圈故障点钟 点钟 图滚动轴承不同故障类型下的时频图像 对比方法说明 为了验证所提方法的特征提取和故障诊断能力 实验采用 一维 二维 种方法进行对比以上方法参数基于一些通用 设计准则 初始化并根据试验数据测试网络参 数选取正确率最高的参数配置此外一些专家学者 针对不同的诊断问题提出相应的最佳结构 并取 得了最优的效果本文也将采用其结构进行训练测 试对比性能 振 动 与 冲 击年第卷 ChaoXing 训练和测试样本为时域特征和频域特 征每类故障含有个样本每个样本为方差均方 差等个时域特征和均值频率重心频率等个频率 特征参数设置如下选取 函数作为核函数惩罚 因子为 核函数的半径为 训练和测试样本为原始时域信号每 类故障含有个样本每个样本为 个样本点 相关文献的二维 结构训练和测试样 本同 方法以上所有模型的参数如表 所示以文献为例 分别表示尺寸为 的输入 个尺寸为 的卷积核池化层大小为 神经元 个数为的全连接层 括号里的 数值为下文转子系统诊断案例使用的超参数 表 等种模型的参数 模型结构参数配置 文献 文献 文献 结果对比 次试验中 算法个迭代回合的分类正确 率如图所示在第回合分类正确率均达到了最 高其中试验的准确率最高为 其经过 算法次迭代优化选取的个参数如表所示 其中学习率为 由于本文在训练模型时采用指数 衰减法设置学习率较大的学习率随着迭代的继续逐 步减小这样在训练前期可以加快收敛在训练后期可 以防止振荡现象出现提高了稳定性 图 的迭代过程 表 优化后获得的参数 种方法模型诊断结果见表 方 法的分类正确率最高标准差最低分别为 和 的分 类 正 确 率 次 之为 的分类正确率第三为 浅层 的分 类正确率为 文献等方法的分类正确率均 低于可以看出 传统 网络无法近似高维 复杂函数且人为提取特征引进了误差环节准确率较 低限制了其应用 无法涵盖信息全貌正确 率低于 方法与 相比具有更高的自适应性自适应地确定个关键参数 更进一步地实现了端到端的学习所以诊断精度更高 分类正确率最高结果更稳定可靠正确率分布更紧 密标准差最小文献等方法诊断正确率最低 可见同一模型在应对新的实际诊断问题时往往诊断能 力不足不具有通用性需要根据实际重新构建模型 表种方法的模型诊断结果 方法名称平均正确率 文献 文献 文献 所提方法 图为所提方法的混淆矩阵纵坐标是实际标签 每行表示判别为该类故障和错判为其他故障类别的百 分比总和为横坐标是预测标签每列表示所有 样本中被判别为该类故障的百分比可以看出每类 故障的分类正确率均达到以上表明 方法构建的 模型不仅可以判别故障的类型 同时也可以较准确判断出故障发生的位置和严重程 度实现故障定位 第期李涛等自适应卷积神经网络在旋转机械故障诊断中的应用 ChaoXing 图 方法的混淆矩阵 学习过程的可视化 为了评估 方法的逐层特征学习过 程我们采用了分布随机邻域嵌入 对各个阶段的特 征进行可视化见图每个点表示一个样本个坐 标轴分别表示前个维度将每个样本的原始数据和 第一第二层降采样层提取的特征降到前个维度进 行观察原始数据可视化后种故障处于无序状态 难以判别第一层降采样层提取的特征可视化后多数 样本可以区分然而仍然很难判别所有样本第二层降 采样层学习的特征可视化后除了个别样本出现判别 错误类故障得到很好的区分结果表明所提方法 通过逐层挖掘隐藏在数据之中的高维敏感特征提高 滚动轴承故障诊断的分类正确率 图 特征可视化 转子系统诊断案例 转子系统数据集 为了进一步验证本文方法的优势对实验室转子 系统故障进行了诊断实验装置为转子故障模拟实验 台如图所示包含转速控制箱转子平台和振动采 集仪其中转子平台型号为 由调速器底座电 机联轴器转子系统组成转子系统包括转轴转子 轴 承联 轴 器轴 承 支 架实 验 中 转 速 设 定 为 在转子实验台的每个轴承座的水平和垂 直方向各放置一个压电式加速度传感器采集振动信 号共个振动传感器见图采样频率为 本 文考虑种故障类别包含正常 不平衡 不 对中 碰摩 轴承座松动 碰摩和不对 中耦合故障 种故障类型时域信号见图 每类故障含有个样本每个点数为 的样本经 过 处理并压缩成 的时频图像见图 综合考虑分类正确率和计算效率在保证高正确率的 前提下减少训练时间因此本案例不同于滚动轴承 诊断案例而选用 的样本用于训练 的样本用 于测试每个实验重复次计算平均结果 图转子故障模拟实验台 图加速度传感器布置 图转子不同故障类型下的时域信号 振 动 与 冲 击年第卷 ChaoXing 图转子不同故障类型下的时频图像 结果对比 对比方法说明同滚动轴承诊断案例 算法在 第回合分类正确率达到了最高为 其经 过 算法次迭代优化选取的个参数如表 所示 表 优化后获得的参数 种方法模型诊断结果如表所示可以看出 方法的分类正确率最高标准差最低 分别为 和 诊断效果更加准确与稳定 相比传统 网络以及其他深度学习方法本文方 法的诊断能力更强具有更好的泛化性能 文献 等方法在解决简单问题分类时正确率均有了 一定幅度的提升在解决复杂问题分类时依然表 现出诊断能力不足 表种方法的模型诊断结果 方法名称平均正确率 文献 文献 文献 所提方法 特征可视化 为了验证本文方法特征提取的能力但由于本文 篇幅有限仅对第二层卷积池化后的特征进行可视化 从图中可以看出种故障样本经过第二层卷积池 化后的特征图有着明显区别说明经过优化的卷积核 可以有效提取样本的特征并将其映射成相应的故障 类型同时从图中可以看出经过第二层卷积池化 后各个类别已基本分开分离效果较好 图转子第二层卷积池化后的特征图 图第二层卷积池化后的特征可视化
展开阅读全文