资源描述:
第 42 卷 第 5 期 2009 年 5 月 天 津 大 学 学 报 Journal of Tianjin University Vol.42 No.5 May 2009 收稿日期2008-05-06;修回日期2008-10-31. 基金项目国家自然科学基金重点资助项目60534050. 作者简介曲志刚(1980 ) ,男,博士. 通讯作者靳世久,shjjin. 基于支持向量机的油气管道安全监测信号识别方法 曲志刚,封 皓,靳世久,曾周末,周 琰 天津大学精密测试技术及仪器国家重点实验室,天津 300072 摘 要针对基于经验风险最小化原则的传统学习方法的不足, 提出了一种基于支持向量机的油气管道安全识别方 法. 通过基于 Mach-Zehnder 光纤干涉仪原理的分布式光纤振动信号传感器获取管道沿线振动信号, 利用基于小波包 分解的 “能量-模式” 方法提取振动信号的特征向量, 并利用支持向量机根据振动信号的特征对其进行识别, 判断管道 沿线是否有异常事件发生. 利用现场实验数据对该方法进行验证分析. 结果表明, 该方法识别正确率较高, 实时性好. 关键词支持向量机;油气管道安全;识别;分布式光纤;小波包 中图分类号TN247; TN911.6 文献标志码A 文章编号0493-2137200905-0465-06 An SVM-Based Recognition for Safety Monitoring Signals of Oil and Gas Pipeline QU Zhi-gang,FENG Hao,JIN Shi-jiu,ZENG Zhou-mo,ZHOU Yan State Key Laboratory of Precision Measurement Technology and Instrument, Tianjin University, Tianjin 300072, China AbstractAn SVM-based recognition for the safety of oil and gas pipeline was proposed due to limitation of the traditional learning s based on empirical risk minimization. The vibration signals along the pipelines were obtained with the distributed optical fiber vibration sensor on the basis of Mach-Zehnder optical fiber interferometer theory. Then the eigenvectors of vibration signals were extracted through the energy-pattern based on wavelet packet decomposition. At last the vibration signals were recognized by support vector machineSVMthrough the eigenvectors with a view to de- tecting whether abnormal events happened along the pipelines. The data obtained at the experimental site were used to u- ate the , and the results show that the is of high accuracy and excellent real-time perance. Keywordssupport vector machine;safety of oil and gas pipeline;recognition;distributed optical fiber;wavelet packet 油气管道由于自身具备的诸多优势, 已成为主要 的油气资源运输手段. 但由于种种自然或人为原因, 管道泄漏事故时有发生, 有时会伴随着巨大的生命财 产损失和环境污染. 目前, 常用的油气管道泄漏检测装置主要通过管 道输送压力、 流量等参数的变化来判断[1]. 该类方法 受输送物质特性及输送工况等诸多因素影响[2], 且报 警发生在泄漏之后. 针对可造成管道泄漏的诸多因素, 笔者研制出一 种基于 Mach-Zehnder 光纤干涉仪的分布式光纤油气 管道泄漏检测及预警系统, 通过获取并分析和识别管 道沿线振动信号由泄漏或外界侵入事件等均可产生 相应振动, 除了对泄漏点进行准确定位外, 还实现 对可能造成泄漏的因素进行预警监测. 如何快速准确 地判断出管道沿线是否发生异常事件是该系统的核 心内容之一. 传统的学习方法主要是基于经验风险最小化 empirical risk minimization, ERM原则[3]. 当训练数 据趋于无穷多时, 经验风险收敛于实际风险. 因此, 经验风险最小化原则隐含地使用了训练样本趋于无 穷多的假设条件[4]. 但在实际工程中, 可用训练样本 数目总是有限的, 因此传统算法遇到了很多困难, 如 466 天 津 大 学 学 报 第 42 卷 第 5 期 小样本问题、 过学习问题、 高维问题、 学习机器结构 问题和局部极值问题等. 支持向量机[5]support vector machine, SVM是基于统计理论的一种学习方法. 与 传统学习方法相比, 它基于结构风险最小化原则, 因 此能在经验风险与模型复杂度之间做合理的折衷, 从 而获得更高的推广能力. 笔者通过基于小波包分解的“能量-模式”法提 取振动信号的特征向量, 可快速有效地提取振动信号 特征; 将支持向量机引入分布式光纤油气管道泄漏检 测及预警系统, 可克服传统学习方法的缺点, 实现对 管道沿线异常事件的快速准确识别. 1 系统检测原理 系统传感原理如图 1 所示, 在管道附近沿管道同 沟平行铺设一条光缆, 利用其中的 3 条单膜光纤构成 基于 Mach-Zehnder 光纤干涉仪原理的分布式光纤振 动信号传感器, 用于获取管道沿途的振动信号. 其中 光缆中的两条光纤为传感光纤, 而第 3 条光纤用于信 号传输[6]. 两条测试光纤中光波汇合后形成的干涉信 号被传输到光电二极管, 光信号被转换成电信号, 随 后通过放大和滤波电路对信号进行处理, 经过 A/D 转换传输到计算机中做进一步的信号处理和分析. 图 1 系统原理 Fig.1 Principle of system 当光纤受到管道沿途的振动信号作用时, 因两条 测试光纤在光缆中排列位置不同, 光缆中的两条测试 光纤会产生不同的应变, 因此两束测试光纤中的相干 光波会分别产生不同的相位变化[7]. 两束相干光波在传感光缆首末端发生干涉后的 光强为 1212 2cos[ ]IIII Is tϕΔΔ 1 式中∆st为两束干涉光波相位调制量之差; ∆ϕ为 二者初始相位之差;1I和 2 I为两束相干光波强度. 设 0 I为输入到两条测试光纤中的总光强, 则有 0 {1cos[ ]}I tIs tαϕΔΔ 2 式中α为两相干光波的混合效率. 若仅考虑交流光强, 则式2可简化为 0 cos[ ]I tIs tαϕΔΔ 3 通过光电检测器将光强信号转化为电流信号, 光 电流的交流量为 0 cos[ ]I tKIs tαϕΔΔ 4 式中K为光电转换系数. 式4中 s tΔ是一个变量, 测试信号是两束相干 光波相位调制差 s tΔ的函数, 通过实时检测干涉光 信号的变化, 可监测管道沿途的振动信号, 从而实现 对管道泄漏的实时监测和预警. 2 振动信号特征提取 小波分析是一种特别适于非平稳信号时频分析 的方法, 是近年来信号分析领域里程碑式的成果[8]. 小波包分解是一种比小波分析更为精细的分解方法, 它的每一层分解不仅针对低频部分, 而且对高频部分 也进行分解, 从而提高了信号的时频分辨率, 因此具 有更广泛的应用价值. 引入基于小波包分解的“能量-模式”方法提取 振动信号特征. 设信号采样频率为2f, 若对信号进行 j层小波包分解, 则可形成2 j 个等宽频带, 每个区间 频宽为 2 j f . 小波包分解后, 得到j层小波包系数 , , m j k C 其中,k为该层分解节点序号,0,1,,k 21 j −;m为 小波包空间位置标识. 信号 x t在时域上的能量为 22 dx tx tt ∞ −∞ ∫ 5 式5与 x t的小波变换系数 , m j k C由 Pars 能 量积分等式关联起来, 得到 2 ,, || m j kj k m EC∑ 6 由式6可知, 小波变换系数 , m j k C具有能量量纲, 可用于信号的频带能量分析. 选取信号能量作为振动信号的特征参数, 基于小 波包分解的特征向量提取步骤如下 1对振动信号进行j层小波包分解; 2选择n个对信号能量最为敏感的频带, 求出 各频带的能量并对其进行归一化处理, 即 2009 年 5 月 曲志刚等基于支持向量机的油气管道安全监测信号识别方法 467 2 ,, || m j kj k m TC∑ 7 , , , j k j k j k n T T T ′ ∑ 8 3将上述归一化能量作为振动信号特征向量, 即 12 [ ,,,] n T TT′′′T 9 3 基于支持向量机的事件分类方法 支持向量机是在统计学理论基础上发展起来的 一种性能优良的学习方法. 支持向量机基本思想是通 过非线性变换, 将输入空间变换到一个高维特征空 间, 在这个特征空间中求取最优分类超平面, 使得在 原输入空间中线性不可分的数据变成线性可分[9], 并 使用结构误差最小理论代替期望误差最小, 有效避免 了神经网络理论中的过训练问题. 支持向量机的二分类的模式识别问题, 是解决多 分类问题的基础. 以二分类线性可分问题[10]为例, 假设线性可分样 本 为 11 ,,yx 22 ,,,,, ll yyxx, n y∈∈xR{}1,1−. 样本学习的目标是构造一个决策函数, 将测试数据尽 可能正确地分类. 二分类线性问题的分类面方程为 10 ii yb⋅−w x≥ 1,2,,il 10 构造最优分类面有两个条件必须满足, 即经验风 险最小化原则和置信范围最小. 其中经验风险最小化 原则满足式10即可; 而置信范围最小条件可转化为 211 22 wΦ⋅ww w 11 因此, 在数据线性可分的情况下, 构造最优分类 面实际上是解下面的二次约束优化问题, 即 min 211 22 Φ⋅www w s.t. 10 ii yb⋅−w x≥ 1,2,,il 12 将约束化问题转化为构造 Lagrange 函数求解, 由 对偶原理, 上述问题可被转化为 max 1,1 1 2 ll iijijij ii j y yααα α −⋅ ∑∑ wxx s.t. 1 0 l ii i yα ∑ 0≥ i α,1,2,,il 13 式13为二次规划问题, 通过求解可得到最优解 *α, 随后求得*w和*b可以构造出划分超平面, 相 应的分类判别函数为 1 sgn l iii i fybα ∗∗ ⎧⎫ ⋅ ⎨⎬ ⎩⎭ ∑ xxx 14 对线性不可分问题, 可通过在其分类面方程中引 入一个松弛项0 i ξ≥解决. 当样本集为非线性可分问题时, 往往是将输入样 本映射到一个维数更高的特征空间, 并在该空间中构 造最优分类面, 在这一空间求解最优分类面. 支持向量机已把分类问题转化为一个约束最优 化问题, 即二次规划问题. 最优化理论中的许多算法 都需要利用整个 Hessian 矩阵, 因此这些算法仅适用 于训练集较小的情况. 当样本集规模较大时, 这种做 法使得系统消耗急剧增大, 因此这些方法不适合处理 大规模数据. 本文中采取序列最小优化[11]sequential minimal optimizer, SMO算法来解决上述问题. 管道沿线异常事件识别是典型的多分类问题. 在 支持向量机解决多分类策略[12]中, “一对一”方法 构造的多元分类器, 单个 SVM 训练规模较少, 训练 数据均衡, 同时易于扩展, 性能更加稳健, 因此采用 “一对一”方法解决管道沿线异常事件的分类问题. 4 现场实验及数据特征提取 4.1 现场实验 课题组在中国特种设备检测研究中心石家庄实 验基地的现场条件下, 利用一段长 100 m、 管径为 159 mm 的气管道展开相关模拟实验, 分别制造气管 道泄漏、 人工挖掘和人走动 3 种情况. 其中, 管道与 光缆同沟铺设, 光缆位于管道正上方, 现场条件如图 2 所示. 图 2 实验现场 Fig.2 Experimental site 在管道上安装气管道泄漏模拟装置, 该装置可分 别模拟泄漏孔径为 1~5,mm 气体管道的泄漏. 其中, 光纤为单模光纤; 系统光源采用半导体激光器, 波长 为 1,550,nm, 功率为 1,mW; 光电探测器采用 InGaAs 468 天 津 大 学 学 报 第 42 卷 第 5 期 光电二极管, 其最小上升下降时间为 0.1 ns; 采用 美国国家仪器公司的数据采集卡进行数据采集, 采集 速度为 510 5 样/s. 将测试光缆与实验管道一同埋入土壤中, 测试光 缆与管道距离为 500,mm. 实验管道可以承受大于 2,MPa 的压力, 使用空压机向管道内注入压缩空气, 使管内的压力达到 0.95 MPa. 现场分别模拟不同压力 和孔径下气管道泄漏、 人工挖掘、 人在管道旁走动 3 种情况, 通过数据采集系统得到 3 种模拟条件下的检 测信号. 其中, 气管道泄漏是通过控制气体泄漏模拟 装置上的手柄开关实现的. 4.2 信号特征提取 在“能量-模式”方法中采用 db6 小波函数对上 述 3 种情况引起的振动信号进行特征提取, 得到信号 特征向量为 8 个敏感频带的归一化能量组成的一维 向量. 现场实验中系统采集振动信号及其特征向量如 图 3 所示. a 气管道泄漏信号及特征向量 b 人工挖掘信号及特征向量 c 人走动信号及特征向量 图 3 3种情况下的信号及特征向量 Fig.3 Signals and their eigenvectors of three cases 振动信号特征结果表明, 通过该方法可得到振动 信号特征向量, 同时 3 种情况的特征向量之间区别较 为明显. 5 支持向量机对事件进行分类 待分类的事件类型为 3 种 管道内初始压力为 0.95,MPa 条件下, 泄漏孔径为 1~5,mm 的气管道泄 漏、 管道正上方的人工挖掘距管道垂直距离为 70,cm、 管道旁左右 50,cm 内人走动. 构建支持向量机模型, 其中基函数采用径向基函 数. 从现场实验中每种动作的大量数据中随机抽取 20 组用于支持向量机的学习; 另外, 随机抽取每种动 作的 10 组数据, 用于对完成学习的支持向量机进行 测试. 通过“一对一”算法对其进行训练, 其分类边 界如图 4 所示. 图 4 支持向量机学习后的分类界面 Fig.4 Classification border of SVM after training 用已完成样本学习的支持向量机对 30 组测试数 据进行识别, 结果见表 1 所示. 为简易起见, 基于小波 包分解的“能量-模式”方法提取的检测信号特征向 量中的 8 个敏感频带进行归一化, 标识为特征 1~8; 从中可见, 完成训练后的支持向量机仅将 12 号样本 识别错, 将该样本的类型 2 错误地识别成类型 3, 其 2009 年 5 月 曲志刚等基于支持向量机的油气管道安全监测信号识别方法 469 识别正确率比较理想. 上述支持向量机在配置为双核 1.86,GHz CPU, 1,G 内存的计算机环境下, 从样本学习到识别测试样 本完毕消耗时间共计 0.061,73,s. 相比之下, 径向基神 经网络完成同样的训练和识别任务, 其识别正确率与 支持向量机相当, 但所需的时间更长[13]. 表 1 支持向量机对 30组测试数据的识别结果 Tab.1 Recognition results of 30 groups of test date by SVM 序号 特征 1 特征 2 特征 3 特征 4 特征 5 特征 6 特征 7 特征 8 识别结果 1 0.207 2 0.147 1 0.129 4 0.181 9 0.106 0 0.094 5 0.127 5 0.100 9 1 2 0.159 3 0.169 0 0.133 5 0.173 3 0.105 5 0.109 0 0.142 8 0.116 7 1 3 0.114 0 0.186 5 0.141 1 0.126 9 0.122 4 0.111 4 0.151 6 0.157 5 1 4 0.269 3 0.162 9 0.140 4 0.112 7 0.084 2 0.112 1 0.126 6 0.103 9 1 5 0.118 1 0.197 2 0.157 6 0.150 4 0.123 5 0.100 5 0.122 9 0.130 3 1 6 0.238 3 0.166 6 0.121 2 0.128 5 0.106 0 0.118 9 0.132 6 0.106 9 1 7 0.238 3 0.166 6 0.121 2 0.128 5 0.106 0 0.118 9 0.132 6 0.106 9 1 8 0.110 5 0.174 5 0.181 5 0.185 4 0.111 0 0.124 3 0.128 6 0.108 4 1 9 0.120 5 0.148 0 0.151 7 0.183 4 0.123 3 0.124 3 0.149 9 0.123 1 1 10 0.304 5 0.120 0 0.156 2 0.134 2 0.084 4 0.085 2 0.109 6 0.091 2 1 11 0.175 7 0.453 1 0.008 0 0.361 0 0 0.000 6 0.000 7 0.001 5 2 12 0.623 7 0.344 6 0.000 4 0.031 0 0 0 0.000 2 0.000 1 3 13 0.312 4 0.356 0 0.023,3 0.275 3 0 0.000 4 0.024 9 0.008 0 2 14 0.165 5 0.630 3 0.013 3 0.187 4 0 0.000 4 0.001 3 0.002 2 2 15 0.563 3 0.357 2 0.001 3 0.077 7 0 0.000 1 0.000 2 0.000 3 2 16 0.391 4 0.288 1 0.044 0 0.247 3 0.000 1 0.000 4 0.020 2 0.009 0 2 17 0.132 8 0.477 2 0.079 4 0.276 2 0.000 1 0.001 3 0.029 5 0.004 8 2 18 0.509 8 0.198 6 0.029 7 0.238 0 0 0.000 4 0.013 9 0.010 0 2 19 0.318 4 0.329 0 0.046 8 0.297 5 0 0.000 5 0.006 5 0.001 9 2 20 0.232 9 0.500 8 0.043 8 0.207 4 0 0.000 7 0.010 4 0.004 6 2 21 0.703 0 0.281 8 0.000 6 0.014 6 0 0 0 0 3 22 0.859 8 0.137 2 0.000 2 0.002 8 0 0 0 0 3 23 0.695 4 0.293 0 0.000 2 0.011 3 0 0 0 0.000 1 3 24 0.849 3 0.148 6 0.000 3 0.001 8 0 0 0 0 3 25 0.984 0 0.013 8 0.000 2 0.002 0 0 0 0 0 3 26 0.818 0 0.178 4 0.000 3 0.003 3 0 0 0 0 3 27 0.916 6 0.082 4 0.000 1 0.001 0 0 0 0 0 3 28 0.934 1 0.063 6 0.000 2 0.002 1 0 0 0 0 3 29 0.714 5 0.280 6 0.000 3 0.004 6 0 0 0 0 3 30 0.609 8 0.380 1 0.000 5 0.009 5 0 0 0 0 3 6 结 语 针对油气管道沿途异常事件预警这一典型多分 类问题采用了基于支持向量机的识别方法. 其中, 对 于检测信号的特征提取, 采用基于小波包分解的“能 量-模式”方法; 随后采用支持向量机对管道沿线异 常事件进行识别, 并利用“一对一”方法解决多分类 问题. 利用现场实验数据对上述方法进行验证, 结果 表明, 基于支持向量机的识别方法实时性好, 识别正 确率较高. 因此, 该方法可有效地用于识别油气管道 沿途的异常事件, 从而达到保护管道安全的目的. 在 今后的工作中, 更多类型的异常事件识别工作尚需要 通过进一步现场实验进行研究和完善. 参考文献 [1] 杨 杰, 王桂增. 输气管道泄漏诊断技术综述[J]. 化 工自动化及仪表, 2004, 313 1-5. Yang Jie, Wang Guizeng. Leak detection and location s for gas transport pipelines[J]. Control and In- struments in Chemical Industry, 2004, 313 1-5in Chinese. [2] 周诗岽, 吴志敏, 吴 明. 输油管道泄漏检测技术综述 [J]. 石油工程建设, 2003, 293 6-10. Zhou Shidong, Wu Zhimin, Wu Ming. Summary of leak detection technology for petroleum pipeline[J]. Petro- leum Engineering Construction, 2003, 293 6-10in Chinese. 470 天 津 大 学 学 报 第 42 卷 第 5 期 [3] 张学工. 统计学习理论的本质[M]. 北京 清华大学出 版社, 2004. Zhang Xuegong. The Nature of Statistical Learning The- ory[M]. Beijing Tsinghua University Press, 2004in Chinese. [4] 张学工. 关于统计学习理论与支持向量机[J]. 自动化 学报, 2000, 261 32-42. Zhang Xuegong. Introduction to statistical learning the- ory and support vector machines[J]. Acta Automatica Sinica, 2000, 261 32-42in Chinese. [5] Cortes C, Vapnik V. Support-vector networks[J]. Ma- chine Learning, 1995, 20 273-297. [6] Zhou Yan, Jin Shijiu, Feng Hao, et al. Study on oil and gas pipeline leakage real-time inspection system based on distributed optical fiber[C]// Conference Committee of the 8th International Symposium on Measurement Tech- nology and Intelligent Instruments. Sendai, 2007 507- 510. [7] 周 琰, 靳世久, 张昀超, 等. 管道泄漏检测分布式光 纤传感技术研究[J]. 光电子激光, 2005, 168 935- 938. Zhou Yan, Jin Shijiu, Zhang Junchao, et al. Study on the distributed optical fiber sensing technology for pipeline leakage detection[J]. Journal of Optoelectronics Laser, 2005, 168 935-938in Chinese. [8] Daubechies I. Ten Lectures on Wavelets[M]. Philadel- phia Society for Industrial and Applied Mathematics, 1992. [9] 邓乃扬, 田英杰. 数据挖掘中的新方法 支持向量机 [M]. 北京 科学出版社, 2004. Deng Naiyang, Tian Yingjie. A New in Data Mining Support Vector Machine[M]. Beijing Science Press, 2004in Chinese. [10] Vapnik V N. The Nature of Statistical Learning Theory [M]. NY Springer-Verlag, 1995. [11] 李建民, 张 钹, 林福宗. 支持向量机的训练算法[J]. 清华大学学报, 2003, 431 120-124. Li Jianmin, Zhang Bo, Lin Fuzong. Training algorithms for support vector machine[J]. Journal of Tsinghua Uni- versity, 2003, 431 120-124in Chinese. [12] Hsu C W, Lin C J. A comparison of s for multi- class support vector machines[J]. IEEE Transactions on Neural Networks, 2002, 132 415-425. [13] 曲志刚. 分布式光纤油气长输管道泄漏检测及预警技 术研究[D]. 天津 天津大学精密仪器与光电子工程学 院, 2007. Qu Zhigang. Study on the Leakage Detection and Pre-Warning Techniques Based on the Distributed Opti- cal Fiber for the Long-Distance Oil and Gas Pipelines [D]. Tianjin School of Precision Instrument and Opto- Electronics Engineering , Tianjin University , 2007in Chinese.
展开阅读全文