资源描述:
第 45 卷 第 6 期 煤田地质与勘探 Vol. 45 No.6 2017 年 12 月 COAL GEOLOGY 2. Collaborative Innovation Center of Coal Work Safety, Henan Province, Jiaozuo 454000, China Abstract The accurate prediction of mine water inflow is very important to prevent mine water inrush accident. In this paper, the SVM model optimized by GAGA-SVM was put forward to realize the short term and accurate prediction of mine water inflow. In this the automatic optimization function of GA was used to find the op- timal parameters of SVM, which can improve the accuracy of prediction. Firstly, the optimal embedding dimension and delay time of mine water inflow were obtained by using the entropy ratio , then the phase space was reconstructed. Secondly, the actual time series of water inflow from 20112015 in Qianqiu coal mine of Yima Coal Group Company were collected. GA-SVM model was used to predict the final 12 sets of data, the mean ab- solute percentage error was only 0.92, the maxmum relative error was 2.62. Finally, compared with the PSO-SVM and BP neural network , the prediction results show that the proposed GA-SVM optimization model is suitable for the prediction of mine water inflow and the prediction accuracy is higher. Keywords mine water inflow; chaotic time series; phase space reconstruction; GA-SVM 据不完全统计,20072014 年我国煤矿共发生 透水事故 128 起,死亡 702 人。为预防透水事故的 发生,矿井涌水量的预测显得尤为重要。矿井涌水 量是设计矿井结构、制定矿井防排水措施的重要依 据,提高矿井涌水量预测的准确度对于预防透水事 故、保证安全生产具有重要意义。 对矿井涌水量的预测,在实践中形成了许多方 法彭辉才等[1]将水均衡预测法应用到贵州绿塘煤 矿;曹楠等[2]在西藏雄村铜矿的涌水量预测时采用 了解析法;刘永良等[3]发展了数值法;刘大野等[4] 使用水文地质比拟法对风水沟矿涌水量进行预测; 朱愿福等[5]对灰色系统理论进行了改进; 窦贤明等[6] ChaoXing 118 煤田地质与勘探 第 45 卷 将遗传算法和 BP 神经网络进行结合;陈玉华等[7] 完善了混沌时序法的矿井涌水量预测。这些方法的 提出与应用对矿井涌水量的预测研究起到了重要的 推动作用,但是也存在着一定的局限[8-9]解析法适 应能力强、简便快速,但是参数的选择难和边界的 简化影响预测精度;数值法具有能够解决复杂问题 和速度快的优点,但是缺乏通用性;水均衡法原理 简单,但均衡要素的测定较为困难;水文地质比拟 法优点是计算简单、经济实用,但也有计算粗糙, 只能近似估计的缺点。所以,笔者旨在寻求一种建 模方便、通用性强且预测精度较高的方法对矿井涌 水量进行预测。 笔者首先用微熵率法求矿井涌水量时间序列的 最佳嵌入维数和延迟时间,进行相空间重构,然后 利用 GA-SVM 建立时间序列预测模型, 最后采集实 际的矿井涌水量时间序列,在重构好的相空间中利 用 GA-SVM 模型进行预测, 并引入评价指标来对预 测结果做评价。 1 重构相空间 荷兰学者 F. Takens[10]提出了相空间重构理论, 其基本思想是通过相空间重构,将原始序列转换到 高维相空间中,以便使时间序列中蕴藏的信息充分 显露出来,然后在此空间中构建动力学系统预测模 型。F. Takens 证明了只要m和τ选择合适,重构的 相空间和原系统的拓扑性质相同。 T [ , , 2 ,1 ]X jx jx jτx jτx jmτ, 1,2,,1jNmτ 1 式中 x j为时间序列;τ 为时间延迟;m为嵌入维 数。重构相空间的关键是确定时间延迟 τ 和嵌入维 数m。本文运用微熵率法求矿井涌水量时间序列的 τ和m,对矿井涌水量时间序列运用式1进行相空 间重构, 然后用 GA-SVM 优化模型对重构后的涌水 量时间序列进行预测,获得最终的预测结果。 2 微熵率法确定相空间重构参数 关于时间延迟τ和嵌入维数m的选取,现在主 要有 2 种观点一种认为两者是互不相关的,通常 将两者分开选取[11]; 另一种认为两者可以同时选取, 常用的有 C-C 法[12]。 但是 C-C 法必须先计算嵌入时 序的关联积分,并分别构造统计量 S t、Δ S t、 cor t S与延迟时间的关系以确定时延 τ 和时间窗 tw, 然后才能确定嵌入维数 m,这未免显得繁琐。部分 学者在用 C-C 法求得延迟时间后,又用 Cao 法或其 他方法来求嵌入维数[13],这其实还是将两参数分开 求取。经过对比分析,本文利用微熵率法同时确定 重构相空间的参数。 Gautama 等人提出一个基于样本时间序列及其 替代数据的相空间重构的微熵率方法,同步确定时 间延迟τ和嵌入维数m [14]。熵率是指随机源1 个随 机过程随时间变化的平均不确定性。该方法的主要 优点是用一个简单的测度同时优化 τ 和 m ,避免了 互信息量法和错误近邻法的不一致性。 微熵率法的基本原理如下 信 号 1,2,, x t tn的 S N个 替 代 数 据 为 , s i xt,1,2,, S iN。定义熵率 ent ln , , mN Rm τI m τ N 2 , , ,, /,, s ii I m τH x m τH xm τ 3 E 1 lnln2 N j j H xNρC 4 式中 N是延迟矢量的个数1Nnmτ; i 是 求N个替代数据的微熵 , s i H x1,2,, s iN的平 均值算子; j ρ是第j个延迟向量和最近邻点之间的 欧式距离, E 0.577 2C为欧拉常数。τ 和 m在一定 区间内变化,即可求出微熵率并画出熵率图。熵率 图上的最小值点在 τ 和 m 轴上对应的值即为最优的 opt τ和 opt m。 3 GA-SVM 原理与建模 3.1 SVM 基本原理 支持向量机Support Vector Machine,SVM[15] 是 20 世纪 90 年代由 Vapnik 提出来的研究小样本、 非线性和小概率事件的模型,能根据有限的样本信 息在模型的复杂度和学习能力间寻找最优的解。其 基本思想如下给定一个数据集,其中的数据分别 属于 2 类中的任意一类,支持向量机寻找一个超平 面,把属于同类的数据尽可能的分在同一面,并且 使每一类与超平面的距离最大化[16]。 i x表示数据 点,1,2,, d i xRiN,目标{ 1,1} i y 表示类别, 与每个向量 i x关联。找寻最优超平面的问题就转化 为解凸二次方程问题,即 21 2 1,1,2,, ii Minimizew Subject to y w xbiN ≥ 5 式中 w 和b是超平面方程 f xw xb的系数。 然 后构造 Lagrange 函数 2 1 1 , , [ 1] 2 N iii i L w α bwα yw xb 6 式中 1,2,, i α iN为Lagrange乘子。 为了使SVM用于回归预测,通过向目标函数 ChaoXing 第6期 乔美英等 基于GA-SVM的矿井涌水量预测 119 加入惩罚因子C并设置阈值控制错分比例将上述方 程转化成 111 1 1 , 2 0,0,1,2, NNN iijijij iij N iii i Maximizeαα α y y K x x Subject toα yαC iN ≤≤, 7 , ij K x x是支持向量机由低维向高维空间转换 采用的核函数类型,因此得到了SVM用作回归预 测的一般表述。 核函数常用的有线性核函数、多项式核函数、 径向基函数Radial Basis Function,RBF和Sigmoid 函数。笔者选用RBF核函数 2 2 ,exp 2 ij ij xx K x x σ 8 常用的几种核函数对SVM性能影响不大,反而 核函数参数和误差惩罚因子C是影响SVM性能的关 键因素[17]。所以,选择合适的参数显得至关重要。 3.2 GA 基本原理 遗传算法Genetic Algorithm,GA是Holland于 1975年提出的模拟生物进化论的自然选择和生物遗 传的优化技术,是一种通过模拟自然进化过程搜索 最优解的方法。遗传算法的步骤首先进行编码, 将解空间转换成染色体空间;进行进化代数、个体 长度、种群大小等初始群体参数设定;选择合适的 适应度函数,计算群体中个体的适应度;然后对种 群进行遗传算子操作,如选择、交叉和变异,使种 群不断向最优方向进化,从而得到满意解。 3.3 建立 GA-SVM 模型 GA-SVM是把GA优秀的全局搜索能力和SVM 预测相结合的一种算法, 即用GA来优化SVM模型 参数。GA-SVM模型算法步骤如下 a. 步骤1 输入样本数据,指定样本数据中的 训练样本和测试样本。为消除原始数据数量级间较 大的差异, 笔者对矿井涌水量时间序列在[–1,1]区间 进行归一化处理。 b. 步骤2 编码及产生初始种群。对SVM的 核函数类型、核参数和惩罚因子都采用二进制编码 方式进行编码,且随机产生初始种群。 c. 步骤3 用训练样本训练参数,计算染色体 的适应度值。 定义样本的均方误差EMSE作为适应度 函数,评价种群。 EMSE 2 1 1 n ii i yy n 9 式中 i y为实测值, i y为预测值,1,2,i。 d. 步骤4 对种群进行选择、交叉、变异等遗 传算子操作,产生下一代种群。 e. 步骤5 判断是否满足终止条件,即对种群 个体进行适应度验证,若不满足,则转到第四步, 若满足则输出最优参数。 f. 步骤6 将最优参数输入到SVM模型中, 进 行预测。本文引入4项评价指标,并与PSO-SVM 和BP神经网络进行比较。 GA-SVM算法流程如图1所示。 图 1 GA-SVM 算法流程图 Fig.1 Flowchart of GA-SVM algorithm 4 工程应用实例 千秋煤矿是河南能源集团义煤公司骨干矿井之 一,位于河南省义马市南1~2 km,1956年建设, 1958年投产,矿井核定生产能力210万t/a。该矿分 为一水平和二一采区2个区域,计算两个区域涌水 量之和即为该矿井涌水量,采集从2011-01 2015-12共60个月2个区域的涌水量时间序列数据, 将2011-012014-12的涌水量数据作为训练集,将 2015年12个月的涌水量数据作为测试集。取样监 测周期为1个月,如图2所示。 利用微熵率法求矿井涌水量相关时间序列嵌入 维数和延迟时间,时间序列熵率见图3。图中纵坐 标为熵率,熵率最小点所对应的两横坐标即为最优 m和τ, 即图中五角星位置所示, 由图知m2,τ 3。 利用libsvm-3.1工具包和Matlab2010b的接口 程序编程,创建GA-SVM模型,利用前4年48个 月的数据训练模型, 来对最后一年12个月的涌水量 ChaoXing 120 煤田地质与勘探 第45卷 进行预测。遗传算法操作的相关参数如下交叉验 证次数v取5, 种群数量为20, 遗传终止代数为100, 遗传代沟为0.9,设置c 的搜索范围为[0,100],g的 搜索范围为[0,1 000]。 图 2 矿井涌水量时间序列 Fig.2 Time series of mine water inflow 图 3 时间序列熵率图 Fig.3 Entropy rate of time series 把训练样本送入GA-SVM模型中, 经过100次 进化计算得到最佳适应度的稳定迭代值,见图4。 图 4 GA-SVM 进化代数曲线 Fig.4 Evolution algebra curve of GA-SVM 从图4可知,经过30次进化迭代后,种群最佳 适应度基本保持稳定, 可认为近似达到最优解,best c7.422 3,g0.017 166c为惩罚因子,g为核函数 参数,有些文献用σ表示, 2 1 2 g σ ,此时训练数 据集的EMSE为0.017 9。将两参数代入SVM中去, 经过计算得到训练和测试结果如图5所示。 图 5 GA-SVM 测试结果 Fig.5 Test results of GA-SVM 图5的3幅图按顺序依次为48个训练集回归值 与实测值的比较;12个测试集预测值与实测值的比 较;测试集预测相对误差曲线。由图5可以看出, 训练集可以被较好的拟合,其EMSE为0.014 8。 GA-SVM对测试集模拟的EMSE为4.416 710-4,预 ChaoXing 第6期 乔美英等 基于GA-SVM的矿井涌水量预测 121 测结果接近真实值。 为验证GA-SVM模型的优越性, 在相同的数据 条件下, 分别采用PSO-SVM和BP神经网络对矿井 涌水量时间序列进行预测, 其预测效果如表1所示。 表 1 几种矿井涌水量预测方法结果比较 Table 1 Comparison of several prediction s of mine water inflow GA-SVM PSO-SVM BP 神经网络 序号 实测值/ m3h-1 预测值/ m3h-1 绝对误差 相对误差/ 预测值/ m3h-1 绝对误差相对误差/ 预测值/ m3h-1 绝对误差 相对误差/ 1 336.1 335.1 1.0 0.30 332.0 4.1 1.22 345.2 9.1 2.70 2 345.3 343.7 1.6 0.46 336.8 8.5 2.46 364.3 19.0 5.49 3 344.0 353.0 9.0 2.62 342.8 1.2 0.35 369.6 25.6 7.45 4 367.0 361.7 5.3 1.44 349.5 17.5 4.77 372.9 5.9 1.61 5 370.3 368.5 1.8 0.49 356.1 14.2 3.83 378.6 8.3 2.24 6 371.2 372.4 1.2 0.32 362.0 9.2 2.48 373.9 2.7 0.72 7 369.1 373.3 4.2 1.14 366.5 2.6 0.70 387.2 18.1 4.90 8 369.6 371.5 1.9 0.51 369.3 0.3 0.08 393.0 23.4 6.33 9 371.7 367.7 4.0 1.08 370.0 1.7 0.46 367.5 4.2 1.14 10 357.6 362.8 5.2 1.45 368.7 11.1 3.10 369.2 11.6 3.24 11 358.9 357.5 1.4 0.39 365.6 6.7 1.87 388.6 29.7 8.28 12 355.5 352.5 3.0 0.84 361.2 5.7 1.60 372.7 17.2 4.83 引入以下4项评价指标,3种方法预测结果评 价对比,如表2所示。其中,EMAE为平均绝对误差, 计算公式为 EMAE 1 1 n ii i yy n 10 EMRE为最大相对误差,计算公式为 EMRE max 100 ii i yy y 11 ERMSE为均方根误差,计算公式为 ERMSE 2 1 n ii i yy n 12 EMAPE为平均绝对百分比误差,计算公式为 EMAPE 1 100 n ii ii yy y n 13 其中 i y为实测值, i y为预测值,1,2,i ,n。 表 2 预测结果评价对比 Table 2 Comparison of prediction results 评价指标 GA-SVM PSO-SVM BP 神经网络 EMAE 3.29 6.91 14.57 EMRE 2.62 4.77 8.28 ERMSE 4.00 8.63 16.87 EMAPE 0.92 1.91 4.08 从表1和表2中我们可以看出,利用GA-SVM 预测结果明显优于PSO-SVM和BP神经网络, 预测 结果比较理想。 5 结 语 矿井涌水量是矿井安全生产的重要因素,针对矿 井涌水量时间序列的非线性特征,本文用微熵率法求 得重构参数进行相空间重构, 继而建立GA-SVM优化 模型,最后在MATLAB环境下通过编程对未来12个 月的矿井涌水量进行预测。预测结果表明,GA-SVM 模型可对矿井涌水量进行短期准确预测,丰富了矿井 涌水量的预测方法,具有一定的现实意义。 参考文献 [1] 彭辉才, 徐卫东, 付青, 等. 贵州绿塘煤矿涌水量预测研究[J]. 南水北调与水利科技,2013,11258–61. PENG Huicai,XU Weidong,FU Qing,et al. Research on prediction of water inflow in Lvtang coal mine of Guizhou Province[J]. South-to-North Water Transfers and Water Science Technology,2013,11258–61. [2] 曹楠,申太丽,许向宁,等. 西藏雄村铜矿水文地质特征及矿 坑涌水量预测[J]. 四川地质学报,2008,283220–224. CAO Nan,SHEN Taili,XU Xiangning,et al. Hydrogeological characteristics of the Xiongcun copper deposit in Tibet and its prediction of water yield of mine[J]. Acta Geologica Sichuan, 2008,283220–224. [3] 刘永良, 潘国营. 基于 Visual Modflow 的岩溶水疏降流场模拟 和涌水量预测[J]. 河南理工大学学报自然科学版,2009, 28151–54. LIU Yongliang,PAN Guoying. Mine inflow prediction and nu- merical simulation on descending flow field of karst water based on Visual Modflow[J]. Editorial Board of Journal of HPUNature Science,2009,28151–54. ChaoXing 122 煤田地质与勘探 第45卷 [4] 刘大野, 陈立云, 徐会. 矿井单位涌水量比拟法在矿井涌水量 预测中的应用[J]. 中国煤炭地质,2010,221041–44. LIU Daye,CHEN Liyun,XU Hui,et al. Application of mine specific capacity analogue in mine water inflow predic- tion[J]. Coal Geology of China,2010,221041–44. [5] 朱愿福,王长申,李彦周,等. 改进的灰色系统理论预测矿井 涌水量[J]. 煤田地质与勘探,2014,42444–49. ZHU Yuanfu,WANG Changshen,LI Yanzhou,et al. Prediction of mine water inflow with modified grey system theory[J]. Coal Geology Exploration,2014,42444–49. [6] 窦贤明,杨永国,徐伟伟,等. 基于遗传算法和 BP 神经网络 的矿井涌水量预测[J]. 中国煤炭地质,2009,211037–66. DOU Xianming, YANG Yongguo, XU Weiwei, et al. Prediction of mine inflow based on genetic algorithm and BP neural net- work[J]. Coal Geology of China,2009,211037–66. [7] 陈玉华,杨永国,彭高辉,等. 矿井涌水量混沌时间序列分 析与预测[J]. 煤田地质与勘探,2008,36434–36. CHEN Yuhua,YANG Yongguo,PENG Gaohui,et al. Chaotic time series analysis and prediction for mine water inflow[J]. Coal Geology Exploration,2008,36434–36. [8] 汪伟,罗周全,王益伟,等. 基于混沌理论的矿井涌水量预测 研究[J]. 中国安全科学学报,2013,23451–56. WANG Wei, LUO Zhouquan, WANG Yiwei, et al. Research into mine water inflow forecast based on chaotic theory[J]. China Safety Science Journal,2013,23451–56. [9] 安欣,贾进章. 矿井涌水量时间序列 ARIMA 预测模型[J]. 辽 宁工程技术大学学报自然科学版,2015,347785–790. AN Xin,JIA Jinzhang. Time serier prediction of mine water in- flow of ARIMA model[J]. Journal of Liaoning Technical Univer- sityNatural Science,2015,347785–790. [10] TAKENS F. Dynamical systems and turbulence[M]. Berlin Springer-Verlag Press,1981366–381. [11] 马红光,李夕海,王国华,等. 相空间重构中嵌入维和时间延 迟的选择[J]. 西安交通大学学报,2004,384335–338. MA Hongguang,LI Xihai,WANG Guohua,et al. Selection of embedding dimension and delay time in phase space reconstruc- tion[J]. Journal of Xian Jiaotong University,2004,384 335–338. [12] 胡瑜, 陈涛. 基于C-C 算法的混沌吸引子的相空间重构技术[J]. 电子测量与仪器学报,2012,265425–430. HU Yu,CHEN Tao. Phase-space reconstruction technology of chaotic attractor based on C-C [J]. Journal of Electronic Measurement and Instrument,2012,265425–430. [13] 张华强, 张晓燕. 基于混沌理论和 LSSVM 的蒸汽负荷预测[J]. 系统工程理论与实践,2013,3341058–1066. ZHANG Huaqiang,ZHANG Xiaoyan. Steam load forecasting based on chaos theory and LSSVM[J]. System Engineer-Theory Practice,2013,3341058–1066. [14] GAUTAMA T,MANDIC D P,VAN HULLE M M. A dif- ferential Entropy based for determining the optimal embedding parameters of a signal[C]//Proc of the Int Conf an Acoustic,Speech and Signal Processing. Hongkong,2003 29–32. [15] 邵良杉,马寒. 煤体瓦斯渗透率的 PSO-LSSVM 预测模型[J]. 煤田地质与勘探,2015,43423–26. SHAO Liangshan,MA Han. Model of coal gas permeability prediction based on PSO-LSSVM[J]. Coal Geology Explora- tion,2015,43423–26. [16] 乔立岩, 彭喜元, 马云形. 基于遗传算法和支持向量机的特征 子集选择方法[J]. 电子测量与仪器学报,2006,2011–5. QIAO Liyan,PENG Xiyuan,MA Yunxing,et al. GA-SVM- based feature subset selection algorithm[J]. Journal of Electronic Measurement and Instrument,2006,2011–5. [17] 郭瑞,徐广璐. 基于信息融合与 GA-SVM 的煤矿瓦斯浓度多传 感器预测模型研究[J]. 中国安全科学学报,2013,23934–38. GUO Rui,XU Guanglu. Research on coal mine gas concentra- tion multi-sensor prediction model based on ination fusion and GA-SVM[J]. China Safety Science Journal,2013,239 34–38. 责任编辑 张宏 上接第 116 页 [17] Itasca Consulting Group Inc. PFC2DParticle Flow Code in 2Dimensions User’s Guide[M]. MinneapolisItasca Consulting Group,Inc,2002. [18] 黄磊,李喜安,蔡玮彬,等. 延安新区马兰黄土湿陷特性的 PFC2D模拟[J]. 煤田地质与勘探,2017,453119–124. HUANG Lei,LI Xi’an,CAI Weibin,et al. Simulation of col- lapsible characteristics of Malan loess in Yan’an new area by PFC2D[J]. Coal Geology Exploration,2017,453119–124. [19] 喆王云飞,王立平,焦华,等. 不同围压下砂岩的变形力学特 性与损伤机制[J]. 煤田地质与勘探,2015,43463–68. WANG Yunfei, WANG Liping, JIAO Huazhe, et al. Mechanical charactristics of deation and damage mechanism of sand- stone under different confining pressure[J]. Coal Geology Ex- ploration,2015,43463–68. [20] 董启朋, 姚海林, 詹永祥. 基于颗粒流模型的颗粒材料宏细 观力学研究[J]. 人民长江,2016,47468–73. DONG Qipeng,YAO Hailin,ZHAN Yongxiang. Macro-meso- scopic mechanical behaviors of granular material based on parti- cle flow model[J]. Yangtze River,2016,47468–73. [21] 周博,汪华斌,赵文锋,等. 黏性材料细观与宏观力学参数相 关性研究[J]. 岩土力学,2012,33103171–3175. ZHOU Bo,WANG Huabin,ZHAO Wenfeng,et al. Analysis of relationship between particle mesoscopic and macroscopic me- chanical parameters of cohesive materials[J]. Rock and Soil Me- chanics,2012,33103171–3175. [22] 曹可达,谭慧明,王娇娇,等. 吸力贯入式平板锚旋转特性的 离散元数值模拟[J]. 中国科技论文,2015,107829–833. CAO Keda, TAN Huiming, WANG Jiaojiao, et al. DEM numerical simulation on keying characteristics of suction embedded plate an- chors[J]. Chinese Scientific Papers,2015,107829–833. 责任编辑 张宏 ChaoXing
展开阅读全文