机器学习算法反求水文地质参数_强玲娟.pdf-_矿业文库_煤矿文库_有色文库_金属矿山文库_矿山安全_煤矿安全_采矿技术措施

资源描述：

第 45 卷第 3 期煤田地质与勘探 Vol. 45 No.3 2017 年 6 月 COAL GEOLOGY particle swarm of double uation; hydrogeological parameters 水文地质参数的确定，是水文地质数学模型的参数识别过程，此过程一般称为反演。鉴于人工试算方法的一些弊端，从优化理论出发给出较为可行的自动识别方法。在给定待估参数的一个大致范围后，依据一定的初始条件和边界条件，选取最佳参数，使所建立的地下水资源模型能够最大限度的与地下水流状况相吻合。传统的优化问题大多根据最小二乘原理来确定目标函数，这种方法的前提是原始数据必须有较高的准确性。但实际计算中由于各种因素的影响，原始测量数据总会存在一定的误差。这种情况下根据最小二乘原理反求参数，会在无形中使误差累积。本文作者提出基于机器学习算法改进优化问题中的目标函数作为平衡计算结果误差的尝试。基本思想是基于 Zhao Qian 等[1]提出的矩阵因子分解的机器学习算法，改进现在普遍使用的以计算值与实测值离差平方和最小二乘达到极小为目标函数的优化方法，以更好的平衡参数识别过程中因为原始数据误差或算法缺陷等问题带来的误差。 1 机器学习机器学习理论[2]主要是设计和分析一些让计算机可以自动“学习”的算法，这里的学习意味着从数据中学习，它包括有指导学习Supervised Learning、无指导学习Unsupervised Learning和半指导学习 Semi-supervised Learning3 种类别。监督有指导学习问题是在规则化参数[3]的同时最小化误差。最小化误差是为了让我们的模型拟合训练数据，而规则化参数是为了防止模型过分拟合训练数据。因为参数太多，会使模型的复杂度上升，容易过拟合，也就是训练误差会很小。这种情况下模型的实际预测能力并不一定会很好。我们需要在模型“简单”的 ChaoXing 88 煤田地质与勘探第 45 卷基础上最小化训练误差，这样得到的参数测试误差才会小称之为具有较好的泛化性能，而精简模型就是通过规则函数来实现的。一般来说，监督学习可看作优化如下目标函数 argmin, , ii i L yf x       1 其中，第一项衡量模型对于第 i 样本的真值 yi和预测值 i f x,之间的误差，要求其尽可能的小。但同时更希望模型的测试误差小，所以加上第二项对参数的规则化函数  去约束模型使其尽可能的简单。对于第一项损失函数，一般选择最小二乘。对于规则化函数  的选择有很多种，本文依据文献[1]选择函数 2 k   整体替换  ，并且在第一项损失函数之前也加入参数，其中 0,1 。 2 反求含水层参数的泰斯模型 2.1 模型建立设有一承压含水层受到直线隔水边界的限制。在该边界附近有一抽水井作定流量抽水Q C 。其他水文地质条件与泰斯井流中的条件相同。求含水层中任意一点 , M x y 处水头降深发展规律的问题可归结为求解下列数学模型[4] 22 1 2 2π 11 0 0 1 0 0,,0 , ,00 0, lim0 0,,0 limd 0 0 , xy r x Ss sxyt Tt s x yxy sxyt Q rt rT s yt X                                0                 2 式中 s 为降深；Q 为不变抽水量；T 为导水系数；S 为贮水系数；t 为抽水时间；r1为观测孔到抽水井的距离。 2.2 模型求解该模型可以采用映射与叠加法来求解，得到直线隔水边界附近井流问题的解析解 12 [] 4π Q sW uW u T  3 2 1,2 4 i i r S ui Tt  4 2 d0.577 2ln 2 2 y i iii u ue w uyuu y      5 式中 Wu为泰斯井函数。在实际计算中，可以对式5的积分求近似值。式中 r2为观测孔到映射井的距离。 T、S 和 r2为待估参数。设 ti时刻观测到的降深为 0, i s1,2,3,,,in 则在应用改进粒子群算法估计参数时，可以建立如下的优化模型数据参考文献[5] min   n i j c iij k ss][ 2 20    . .ts , , , ] 1 , 0[ 332 22 11 bar baS baT j     6 式中 γ、k 为可选参数。 3 模型求解的改进粒子群算法设计传统的标准粒子群优化算法中，在更新个体的速度和位置后没有考虑粒子适应度值就继续进行迭代，本文采用双评价粒子群结合机器学习算法求解[6-11]。双评价粒子群的迭代过程分为探索阶段和开发阶段。探索阶段计算当前每个粒子及上一代粒子的适应度 i f x t 和 1 i f x t  ；当前代及上一代每个粒子到个体最优粒子的距离 1 d、 2 d，以此分 3 种情况对粒子进行处理。 ①若 12 dd且 1 ii f x tf x t，认为当前粒子有好的探索能力，可以继续迭代。 ②若 12 dd且 1 ii f x tf x t，认为当前粒子没有很好的探索能力，对其进行柯西变异促进粒子探索。柯西变异算子为0, ,,Cv vbav是范围参数，变异后的粒子位置 ii x tx t ，继续对变异粒子进行迭代。 ③ 若 12 dd 且 1 ii f x tf x t ，或者 12 dd 且 1 ii f x tf x t ，则认为当前第i个粒子和上一代第i个粒各有优势，对其线性组合得到新的位置 11,0.5 iii x tqx tqx tq ，再继续迭代。开发阶段的处理方法和探索阶段类似。 4 算例 4.1 原始数据及条件本文采用文献[12]中的数据，已知主井抽水量为定值 Q4.581 m3/min，抽水时间达 960 min，观测孔距抽水井的距离 r130.48 m，式6中1,k 1.2。观测井各时刻降深的观测值如表 1。 ChaoXing 第 3 期强玲娟等机器学习算法反求水文地质参数 89 表 1 ti–si原始数据 Table 1 ti––si original data t/min s/m t/min s/m t/min s/m 5 0.024 70 0.290 360 0.607 10 0.067 80 0.308 420 0.640 15 0.098 90 0.329 480 0.671 20 0.125 100 0.347 540 0.695 25 0.149 120 0.366 600 0.719 30 0.171 140 0.381 660 0.750 40 0.204 180 0.460 720 0.762 50 0.234 240 0.518 840 0.802 60 0.259 300 0.570 960 0.844 在利用机器双评价粒子群算法反演参数时，只带入部分时刻的降深数据及定抽水量、观测孔距井的距离，将其余时刻的降深观测值作为检验数。利用 MATLAB 编程，可在很短时间内求出参数值。 4.2 结果分析 4.2.1 算法可靠性检验依据上述数据，采用本文的基于机器学习的改进粒子群算法计算出贮水系数、导水系数、观测孔距映射井的距离分别为 S0.068、T3.000 m2/min、 r2105.176 m，各参数取 a10.2，b120；a20.006， b20.6；a310，b31 000。为了检验算法的可靠性，将求得的参数值带入公式中，反求各个时刻的降深，与实际观测值比较。图 1 为实际降深与计算值之间的关系。图 1 计算值与降深观测值的比较 Fig.1 The comparison of calculated and observed drawdown 从图 1 可以看出，两条曲线除了在 0,50t 部分内有偏差，其余时刻数据基本吻合。而且相对于其他几种算法，本文的基于机器学习下改进粒子群算法误差最小，所以该方法在分析抽水试验资料，反演地质参数的优化问题时是可行的。为了说明该算法的性能，表 2 列出几种不同算法在同一环境下反演参数的结果。表 2 不同算法求解参数的比较 Table 2 Solution parameters of different algorithm 参数双评价粒子群改进模拟退火机器双评价粒子群 T 2.949 6 2.969 5 3.0 S 0.066 0.065 6 0.068 07 r2 1.641 85 112.07 105.176 s 1.641 85 1.492 7 0.622 9 s′ 8.79110-5 8.49210-5 6.580 910-5 注改进模拟退火算法结果参照文献[5]，机器双评价粒子群表示取机器学习的目标函数，结合双评价粒子群方法反演参数。表 2 中 s 表示带入参数后所有数据的平均拟合偏差平方和，s′表示去除 1040 min 的几个数据，因为从图 1 中可以看出这部分数据有相对较大偏差。综合考虑 s 和 s′的值，发现机器双评价粒子群算法两种误差都较小，所以可以得出结论机器双评价粒子群算法反求水文地质参数更可靠、实际。 4.2.2 改进措施对算法影响考虑到测量数据存在误差，下面给原始数据一个扰动取0,0.001normrnd，比较双评价粒子群和机器双评价粒子群 2 种算法的计算结果如下。因为机器粒子群算法中每组数据会对应一个参数，所以不宜取较多组数据计算，本文随机取表 1 的 10 组数据，见表 3。表 3 扰动数据结果 Table 3 The result of disturbing data t/min s/m t/min s/m 20 0.122 300 0.567 60 0.256 420 0.637 100 0.344 600 0.716 120 0.363 720 0.759 180 0.457 960 0.841 图 2 为某次双评价粒子群反求数据扰动时参数进化过程。从图 2 可以看出，在数据有扰动时，双评价粒子群即使作为改进的粒子群算法也是不稳定的，会在最优值附近震荡。表 4 列出双评价粒子群在同一环境下运行 10 次的平均结果。作为比较，图 3 为某次运行机器双评价粒子群反求数据扰动时模型的参数进化过程。从图 3 可以看出，在数据存在扰动时，机器双评价粒子群算法有很好的稳定性，因此可以验证本文提出的算法能够很好的平衡原始数据的误差，保证算法的稳定性。表 5 列出数据扰动时机器双评价粒子群的计算 ChaoXing 90 煤田地质与勘探第 45 卷结果。图 2 双评价粒子群计算过程 Fig.2 Calculation process of particle swarm 表 4 数据扰动时标双评价粒子群算法结果 Table 4 The result of particle swarm algorithm with the disturbing data T S r2 s s′ 2.866 0.069 07 115.189 5.332 7 1.0910-4 图 3 机器双评价粒子群计算过程 Fig.3 Computation process of machine particle swarm 表 5 数据扰动时机器双评价粒子群算法结果 Table 5 The result of machine particle swarm algorithm with the disturbing data 参数数值参数数值参数数值 T 2.919 5 ω3 0.010 ω8 0.010 S 0.068 69 ω4 0.010 ω9 0.990 r2 109.051 6 ω5 0.177 ω10 0.010 ω1 0.168 ω6 0.144 s 1.660 2 ω2 0.679 ω7 0.225 s′ 7.34510-5 在数据存在扰动或有误差时，机器粒子群算法因为在目标函数中加了权重，会平衡各个数据的误差，使得算法在同一环境下能够更快更好的收敛到最优值。对比表 4 与表 5，机器双评价粒子群算法反求参数的拟合结果也比同一环境下双评价粒子群的结果要精确。足以说明该算法在实际中确实有可操作性。 5 结语将机器学习算法和双评价粒子群应用于直线隔水边界承压含水层参数反演和隔水边界识别的优化问题。计算结果表明，此种方法高效省时、精度高，而且相比较一般算法直接使用最小二乘作为目标函数，能够减小数据扰动带来的影响，平衡各项误差，保证算法的稳定性和计算结果的精确性。该方法作为平衡参数反演过程中误差的一种尝试，适合于数据较少的问题分析，仍有待于进一步完善。因为过多的数据会导致计算过程中算法参数较多，难以得出精确结果。并且选取参数的初始范围不宜太大，否则就要以增加进化代数或者初始种群个数为代价并延长计算时间来保证计算结果的可靠性。参考文献 [1] ZHAO Qian， MENG Deyu， LU Jiang， et al. Self-paced learning for matrix factorization[C]//Proceeding of the Twenty-Ninth AAAI Conference on Artifical Intelligence，USA，2015. [2] 何清，李宁. 大数据下的机器学习算法综述[J]. 模式识别与人工智能，2014，274327–336 . HE Qing，LI Ning. A survey of machine learning algorithms for big data[J]. Pattern Recognition and Artificial Intellgence， 2014， 274327–336. [3] JOENUX. 机器学习中的范数规则化[Z/OL]. [2015-12-30]. http// blog. [4] 郭东屏. 地下水动力学[M]. 西安陕西科学技术出版社， 1994230–238. [5] 张娟娟，郭建青. 基于改进模拟退火算法反演水文地质参数[J]. 中国农村水利水电，2005 95–8. ZHANG Juanjuan，GUO Jianqing. Identification of hydro- geological parameters based on modified simulation annealing algorithm[J]. China Rural Water and Hydropower， 2005 9 5–8. [6] 张媛媛，高兴宝. 双评价粒子群算法[J]. 陕西科技大学学报， 2012，30 193–96. ZHANG Yuanyuan， GAO Xingbao. Particle swarm optimization with double uation[J]. Journal of Shaanxi University of Sci- ence Technology，2012，30193–96. [7] 刘逸，寇卫东. 粒子群优化算法的改进与应用研究[D]. 西安西安电子科技大学，2012. [8] 王菲，刘元会，郭建青. 双评价粒子群确定非线性流含水层参数[J]. 中国农村水利水电，2013 1219–26. WANG Fei，LIU Yuanhui，GUO Jianqing. Determination of aquifer parameters in nonlinear flow by double uation of par- ticle swarm optimization algorithm[J]. China Rural Water and Hydropower，2013 1219–26. [9] 艾宁宁. 基于混合智能算法求解随机期望值模型和机会约束规划[D]. 西安长安大学，2012. 下转第 95 页 ChaoXing 第 3 期张晓亮熵权耦合层次分析赋权在煤层底板突水评价中的应用 95 田生产能耗评价研究[J]. 资源调查与评价，2005 251–53. WANG Renyi，JU Yaming，SHI Jiaxiang. A study of energy consumption uation of integrated oil field based on entropy weight coefficient and DTOPSIS[J]. Management Geological Science and Technology，2005 251–53. [13] 邱菀华. 管理决策与应用熵学[M]. 北京机械工业出版社， 200287–90，193–196. [14] 宫博，许开立，李德顺. 基于熵权属性识别模型的地表水质量评价[J]. 环境科学导刊，2011，30674–77. GONG Bo，XU Kaili，LI Deshun. Assessment of the surface water quality based on entropy weight of attribute recognition model[J]. Environmental Science Survey，2011，30674–77. [15] 尚天成，高彬彬，李翔鹏，等. 基于层次分析法和熵权法的城市土地集约利用评价[J]. 电子科技大学学报社科版，2009， 1166–9. SHANG Tiancheng，GAO Binbin，LI Xiangpeng，et al. Urban land intensive utilization uation based on AHP and entropy [J]. Journal of UESTC Social Sciences Edition，2009，1166–9. [16] 向文英，杨静，张雪. 模糊综合评价法的改进及其在水库水质评价中的应用[J]. 安全与环境学报，2015，156344–348. XIANG Wenying，YANG Jing，ZHANG Xue. Improvement of fuzzy comprehensive uation and its application to the uation of reservoir water quality[J]. Journal of Safety and Environment，2015，156344–348. [17] 武强，张志龙，张生元，等. 煤层底板突水评价的新型实用方法Ⅱ脆弱性指数法[J]. 煤炭学报， 2007， 3211 1121–1126. WU Qiang， ZHANG Zhilong， ZHANG Shengyuan， et al. A new practical ology of the coal floor water bursting uating ⅡThe vulnerable index [J]. Journal of China Coal So- ciety，2007，32111121–1126. [18] 刘可新，包为民，阙家骏，等. 基于主成分分析的 K 均值聚类法在洪水预报中的应用[J]. 武汉大学学报工学版，2015， 484447–450. LIU Kexin，BAO Weimin，QUE Jiajun，et al. Application of K-mean cluster to flood forecasting based on principal component analysis[J]. Engineering Journal of Wuhan Univer- sity，2015，484447–450. [19] 刘星，毕奇龙，郑付刚. 基于蚁群 K 均值聚类算法的边坡稳定性分析[J]. 水电能源科学，2010，288108–109. LIU Xing，BI Qilong，ZHENG Fugang. Analysis of slope sta- bility based on ant colony K-means clustering algorithm[J]. Wa- ter Resources and Power，2010，288108–109. [20] 顾建华，毛国敏，吴新燕. 用 K–均值聚类法改进地震灾害 FAPE 分类模型[J]. 自然灾害学报，2008，171157–162. GU Jianhua， MAO Guomin， WU Xinyan. Improvement in FAPE classification model for earthquake disasters assessment by K-means cluster approach[J]. Journal of Natural Disasters， 2008， 171157–162. [21] 陈陆望，殷晓曦，刘鑫，等. 华北隐伏型煤矿地下水水化学演化多元统计分析[J]. 煤田地质与勘探，2013，41643–48. CHEN Luwang，YIN Xiaoxi，LIU Xin，et al. Multivariate statistical analysis on hydrochemical evolution of groundwater in the concealed coal mines in North China[J]. Coal Geology Exploration，2013，41643–48. [22] 郑学召，于远祥. 模糊等价聚类分析在王村矿围岩稳定性分析中的应用[J]. 煤田地质与勘探，2014，42555–60. ZHENG Xuezhao，YU Yuanxiang. Fuzzy equivalent clustering analysis of surrounding rock stability in Wangcun mine[J]. Coal Geology Exploration，2014，42555–60. [23] 张晓亮. 山西三元煤业股份有限公司水文地质补充勘探报告[R]. 太原山西省煤炭地质水文勘查研究院，2015. [24] 尹尚先，虎维岳，刘其声，等. 承压含水层上采煤突水危险性评估研究[J]. 中国矿业大学学报，2008，373311–315. YIN Shangxian，HU Weiyue，LIU Qisheng，et al. Risk as- sessment for water inrush from confined aquifers located under coal seams[J]. Journal of China University of Mining Tech- nology，2008，373311–315. [25] 王家臣，杨胜利. 采动影响对陷落柱活化导水机理数值模拟研究[J]. 采矿与安全工程学报，2009，262140–144. WANG Jiachen，YANG Shengli. Numerical simulation of mining effect on collapse column activated water conducting mechanism[J]. Journal of Mining Safety Engineering，2009，262140–144. 责任编辑张宏上接第 90 页 [10] 郭建青，郑力，雷玉平，等. 分析直线隔水边界附近抽水试验数据的新方法[J]. 工程勘察，2006 126–29. GUO Jianqing， ZHENG Li， LEI Yuping， et al. Linear regression to identify aquifer parameters and the position of imper- vious boundary by using the data from pumping tests[J]. Geo- technical Investigation Surveying，2006126–29. [11] 郭建青，李彦. 粒子群优化算法在确定河流水质参数中的应用[J]. 水利水电科技进展，2007，2761–5. GUO Jianqing，LI Yan. Application of particle swarm optimi zation algorithm in determination of the river water quality pa- rameters[J]. Advances in Science and Technology of Water Re- sources，2007，2761–5. [12] 张全兴，常安定. 利用差分进化算法反求含水层参数[J]. 煤田地质与勘探，2008，36554–57. ZAHNG Quanxing，CAHNG Anding. Estimation of hydro- geological parameters using differential evolution algorithm[J]. Coal Geology Exploration，2008，36554–57. 责任编辑张宏 ChaoXing

展开阅读全文

机器学习算法反求水文地质参数_强玲娟.pdf

资源标签

最新标签