资源描述:
第 45 卷 第 1 期 煤田地质与勘探 Vol. 45 No.1 2017 年 2 月 COAL GEOLOGY 2. Shandong Provincial Key Laboratory of Depositional Mineralization and Sedimentary Minerals, Shandong University of Science and Technology, Qingdao 266590, China; 3. Shandong Geological Engineering Investigation Institute, Jinan 250014, China Abstract Water inrush is one of the major disasters in coal mining, water inrush occurs, rapidly and accurately judging water inrush water is vital for flood control. When identifying the mixed water, Fisher discriminant analy- sis can only confirm the most similar group, resulting in miscalculation, so on the basis of Fishers dis- criminant analysis theory the centroid distance uation was introduced to eliminate possible mixed water sample data, it can improve the accuracy of determination results. For this purpose, 13 kinds of hydrochemistry ions were selected as a discriminant factor, 30 representative samples as training sample to establish discriminant function model, using the discriminant function model and uation index of center of mass, six single water samples taken from specific aquifers and 4 mixed water samples from sump were verified and analized, after in- troduction of centroid distance uation and analysis, the discriminant accuracy increased from 60 to 83.3. The research results show that using the centroid distance uation analysis after Fisher discriminant analysis is very useful to improve the accuracy of determination results. Keywords mine water inrush; water chemical analysis; Fisher discriminant analysis ; centroid distance ua- tion 突水水源是水害事故发生的源头[1],不同的突 水水源具有不同程度的突水危险性,必须及时准确 的对突水水源进行识别。水源识别方法包括地下水 水化学特征法、同位素法、水温法、水位动态观测 法等。由于不同含水层有不同的岩性组成,因此不 同含水层的水化学特征有较大的差异。选用水化学 ChaoXing 第 1 期 孙福勋等 基于 Fisher 判别分析和质心距评价法的矿井水源判别 81 因子判断突水水源不但经济合理,而且快速准确。 利用水化学特征判断突水水源的方法有很多,大多 采用多元统计分析方法,建立合理的数学模型来实 现,如张许良等[2]应用数量化理论建立了焦作矿区 的突涌水水源的判别模型; 张瑞钢等[3]利用可拓识 别方法判别矿井突水水源; 徐忠杰等[4]将 BP 神经网 络模型运用到矿井水源判别中; 孙亚军等[5]利用 GIS 可视化技术将模糊综合评判结果直观显示;邓清海 等[6]应用主成分分析法找出了水源的主成分,并建 立了主成分分析法和贝叶斯判别分析相结合的模 型;陈红江等[7]提出了基于统计学理论的 Fisher 判 别分析理论,形成了矿井突水水源识别的新方法。 以上方法都对单一水源起到良好的判别效果,本文 在 Fisher 判别分析理论的基础上,引入质心距评价 分析,可以对判别结果的可靠性进行评价,对于判 别结果可靠性差的样本可以采取其他判别方法进行 判别,从而减少实际应用中的误判。 1 理论与算法 1.1 Fisher 判别分析法 判别分析是在分类数目已知的情况下,根据已 经确定分类对象的某些观测指标和所属类别来判断 未知对象所属类别的一种统计学方法。判别分析法 首先需要对所研究对象进行分类,进一步选择若干 对观测对象能够较全面地描述的变量,然后按照一 定的判别准则,建立一个或多个判别函数,用研究 对象的大量资料确定判别函数的待定系数,并计算 判别指标。对未确定的个案只需将其代入判别函数 就可以判断它属于哪一类总体[8]。 Fisher 判别函数亦称典则判别函数,计算的数 值为二维空间的点,其基本思想是利用投影技术, 将 k 组 p 数据投影到某个方向,即根据方差分析思 想构造判别函数 01 12 2 pp y xcc xc xc x,构 造出的判别函数依次命名为函数 1,函数 2,函数 3 等。使组类间差异越大越好,从而使组与组之间 的投影尽可能分开。对于新样本 X,将其 p 个指标 值代入判别函数求出 y 值,然后与判别临界值进行 比较,从而进行判别归类[9]。 为了检验上述判别准则的可靠性,笔者采用以 训练样本为基础的交叉验证。把训练样本作为新样 本依次代入建立的判别函数中,并利用已建立的判 别准则来判别。设被误判的个数总计为 n 个,参与 判别的个数为 N 个,则误判率可表示为 100 n N η 1 1.2 质心距评价法 质心距评价分析的基本思想就是尽可能的保 证判别结果的可靠性,对可靠性差的判别结果进 行剔除,宁可不对可靠性差的样本进行判别,也 要保证判别结果的可靠性,从而减少对实际结果 的误导。 质心距是某一待测水样投影点与各组别中心投 影点之间的距离,即 22 12 [][] i jijij Rz xozxp-- 2 式中 oj、pj分别为聚类中心在函数 1 和函数 2 上 的投影值, j1,2,3,4。z1xi、z2xi分别是 由判别函数 1 和 2 计算出的函数值,xi为某一样 本数据。 最优质心距即寻找待判样本投影点与各组别中 心投影点的最小值,即 1234 min{,,,} iiii RRRRR 3 式中 Ri1代表了待判样本投影点与Ⅰ组中心投影点 之间的距离,Ri2代表了待判样本投影点与Ⅱ组中心 投影点之间的距离,Ri3代表了待判样本投影点与Ⅲ 组中心投影点之间的距离,Ri4代表了待判样本投影 点与Ⅳ组中心投影点之间的距离。 质心距评价就是利用了最优质心距的大小来评 价判别结果的可靠程度,最优质心距 R 值越大表明 待判样本投影点与最相近的组别中心投影点之间的 距离越大,表明判别结果越不可靠。值得指出的是, 质心距评价只能用来评价判别结果的可靠程度,并 不能直接说明判别结果的对错。判别结果可靠程度 高的水样代表判别正确的可能性大,但不等同于判 别结果正确。 2 矿井水源判别模型的建立 2.1 样本指标的选定 地下水在形成过程中,由于受到含水层的沉积 期、地层岩性、建造和地化环境等诸多因素的影响, 使储存在不同含水层中的地下水主要化学成分有所 不同[10]。因此,通过对一个矿区多个主要含水层的 水质进行统计分析,可以近似地把具有相似化学成 分的地下水归结为同一含水层。其次,不同含水层 之间的部分离子浓度差异较大,具有较强的分辨能 力,将这部分离子选为主要评价指标可以最大程度 的保证分析结果的正确性。为了保证数据的有效性 和全面性,把部分微量离子也作为判别指标,选用 NaKX1,Ca2X2,Mg2X3, Fe2X4, Fe3X5, 4 NHX6,Cl-X7, 2 4 SO - X8, 3 HCO-X9, 2 3 CO - X10, 3 NO-X11, 2 NO-X12共 13 种离子的浓度作 ChaoXing 82 煤田地质与勘探 第 45 卷 为突水水源识别模型的水质指标。 2.2 判别分析模型的建立 兖矿集团济宁三号煤矿位于山东省济宁市石桥 镇, 自投产以来发生过多次突水事故, 曾一度出现工 作面局部被淹导致停产, 对矿井的安全高效生产构成 了较大的威胁。 该矿井主要充水含水层有 Ⅰ第四系 下组含水层,Ⅱ侏罗系砂岩含水层,Ⅲ煤系顶板砂 岩含水层和Ⅳ奥灰含水层,分别简称为Ⅰ、Ⅱ、Ⅲ、 Ⅳ。 从其水质分析台账中选取 30 个具有代表性的水 样作为训练样本表 1, 选取 6 个取自特定含水层的 单一水样和 4 个取自水仓的混合水样作为待检样本 表 2。 表 1 济三煤矿训练样本的变量资料 Table 1 Variable data of training samples in Jining coal mine No.3 水化学成分指标 样品 编号 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 实际 结果 回判 结果 R 值 1 60.58 90.32 26.34 0.120.00 0.00 62.76127.15298.750.000.000.00 Ⅰ Ⅰ 1.41 2 62.00 84.00 29.85 0.000.10 0.00 58.33136.13261.650.000.860.00 Ⅰ Ⅰ 1.08 3 55.28 111.75 39.72 0.000.78 0.12 23.56268.7923.160.001.710.06 Ⅰ *Ⅳ 2.08 4 263.26 28.46 8.75 0.040.10 0.00 48.93468.70106.5321.220.000.03 Ⅱ Ⅱ 1.72 5 161.48 38.82 19.97 0.000.20 0.00 49.27263.95236.470.000.000.00 Ⅱ Ⅱ 2.09 6 232.12 27.61 9.07 0.000.10 0.00 47.86403.27151.030.000.000.00 Ⅱ Ⅱ 1.45 7 214.73 25.88 9.76 0.060.44 0.00 49.63334.96188.080.000.000.00 Ⅱ Ⅱ 0.74 8 113.53 67.18 21.43 0.020.08 0.90 90.76436.62284.960.000.800.85 Ⅱ Ⅱ 0.79 9 197.66 84.35 9.06 0.900.00 0.00 52.47257.66229.310.000.000.02 Ⅱ *Ⅳ 2.14 10 220.51 68.63 2.97 0.600.00 0.40 113.53373.9997.040.0019.522.00 Ⅱ Ⅱ 0.38 11 22.65 15.96 3.15 0.000.12 0.38 59.98289.84162.100.012.600.30 Ⅱ Ⅱ 0.86 12 84.43 116.54 38.26 0.000.02 0.05 62.98311.84247.790.012.301.75 Ⅱ Ⅱ 0.31 13 201.32 34.46 37.17 0.020.06 0.10 31.80429.24232.090.010.000.02 Ⅱ Ⅱ 0.72 14 273.15 51.05 14.20 0.010.09 0.15 25.54521.01203.080.000.000.00 Ⅱ Ⅱ 1.04 15 338.54 80.40 20.93 0.000.85 0.20 21.35793.23174.070.000.030.00 Ⅱ Ⅱ 3.03 16 264.40 7.56 5.16 0.000.07 0.10 41.71309.78254.910.000.560.07 Ⅱ Ⅱ 0.71 17 284.48 50.35 11.70 0.000.07 0.08 45.24322.78505.430.000.640.03 Ⅱ Ⅱ 1.81 18 311.50 28.53 6.11 0.000.24 0.20 41.16273.51544.580.000.600.06 Ⅱ Ⅱ 1.99 19 275.92 44.89 10.18 0.000.16 0.20 40.76369.04367.270.000.870.03 Ⅱ Ⅱ 1.07 20 343.89 33.56 11.45 0.000.32 0.25 38.72306.69587.180.000.100.01 Ⅱ Ⅱ 2.38 21 344.06 24.75 7.89 0.080.08 0.35 63.17415.29294.740.001.420.07 Ⅱ Ⅱ 0.82 22 292.47 40.28 11.45 0.000.07 0.03 40.35321.78452.470.000.320.01 Ⅱ Ⅱ 1.29 23 316.70 61.28 16.28 0.000.22 0.20 40.35438.42419.080.000.090.02 Ⅱ Ⅱ 0.98 24 543.05 4.13 0.95 0.001.10 0.02 62.9421.811 077.72 121.960.000.00 Ⅲ Ⅲ 1.62 25 517.00 2.13 2.32 0.000.00 0.10 41.712.501 250.430.010.000.00 Ⅲ Ⅲ 1.47 26 686.92 4.14 1.51 0.000.07 0.35 71.499.921 617.300.003.520.01 Ⅲ Ⅲ 1.95 27 22.68 95.31 32.44 0.000.02 0.00 19.45172.83260.060.000.000.01 Ⅳ Ⅳ 0.53 28 17.57 90.66 35.26 0.000.02 0.00 19.54166.66254.330.000.000.01 Ⅳ Ⅳ 0.60 29 114.84 378.80 60.02 0.000.50 0.10 66.201230.40251.150.000.000.00 Ⅳ *Ⅰ 2.26 30 29.19 93.25 30.86 0.000.12 0.00 18.51140.32278.490.000.000.00 Ⅳ Ⅳ 0.42 *回判结果与实际结果不相符的样本 ChaoXing 第 1 期 孙福勋等 基于 Fisher 判别分析和质心距评价法的矿井水源判别 83 表 2 济三煤矿已知结果的待检样本资料 Table 2 Data of sampleswith known results to be inspected of Jining coal mine No.3 水化学成分指标 样品 编号 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11X12 实际 结果 Fisher 判别 R 值 31 259.79 41.99 16.04 0.060.30 0.02 49.99507.38168.130.00 0.000.00 Ⅱ Ⅱ 1.96 32 248.66 46.38 11.30 0.000.07 0.03 42.81344.39298.580.00 1.200.07 Ⅱ Ⅱ 1.25 33 243.76 34.01 6.19 0.000.07 0.03 41.71315.89294.500.00 0.090.03 Ⅱ Ⅱ 0.64 34 575.00 4.80 3.64 0.000.00 1.00 50.1713.051 163.00108.640.240.40 Ⅲ Ⅲ 5.07 35 18.63 92.99 33.29 0.000.02 0.00 19.54165.42255.910.00 0.000.01 Ⅳ Ⅳ 0.49 36 19.11 95.13 29.44 0.000.14 0.00 19.61138.26307.110.00 0.000.04 Ⅳ Ⅳ 0.94 37 282.41 55.27 20.64 1.960.07 0.03 18.38485.05280.024.75 2.540.24 混合水 Ⅱ 0.63 38 666.25 8.05 4.88 1.250.07 0.35 46.07903.50481.330.00 6.554.25 混合水 Ⅲ 26.35 39 705.31 14.91 4.13 0.640.08 0.03 35.271 053.60485.680.00 0.600.08 混合水 Ⅲ 14.54 40 676.67 21.30 3.87 5.070.07 0.35 45.771 117.91283.410.00 0.000.01 混合水 Ⅱ 12.71 笔者结合 Fisher 判别分析理论,利用 SPSS22.0 数据统计软件,根据已知的 30 个训练样本推导出 Fisher 线性判别函数,各判别函数表达式如下 第 1 判别函数 Z1X-0.006X1-0.067X2-0.029X31.266X4 1.751X5-5.015X60.037X70.019X80.012X9 0.002X10-0.275X114.114X12-6.503 4 第 2 判别函数 Z2X-0.002X10.02X20.035X30.223X4 0.234X50.689X6-0.016X7-0.006X80.006X9 0.033X100.244X11-1.72X12-1.124 5 第 3 判别函数为 Z3X-0.014X1-0.002X2-0.068X31.474X4- 4.426X50.977X6-0.093X70.011X80.007X9 0.058X100.138X111.249X122.654 6 如表 1 所示,利用 Fisher 回判函数对训练样本进 行自检时, 30 个训练样本有 27 个样本得到正确回判, 误判率为 10,说明推导出的判别函数可信度很高。 在 Fisher 判别分析中,判别方程量可以用其方 差所占的比例来解释[7]。表 3 为典则判别函数附加 特征值。由表 3 可知,第 1 判别函数的方差贡献率 达到了 71.6,第 2 判别函数的方差贡献率为 23.5,二者可以解释待检样品 95.1>85的信 息。图 1 所示为运用第 1 和第 2 判别函数进行分组 的示意图,据此可以清晰地看到各水样投影点的位 置,并根据不同符号表示的投影点区分各组别。 表 3 典则判别函数附加特征值 Table 3 Additional eigenvalue of canonical discriminant functions 函数 特征值 方差贡献 率/ 累积方差 贡献率/ 典型相关 系数 1 20.674 71.6 71.6 0.977 2 6.801 23.5 95.1 0.934 3 1.406 4.9 100.0 0.764 图 1 第 1 和第 2 判别函数的分组图 Fig.1 Block diagram of first and second discriminant function 表 4 所示为第 1 和第 2 判别函数在各组别的中 心值。以第 1 判别式为例,其在第Ⅰ类含水层的中 心值为-6.602,在第Ⅱ类含水层的中心值为 1.363, 在第Ⅲ类含水层的中心值为 7.236, 在第Ⅳ类含水层 的中心值为-7.290。 表 4 各典则判别函数在各类别含水层的中心值 Table 4 Central values of different canonical discriminant functions in various aquifers 函数 Ⅰ Ⅱ Ⅲ Ⅳ 第1判别函数 -6.602 1.363 7.236 -7.290 第2判别函数 1.324 -1.521 5.977 2.129 2.3 判别分析及结果 根据式2和式3计算 R 值, 结果见表 1 和表 2。 由计算结果可知,训练样本的 R 值最大值为 3.03, 最小值为 0.31,平均值为 1.32,如表 1 所示。R 值 代表了判别结果的不可靠程度,即 R 值越大判别结 果越不可靠。由分析可知,可以定义 R≤1.32 为可 靠性好,1.32<R≤3.03 为可靠性中等,R>3.03 为 可靠性差。对于可靠性差的判别分析结果应采取其 他判别方法进一步验证,使之与实际结果相符。 ChaoXing 84 煤田地质与勘探 第 45 卷 判别分析结果如表 2 和图 1 所示。 从表 2 Fisher 判别结果可知,若是进行简单的 Fisher 判别,4 个 混合水样全部被判别为单一水样,显然与实际情况 不符,其准确率仅为 60;若在此基本上加上质心 距评价法分析,对判别结果可靠性差的水样进行剔 除,剩余的 6 个待判水样只有 37 号水样误判,其准 确率为 83.3。由此可见,基于 Fisher 判别分析和 质心距评价法分析的水源判别模型可以降低 Fisher 判别分析模型的误判率, 提高了判别结果的准确度。 3 结 论 a. 图 1 中Ⅰ和Ⅳ含水层的组中心投影点在判别 函数分组图中距离较近,说明二者的水化学组成近 似,从而反映了奥灰与第四系含水层有较强的水力 联系。 b. 采用的判别因子越多,判别效果越好,但数 据处理过程越复杂。有些离子如 Ca2,Na,Cl-, 2 4 SO - 是水的基本化学组成,而有些含量较少的离 子如 Fe2,Fe3,NH4却能起到指示剂的作用,在 水源判别分析中应予以重视。 c. 在 Fisher 判别分析的基础上,增加了质心 距评价分析,R 值可以很好地衡量判别结果的不可 靠性,可以对可靠性很差的待检样本进行剔除,从 而减少误判。但是 R 值仅作为辅助分析,应在仔细 分析样本数据的基础上给出 R 值的取值范围, 在保 证较高判别准确率的基础上剔除较少的待检样本 数据。 参考文献 [1] 魏久传,肖乐乐,牛超,等. 20012013 年中国矿井水害事 故相关性因素特征分析[J]. 中国科技论文,2015,103 336-341. WEI Jiuchuan,XIAO Lele,NIU Chao,et al. Characteristics analysis of the correlation factors of China mine water hazard accidents in 2001-2013[J]. China Science Paper,2015,103 336-341. [2] 张许良,张子戌,彭苏萍. 数量化理论在矿井突涌水水源判 别中的应用[J]. 中国矿业大学学报,2003,32342-45. ZHANG Xuliang, ZHANG Zixu, PENG Suping. Application of the second theory of quantification in indentifying gushing wa- ter sources of coal mines[J]. Journal of China University of Mining Technology,2003,32342-45. [3] 张瑞钢,钱家忠,马雷,等. 可拓识别方法在矿井突水水源判 别中的应用[J]. 煤炭学报,2009,34133-38. ZHANG Ruigang,QIAN Jiazhong,MA Lei,et al. Extension identification application in mine water inrush water cri- terion[J]. International Journal of Coal Science Technology, 2009,34133-38. [4] 徐忠杰, 杨永国, 汤琳. 神经网络在矿井水源判别中的应用[J]. 煤矿安全,2007,3824-6. XU Zhongjie,YANG Yongguo,TANG Lin. Application of BP neural network in uation of water source in mine[J]. Safety in Coal Mines,2007,3824-6. [5] 孙亚军,杨国勇,郑琳. 基于 GIS 的矿井突水水源判别系统 研究[J]. 煤田地质与勘探,2007,35234-37. SUN Yajun,YANG Guoyong,ZHENG Lin. Distinguishing system study on resource of mine water inrush based on GIS[J]. Coal Geology Exploration,2007,35234-37. [6] 邓清海,曹家源,张丽萍,等. 基于主成分分析的矿井突水水 源 Bayes 判别模型[J]. 水文地质工程地质, 2014, 416 20-25. DENG Qinghai,CAO Jiayuan,ZHANG Liping,et al. The Bayesian discrimination model for sources of mine water inrush based on principal components analysis[J]. Hydrogeology En- gineering Geology,2014,41620-25. [7] 陈红江,李夕兵,刘爱华,等. 用 Fisher 判别法确定矿井突水 水源[J]. 中南大学学报自然科学版, 2009, 404 1114-1120. CHEN Hongjiang,LI Xibing,LIU Aihua,et al. Indentifying of mine water inrush sources by Fisher discriminant analysis [J]. Journal of Central South UniversityScience and Technology,2009,4041114-1120. [8] 朱星宇,陈勇强. SPSS 多元统计分析及应用[M]. 北京清华 大学出版社,2011. [9] 陈胜可. SPSS 统计分析从入门到精通[M]. 北京清华大学出 版社,2010. [10] 高卫东, 何元东, 李新社. 水化学法在矿井突水水源判断中的 应用[J]. 矿业安全与环保,2001,28544-45. GAO Weidong,HE Yuandong,LI Xinshe. Hydration application in mine water inrush water source judgment[J]. Min- ing Safety Environmental Protection,2001,28544-45. 责任编辑 张宏 ChaoXing
展开阅读全文