资源描述:
2013 年 6 月 June 2013 岩矿测试 ROCK AND MINERAL ANALYSIS Vol. 32,No. 3 483 ~486 收稿日期 2012 -10 -21; 接受日期 2013 -02 -07 基金项目 武警黄金指挥部黄金专项费项目之金矿石系列标准物质研制 HYJ12 -06 作者简介 杨理勤, 高级工程师, 主要从事金及多金属分析技术研究和质量控制研究。E- mail ylqgold163. com。 文章编号 02545357 2013 03048304 常量金标准物质定值中离群值的统计识别 杨理勤1,穆新华2,郑振云2 1. 武警黄金地质研究所,河北 廊坊065000;2. 武警黄金第二总队,河北 廊坊 065000 摘要 离群值的剔除常用数理统计的方法, 如格拉布斯检验法和迪克逊检验法等, 但是这些统计方法用于常 量金标准物质分析结果的统计检验, 都存在着对离群值剔除明显不够的问题。本文建立了以常量金重复分 析相对偏差允许限为依据的离群值统计识别方法, 包括统计计算待定值样品中金的算术平均值 珋x 和相对偏 差允许限 YG, 确定合格的测定结果的数据区间, 从而识别出离群值并予以剔除; 一次剔除后, 按照新的统计 量确定下一轮的离群值剔除范围, 直到无离群值后, 给出金的平均值及其波动范围。以 15 个人工组合的常 量金标准物质为例, 模拟金标准物质定值分析, 以密码形式分派给不同单位和分析者, 共收集 10 套独立分析 结果, 采用本法剔除离群值后, 所得金算术平均值与金标准参考值更加接近, 其相对偏差的质量分数为0. 35, 达到优秀; 而格拉布斯法 或迪克逊法 和中位值法的质量分数分别为 0. 42 和 0. 40, 只能达到良好。应用本 文建立的离群值统计识别方法, 质量分数等级有了明显提高, 增强了数据统计分析的有效性。 关键词 常量金; 标准物质; 离群值; 统计识别; 质量分数 中图分类号 O614. 123; TQ421. 31; O212文献标识码 A 离群值影响中心趋向值, 在标准物质定值之前 必须剔除离群值, 使中心趋向值更加符合真值。离 群值产生的原因主要来自样品均匀性和样品分析过 程两个方面, 由于自然金的良好延展性使常量金样 品可能因为 “粒金效应” 而导致均匀性变差, 所以常 量金标准物质定值中离群值的检验尤为重要。在标 准物质研制中, 离群值的统计识别是定值数据统计 处理的重要环节 [1 ]。 常量金标准物质候选物来自金矿石, 物相分析 证实不同类型金矿石中金的赋存状态不同 [2 -3 ] , 不 同类型金矿石制备流程有所不同, 在样品细碎阶段 加助磨剂克服“粒金效应” 的金矿石加工方法 [4 ]在 标准物质研制中已有应用。分析结果中产生离群值 的原因主要来自样品均匀性和分析过程 方法、 条 件、 操作等 出现偏差两个方面 [5 -6 ]。通过了均匀性 检验的样品, 其分析结果出现离群值的主要原因来 自分析过程, 其中分析方法尤其重要。目前常用的 常量金的分析方法以全湿法为主, 按金的预富集方 法主要有活性炭富集法和泡塑吸附法; 按测定方法 主要有碘量法和原子吸收光谱法 [7 ]。火试金法能 对样品完全熔解和对金完全富集 [8 -10 ], 所以通常推 荐用于金矿石标准物质定值分析, 但因其操作过程 复杂并不常用。国内从首次成功研制常量金标准物 质以来, 采用的分析方法是以活性炭富集 - 原子吸 收法光谱为主 [11 ]。 一般情况下, 标准物质定值分析数据需要用统 计方法处理; 分析工作中, 由于操作过失产生的异常 结果可以借助观察和记录人为剔除 [12 ]。而剔除离 群值目前还没有统一的方法, 大多数是根据数理统 计方法进行处理, 如格拉布斯 Grubbs 检验法、 迪克 逊 Dixon 检验法等, 这些方法存在着对离群值剔除 明显不够的问题。在金的标准物质定值数据的统计 处理中, 也是普遍采用格拉布斯检验或迪克逊检验 判断和剔除离群值 [13 ]。虽然已有报道[14 ]应用非传 统统计理论如灰色误差理论识别岩矿测试数据中的 离群值, 其优点是不受数据分布类型的限制, 但对于 常量金分析结果离群值的检验, 其效果与常规方法 相比没有明显改进。而选用有资质的实验室、 有经 验的分析人员和采用适当的分析方法参加均匀性检 验和定值分析 [15 -16 ], 可以减少或避免离群值的出 现, 使标准物质推荐值的不确定度 [17 -18 ]满足有关要 求。本文建立了以常量金重复分析相对偏差允许 384 ChaoXing 限 [19 ]为依据的离群值统计识别方法, 应用于人工组 合常量金标准物质分析数据的统计检验, 剔除离群 值后所得的算术平均值更加接近标准参考值。 1方法原理 1. 1离群值的统计识别 统计某样品常量金全部测定数据的算术平均值 珋x, 按如下公式确定单次测定结果的相对偏差允许限 YG14. 43 1. 2 珋x -0. 3012 100 设△ 珋x YG/100, 确定为合格结果的数据区间 为 珋x - △, 珋x △ , 此区间外的测定结果认为是离 群值。 1. 2离群值的剔除 按照 1. 1 节确定的范围剔除离群值; 然后统计 余下数据的算术平均值、 相对偏差允许限、 合格结果 的数据区间, 再次剔除离群值; 反复迭代, 直到无离 群值为止。 2应用举例 2. 1数据来源 2012 年 1 月上旬, 武警黄金第二总队举办了常 量金分析技能现场比赛, 场地设在武警黄金地质研 究所测试室。参加人员由第二总队所属 4 个支队择 优选派, 每队 3 人, 共 12 人, 样品共 15 件, 委托中国 地质科学院地球物理地球化学勘查研究所配制, 配 制所用样品均为金的有证标准物质, 配制好的样品 的密码编号为 G1 ~ G15, 含量范围为 0. 2 10 -6 ~ 50 10 -6。限定的分析方法有 2 种 ①试样经焙烧、 王水溶解后采用活性炭富集 - 原子吸收光谱法测 定; ②试样经焙烧、 王水溶解后采用泡塑吸附 - 原子 吸收光谱法测定。要求每队报 2 套数据, 共 8 套数 据; 数据揭秘之前, 武警黄金地质研究所测试室有关 人员参加了实验, 提供 2 套数据, 本文所用数据共 10 套, 其中活性炭法 7 套, 泡塑法 3 套。本文第一 作者受邀, 制订了现场样品比赛结果量化评分方案。 2. 2格拉布斯检验和迪克逊检验法 15 件样品的原始数据见表 1。用格拉布斯法和 迪克逊法对15 组原始数据分别进行了离群值的统计 检验, 结果未发现离群值。各组数据的算术平均值及 其相对偏差的允许限见表 1。从表 1 可见, 用格拉布 斯法和迪克逊法没有检验出离群值, 而本文建立的检 验方法却第一轮识别出 19 个异常值, 初步显示出该 方法能够克服传统检验方法对离群值剔除不够的缺 点。为了得到不含离群值的统计结果, 剔除第一轮识 别出的离群值后对其余数据进行进一步的检验。 表 1密码标样分析结果统计 Table 1Statistics of analytical results for password standard samplesw Au / μgg -1 样品 编号 实验室和分析者代号 12345678910 统计量 珋x1△1 G10.45 0.38 0.34 0.33 0.52 0.51 0.51 0.54 0.50 0.50 0.46 0.10 G43.20 3.15 2.82 2.44 3.62 3.63 3.58 3.43 3.50 3.47 3.28 0.40 G813.0 11.9 13.4 13.6 13.0 13.1 11.5 10.8 12.1 11.8 12.4 1.01 G11 22.5 23.4 23.5 24.4 23.0 23.1 22.3 21.8 23.4 22.3 23.0 1.55 G15 50.5 49.0 48.5 49.6 48.3 48.5 54.3 47.8 51.3 47.8 49.5 2.65 G21.10 1.16 0.88 0.94 1.25 1.25 1.26 1.23 1.16 1.22 1.14 0.19 G67.51 6.72 7.57 7.42 8.21 8.18 7.50 7.55 7.93 7.59 7.62 0.72 G914.8 14.7 14.3 14.3 15.1 15.2 16.2 14.3 14.4 15.1 14.8 1.14 G12 27.3 28.2 28.6 29.9 27.0 27.2 27.6 28.3 27.6 26.9 27.9 1.77 G14 41.1 41.0 41.4 41.1 40.5 40.8 39.2 37.7 41.3 37.8 40.2 2.29 G32.26 2.34 2.16 1.91 2.21 2.23 2.42 2.46 2.25 2.51 2.28 0.31 G55.37 5.47 4.60 5.12 5.86 5.88 6.09 5.37 4.84 5.07 5.37 0.56 G79.97 9.14 8.81 8.74 8.95 8.92 9.95 9.50 9.16 8.50 9.16 0.81 G10 20.9 20.3 20.1 20.1 21.1 21.1 18.3 18.5 19.6 19.0 19.9 1.40 G13 31.7 30.2 32.4 33.8 32.2 32.6 31.1 31.7 32.1 29.7 31.7 1.94 注 ①原始数据提供者 梁立忠、 江小丽、 孙鹏、 谢璐、 刘淑亮、 张汝生、 温良、 周远洋、 黄北川、 王开琦、 伊力哈木、 司德勇、 李玄辉、 冯亮、 艾晓军、 聂凤 莲; ②表中背景为黄色的数据为中位值, 背景为棕色的数据为离群值。 2. 3离群值的识别与剔除 按 1. 1 节和 1. 2 节对表 1 中的 15 组原始数据 进行处理, 在其中 13 组数据中共识别出离群值 20 个, 剔除离群值后的各组数据及其算术平均值和 相对偏差允许限列于表 2。 表 2剔除离群值后样品分析数据统计 Table 2Statistics of analytical data after excluding outliers w Au / μgg -1 样品 编号 实验室和分析者代号 12345678910 统计量 珋x2△2 G10.450.52 0.51 0.51 0.54 0.50 0.50 0.50 0.10 G43.20 3.153.62 3.63 3.58 3.43 3.50 3.47 3.45 0.41 G813.0 11.9 13.413.0 13.1 11.512.1 11.8 12.5 1.01 G11 22.5 23.4 23.5 24.4 23.0 23.1 22.3 21.8 23.4 22.3 23.0 1.55 G15 50.5 49.0 48.5 49.6 48.3 48.547.8 51.3 47.8 49.0 2.63 G21.10 1.161.25 1.25 1.26 1.23 1.16 1.22 1.20 0.20 G67.517.57 7.42 8.21 8.18 7.50 7.55 7.93 7.59 7.72 0.72 G914.8 14.7 14.3 14.3 15.1 15.214.3 14.4 15.1 14.7 1.13 G12 27.3 28.2 28.627.0 27.2 27.6 28.3 27.6 26.9 27.6 1.76 G14 41.1 41.0 41.4 41.1 40.5 40.8 39.241.340.8 2.31 G32.26 2.34 2.162.21 2.23 2.42 2.46 2.25 2.51 2.32 0.31 G55.37 5.475.12 5.86 5.885.37 4.84 5.07 5.37 0.56 G79.97 9.14 8.81 8.74 8.95 8.92 9.95 9.50 9.16 8.50 9.16 0.81 G10 20.9 20.3 20.1 20.1 21.1 21.118.5 19.6 19.0 20.1 1.41 G13 31.7 30.2 32.4 33.8 32.2 32.6 31.1 31.7 32.132.0 1.95 注 表中背景为黄色的数据为中位值; 背景为棕色的数据为离群值, 已剔除。 484 第 3 期 岩矿测试 http ∥www. ykcs. ac. cn 2013 年 ChaoXing 从表2 可见, 经过2 轮迭代剔除离群值 棕色背 景, 数据已剔除 后, 保留下来的数据均为有效数 据, 由此得到的统计量作为下一步质量评价的依据。 3结果与讨论 3. 1离群值剔除的适度 密码标样解密后, 以每个样品的标准参考值为 依据, 计算出单次测定合格结果的数据区间, 进而识 别出离群值共 26 个 表 1 中红色数据 , 作为实际 存在的离群值。按 1. 1 节和 1. 2 节识别出离群值 20 个, 其中 17 个与实际离群值重合, 识别离群值的 命中率大于 65; 有 3 个不吻合, 属于剔除过度, 剔除离群值的准确度为 85。 3. 2分析结果的质量参数 珋x1 、 珋 x2分别代表经过格拉布斯法和本方法剔除 离群值后样品分析结果的算术平均值, x中、 x0分别代 表中位值和标准参考值, RD1、 RD2、 RD中分别代表相 应的相对偏差, YG代表相对偏差允许限, FQ1、 FQ2、 FQ中代表质量参数。有关数据见表 3。 表 3不同方法的质量参数统计 Table 3Statistics of quality parameters of the different s 样品 编号 统计量 珋x1珋x2x中x0 相对偏差与允许限 RD1RD2RD中YG 质量分数 FQ1FQ2FQ中 G10.46 0.50 0.50 0.53 13.98 5.66 5.66 20.97 0.67 0.27 0.27 G43.28 3.45 3.45 3.62 9.28 4.70 4.70 11.75 0.79 0.40 0.40 G812.4 12.5 12.6 12.3 0.84 1.33 2.44 8.13 0.10 0.16 0.30 G1123.0 23.0 23.0 23.3 1.40 1.40 1.29 6.71 0.21 0.21 0.19 G1549.7 49.1 49.3 48.5 2.43 1.24 1.65 5.38 0.45 0.23 0.31 G21.14 1.20 1.19 1.25 8.47 3.84 4.80 16.19 0.52 0.24 0.30 G67.62 7.72 7.56 8.03 5.13 3.89 5.85 9.25 0.56 0.42 0.63 G914.8 14.7 14.8 15.1 1.75 2.75 1.99 7.64 0.23 0.36 0.26 G1227.9 27.6 27.6 27.3 2.05 1.21 1.10 6.40 0.32 0.19 0.17 G1440.2 40.8 40.9 40.2 0.02 1.49 1.74 5.69 0.00 0.26 0.31 G32.28 2.32 2.26 2.52 9.72 8.10 10.3213.11 0.74 0.62 0.79 G55.37 5.37 5.37 5.51 2.59 2.49 2.54 10.36 0.25 0.24 0.25 G79.16 9.16 9.04 9.52 3.74 3.74 5.04 8.78 0.43 0.43 0.57 G1019.9 20.1 20.1 19.4 2.52 3.46 3.61 7.09 0.36 0.49 0.51 G1331.7 32.0 31.9 30.5 4.07 4.81 4.59 6.19 0.66 0.78 0.74 平均值--------0.42 0.35 0.40 表 3 显示了三种不同方法得到的样品中心趋向 值与标准参考值的相对偏差的质量分数 ①用格拉 布斯法或迪克逊法没有发现离群值, 15 个样品算术 平均值的质量分数的平均值为 0. 42, 属于良好; ②用本文方法从原始数据中识别并剔除 20 个离群 值后, 15 个样品算术平均值的质量分数的平均值为 0.35, 属于优秀; ③选用每个样品原始数据的中位值 作为中心趋向值, 15 个样品算术平均值的质量分数 的平均值为 0. 40, 属于良好。可见, 以本法识别和 剔除常量金标样分析结果中的离群值后, 所得数据 的算术平均值与标准参考值更加接近, 与格拉布斯 法或迪克逊法剔除离群值后统计的算术平均值、 中 位值法确定的中心趋向值相比, 质量分数等级有了 明显提高。 4结语 本文以常量金定值分析数据为研究对象, 是基 于常量金标准物质定值分析之前已经通过样品均匀 性检验消除了由此引起的离群值, 针对分析过程可 能产生的离群值, 建立了以常量金重复分析相对偏 差允许限为依据的离群值统计识别方法 将分析 测试过程中产生的不合格数据视为离群值。以本法 识别和剔除常量金标样分析结果中的离群值后, 所 得数据的算术平均值与标准参考值更加接近, 与格 拉布斯法或迪克逊法剔除离群值后统计的算术平均 值、 中位值法确定的中心趋向值相比, 质量分数等级 有了明显提高。建立的方法使离群值的剔除适度合 理, 离群值的识别与贯彻现行分析测试质量管理规 范相统一。 由于常量金分析流程较长, 影响分析质量的因 素较多, 各实验室的设备条件、 人员水平、 采用的方 法等都会有差异, 产生离群值的原因难以一一明确, 因此在数据统计处理之前需要进行数据审核, 以排 除各种非随机因素的影响, 增强数据统计分析的有 效性。 5参考文献 [ 1]JJG 100694, 一级标准物质技术规范[ S] . [ 2]唐肖玫, 姚敬劬. 化学物相分析方法研究矿石中金的 赋存状态[ J] . 岩矿测试, 1992, 11 1 -2 162. [ 3]王峰, 郭茂生, 王凯, 周红, 叶青, 余侃萍. 金矿石化学 物相分析标准物质的研制[J] . 岩矿测试, 2006, 25 3 263 -269. [ 4]张连起, 于阗. 含明金岩石样品加工方法的探讨[J] . 化学工程与装备, 2010 5 95 -96. [ 5]金浩. 标准物质及其应用技术[M] . 北京 中国标准 出版社, 1990 277. [ 6]王晓红, 王毅民, 高玉淑, 樊兴涛. 地质标准物质检验 方法评介与探讨[J] . 岩矿测试, 2010, 29 6 739 - 745. [ 7]岩石矿物分析编写组. 岩石矿物分析 第四版 第三 分册 [ M] . 北京 地质出版社, 2011 617 -639. 584 第 3 期杨理勤, 等 常量金标准物质定值中离群值的统计识别第 32 卷 ChaoXing [ 8]弗兰柯 W波狄史. 金银的火试金分析 之一 [J] . 黄金, 1987, 8 6 63 -64. [ 9]弗兰柯 W波狄史. 金银的火试金分析 之二 [J] . 黄金, 1988, 9 1 63 -65. [ 10] 弗兰柯 W波狄史. 金银的火试金分析 之三 [J] . 黄金, 1988, 9 2 60 -63. [ 11] 中国有色金属工业总公司矿产地质研究院. MGI - Au -01 ~ MGI - Au - 04 金银地质标准参考样的研制 [ J] . 黄金, 1983, 4 6 54 -65. [ 12] 储亮侪. 化学分析中的质量保证[M] . 西安 陕西 科学技术出版社, 1983 38 -39. [ 13] 王根荣. 标准物质的制备定值及数据处理[ J] . 上海 计量测试, 2002, 29 4 43 -45. [ 14]陈月源, 曹成东, 袁秀茹, 魏轶, 谈建安. 灰色误差 理论在岩矿测试数据处理中的应用[J] . 岩矿测试, 2009, 28 6 576 -582. [ 15] 杨理勤, 冯亮, 李玄辉, 陈占生. 高含量金标样的均匀 性分析检验[ J] . 岩矿测试, 2009, 28 4 388 -390. [ 16] 杨理勤, 宋艳合, 李文良, 卿敏. 金标样定值中全金量 的湿法分析[ J] . 岩矿测试, 2004, 23 1 75 -76. [ 17]鄢明才. 地球化学标准物质标准值不确定度估算 探讨[ J] . 岩矿测试, 2001, 20 4 287 -293. [ 18] 郑存江. 地质标准物质不确定度评估方法初探[J] . 岩矿测试, 2005, 24 4 284 -286. [ 19]DZ/T 01302006, 地质矿产实验室测试质量管理 规范[ S] . Statistical Identification of Outliers in Ore Gold Reference Material to Determine the Optimal Value YANG Li- qin1,MU Xin- hua2,ZHENG Zhen- yun2 1. Gold Geology Institute,Chinese Armed Police Force,Langfang065000,China; 2. No. 2 Gold Geological General Party,Chinese Armed Police Force,Langfang065000,China Abstracts The s of mathematical statistics were used to distinguish outliers, such as the Grubbs test and the Dixon test. These s have not completely identified outliers for statistical tests of the analytical results for constant gold standard samples. An outlier statistical recognition based on the multiple analysis of relative deviation for constant gold,including the arithmetic mean of gold in the samples,its relative deviation allowable limits in accordance with DZ/T 130. 32006 and determination of qualified interval of the measurement results in order to identify and remove outliers has been established. After removing the furthest outliers,the whole process was conducted for the next round to remove less obvious outliers until no more outliers were found. The arithmetic mean and its fluctuation range of the gold measurement results were produced. 15 artificial ore gold standard samples were assigned to different laboratories and analyzed with passwords by using the standard sample analysis . A total of 10 sets of independent analysis results were collected. According to the established to remove outliers,the obtained arithmetic mean value was closer to the certified value than that by the Grubbs test and the Dixon test. The relative deviation of the quality fraction was 0. 35,which was excellent. However,the relative deviations of the quality fraction by either Grubbs test or Dixon test and the median value respectively were 0. 42 and 0. 40,which were also good. The quality fraction level has been significantly improved by the outlier statistical recognition described in this paper,which enhanced the effectiveness of statistical analysis of data. Key words ore gold; reference material; outliers; statistical identification; quality fraction 684 第 3 期 岩矿测试 http ∥www. ykcs. ac. cn 2013 年 ChaoXing
展开阅读全文