用经验模型判断能力验证统计分析结果的合理性_孙海容.pdf-_矿业文库_煤矿文库_有色文库_金属矿山文库_矿山安全_煤矿安全_采矿技术措施

资源描述：

2012 年 12 月 December 2012 岩矿测试 ROCK AND MINERAL ANALYSIS Vol． 31，No． 6 992 ～996 收稿日期 2012 －06 －20; 接受日期 2012 －07 －10 基金项目中国合格评定国家认可委员会科技项目 2011CNAS11 ; 国家重大科学仪器设备开发专项 2011YQ14014708 作者简介孙海容，高级工程师，主要从事实验室质量控制与管理研究。E- mail sunhr cnas． org． cn。通讯作者李玉武，研究员，从事大气颗粒物化学组分分析表征、来源解析及测量结果不确定度评估研究。E- mail liyuwucneac．com。文章编号 02545357 2012 06099205 用经验模型判断能力验证统计分析结果的合理性孙海容1，李玉武2* 1．中国合格评定国家认可中心，北京100062;2．国家环境分析测试中心，北京 100029 摘要能力验证是检测实验室识别与同行差异的一种途径，但中国合格评定国家认可委员会 CNAS 在组织能力验证时发现由于种种原因，有些实验室并不能秉承诚信的原则参加能力验证活动，导致统计分析结果 “失真” 。如何甄别这种情况，确保所有参加 CNAS 能力验证活动的实验室都获得公平的评价，这是 CNAS 亟待解决的问题。本文在用国内文献数据对经验模型进行修正的基础上，提出用上报数据目标标准偏差或稳健标准偏差， sR 与基于经验模型的计算值之比 H 值是否小于 0． 5 作为判据来审核上报数据统计分析结果的合理性。对 13 套能力验证数据分析表明其中 10 套上报数据 sR正常， 3 套数据存在问题。当目标标准偏差偏小， H ＜0． 5 时，建议采用同样是稳健统计方法的迭代法代替四分位法来计算目标标准偏差 sR ，或用经验模型计算结果代替实验值计算 Z 值。通过验证表明，借助 Horwitz 经验模型可以判断能力验证数据统计分析结果的合理性，并能有效地识别并防止由于某种原因导致对能力验证结果评价失效的情况。关键词检测能力评价; 经验模型; Horwitz 函数表达式中图分类号 X132; O242文献标识码 A uation of the Statistic Parameter of Rationality in Proficiency Testing by the Empirical Model SUN Hai- rong1，LI Yu- wu2* 1． China National Accreditation Service for Conity Assessment，Beijing100062，China; 2． National Research Center for Environmental Analysis and Measurements，Beijing100029，China Abstract Proficiency testing is a good approach to find the difference between individual laboratories in the same field． However，it was found that statistical results in the proficiency testing reports organized by CNAS were distorted since some laboratories reported the analysis data not based on their own experiments． How to identify this situation and ensure all participants to obtain a fair uation is a problem that needs to be urgently solved for CNAS． In order to uate the rationality of the statistical results，a ratio be called as H of target standard deviation robust standard deviation，sR to those calculated by the empirical model modified by experimental data collected from a large number of proficiency testing reports in the domestic environmental field as a criterion is proposed in this paper． Thirteen sets of data in recent years were used to validate this criterion． The results show that target standard deviations of ten sets of data are within the normal range and the part of robust parameters in three sets of data are much smaller compared to those calculated by this model． The causes for these situations were analyzed． It was suggested that the target standard deviation be calculated based on algorithm recommended by ISO 13528，and the Z- score be calculated by the calculated value from the model instead of the target standard deviation from experimental data when H is smaller than 0． 5． The validation results showed that it is possible to uate the rationality of a statistical parameter in proficiency testing based on a modified Horwitz function， effectively identifying and preventing the situation in which the statistical results are distorted by some anthropogenic factors． Key words proficiency testing; empirical model; Horwitz function expression 299 ChaoXing 近年来，在国家认监委和中国合格评定国家认可委员会 CNAS 的大力推动下，检测能力验证活动越来越受到检测实验室的重视。按照 CNAS 相关要求，实验室对检测能力表中各项目均应按一定频次定期参加有资质单位组织的能力验证活动，其结果直接成为监督评审和复评审中主要客观证据。 CNAS 在组织能力验证时发现，由于种种原因，有些实验室并不能秉承诚信的原则参加能力验证活动，导致上报数据统计分析结果“失真” 。如何甄别这种情况，确保所有参加 CNAS 能力验证活动的实验室都获得公平的评价，这是 CNAS 亟待解决的问题。本文介绍了一种审核并判断检测能力验证数据统计分析结果合理性的有效判据，并用 13 套能力验证计划数据作为应用实例对解决方案进行了验证。 1数据处理方法 1． 1统计分析计算公式及能力评价原则能力验证数据统计分析通常采用稳健 Robust 技术处理，即采用稳健统计的中位值为指定值，标准化四分位距 NIQR 为变动性度量值目标标准偏差。参加实验室的 Z 比分数值按下式计算 Z x － X /σ 式中 x实验室测试结果; X指定值; σ变动性度量值目标标准偏差。能力验证计划涉及的统计量有结果数、中位值、标准化四分位距 NIQR 、稳健的变异系数 CV 、最小值、最大值和极差等。各统计量的意义及相关计算方法参见文献［ 1］。能力验证以 Z 比分数评价参加实验室的结果，即 |Z|≤2 为满意结果; 2 ＜ |Z| ＜3 为有问题结果; |Z|≥3 为不满意结果离群值。 1． 2经验模型与 Horwitz 函数 Horwitz 函数［2 －5 ］描述了分析浓度 c 与分析精密度再现性标准偏差 sR 之间的关系，由美国 Horwitz［2 ］于 20 世纪 80 年代提出，此函数是目前文献中经验模型最为经典和简洁的数学表达式。它有三种表达方式［3 ］， s 0． 02c0． 850 其中 s、 c 均为质量浓度 ; sRSD2c －0． 15和 s RSD2 1 －0． 5lgc c 和 s RSD单位均为。20 世纪 20 ～ 90 年代几万次数据的验证都证明了其正确性［4 ］。据发表的实验数据分析结果和结论来看［2 －5 ］，此函数表达式中分析结果精密度只与分析浓度有关，而与样品类型、基体、检测项目、分析方法无关。此经验模型已在能力验证数据处理、不确定度评估得到应用［6 －12 ］。 2数据来源本文数据均取自 CNAS 于 2006 ～ 2012 年组织的水质样品、土壤、沉积物、化妆品、粮食大米、茶叶中重金属检测能力验证计划结果报告，或承担单位以报告数据为基础公开发表的论文［13 －15 ］。 3结果与讨论 3． 1问题分析表 1 和表 2 分别列举了检测能力验证活动上报数据统计分析结果出现异常的 2 个实例。水中 Cr Ⅵ 的检测数据中，部分实验室报出的数据与中位值 0． 150 mg/L、 0． 250 mg/L 相比，两者差别不大，但被判定为“有问题” 。从表 2 可以看出，土壤样品重金属含量在标准示值范围内的检测数据，也出现在 “有问题” 数据之列。通常的解释是，此批能力验证数据太集中，目标标准偏差偏小。有各种原因可能导致出现这种现象。如数据上报前可能已 “相互通报” ［16 ］，数据被人为修正，其他实验室样品测试结果事先通过一些渠道得知等等。已有一些措施来避免数据串通，如采用数组样品分发不同参加单位。如果能利用一种数学方法协助对目标标准偏差合理性进行评估，结合专业经验判断，将有效甄别这种情况，确保所有参加 CNAS 能力验证活动的实验室都获得公平的评价。表 1水中 Cr Ⅵ 检测能力统计分析结果示例 Table 1Examples of conclusions in proficiency testing report on determination of Cr Ⅵ in water 检测结果 ρB/ mgL －1 样品 a 0．150* 样品 b 0．250* 实验室间 Z 比分数 ZB 实验室内 Z 比分数 ZW 结果评价 0．1490． 244－2．50－4．00不满意 0．1550． 2522．50－2．00有问题 0．1520． 2480．00－2．86有问题 0．1540． 2501．50－2．86有问题 0．1550． 2491．50－5．00不满意 0．1480． 2520．002．54有问题 0．1490． 2530．502．54有问题 0．1530． 2542．500．00有问题注标注 “* ” 为中位值。 3． 2统计分析结果合理性判据为了避免评价结论受到“非正常” 统计数据的影响，使评价结论更客观，笔者曾经尝试用上报数据是否是正态分布作为一个客观判据。但结果表明，很多能力验证项目的上报数据并不具备正态分布。 399 第 6 期孙海容，等用经验模型判断能力验证统计分析结果的合理性第 31 卷 ChaoXing 表 2土壤中重金属元素检测能力统计分析结果示例 Table 2Examples of conclusions in proficiency testing report on determination of metals in soil sample 元素 wB/ mgkg －1 标准值测定值 Z 比分数结果评价 Cu26．3 1．7 24． 7－2． 70有问题 27． 82． 22有问题 25． 0－2． 22有问题 27． 92． 38有问题 As11．4 0．710． 7－2．33有问题 Ni32．8 1．7 34． 42． 08有问题 31． 4－2． 08有问题 Hg0． 021 0． 004 0．0170－2．55有问题 0．02382． 27有问题据文献［ 3］报道， Horwitz 函数的一个重要应用是用于考察、判断能力验证数据统计分析结果的合理性。其方法是用参加能力验证各实验室上报数据的统计值稳健标准偏差 sR实验与经验模型计算值 sR计算的比值 H sR实验/sR计算来判断。研究结论［3 ］表明，当 H ＜0． 5 时，能力验证数据的稳健标准偏差 sR过于乐观; 如果 H ＞ 2，说明上报数据的统计值 sR值得怀疑，数据精度比预期要差，参加检测能力验证的实验室间水平相差较大。如果 0． 5 ＜ H ＜2，则表示能力验证统计数据正常。根据长期积累的能力验证数据来判断，实验值与预测值之比明显小于 0． 5 或大于 2 均属于小概率事件，当出现这种情况时，应认真分析原因。有的检测能力验证组织单位直接采用 sR计算代替标准化四分位距参与计算 Z 值来判断上报数据是否满足要求［6 ］。上报数据统计计算的标准化四分位距或稳定标准偏差是随着每一轮次能力验证实验室的变化而改变，参加实验室无法根据各轮次 Z 值的变化来评价自己检测能力的进展。在避免采用偏小的标准化四分位距导致 “合格性” 判据过严的错误的同时，采用修正后的 Horwitz 函数计算 Z 值也可让实验室可以关注其检测能力进展。 3． 3改进型 Horwitz 函数表达式表 3 列举了改进型 Horwitz 函数表达式。首先，采用分段函数细化了 Horwitz 表达式，不同浓度对应不同表达式［6 ］。然后，根据质量目标不同，采用不同系数［9 ］。例如，据文献［ 9］介绍，纯地球化学和应用地球化学研究领域测试数据质量要求不同。前者分析结果被用于地球化学研究，因此，需要特别仔细以获取高准确度的数据，有时需以降低样品产出率为代价。后者准确度虽然仍很重要，但主要目的是为地球化学填图或化探项目搜集的大量样品提供结果。因而面对不同质量要求，可采用不同系数。如土壤、沉积物能力验证、标样协作定值数据可采用 sR0． 080 c0． 850，此表达式与国内文献数据拟合的经验模型 sR 0． 072 c0． 851基本相符［10 ］。一般情况下如客户要求不高时，可采用 sR0． 160 c0． 850。对于以 mg/L 表示结果的水质样品常规检测项目及无机元素，利用国内标样协作定值及检测能力验证计划数据对经验模型进行了修正［10 ］，其表达式为 sR0． 0284 c0． 951。这些最新研究成果为计算目标标准偏差提供了有效方法。表 3改进型 Horwitz 函数表达式 Table 3Improved Horwitz function 浓度 w/ gg －1 Horwitz 函数表达式文献［ 7 ］ w/ 文献［ 7 －9 ］ w/ mgkg －1 文献［ 10 ］ w/ mgkg －1 文献［ 10 ］ ρ/ mgL －1 土壤、沉积物等固体样品 c ＜0．12 10 －6 sR0．22c －－－ 0．12 10 －6 ＜c ＜0．138 sR0．020c0． 850 sR0．160c0． 850 sR0．080c0． 850 sR0．072c0． 851sR0．0284c0． 951 c ＞0．138sR0．010c0． 50－－－水质样品－－－－sR0．0284c0． 951 3． 4统计分析结果合理性判断示例表 4 列举了 13 套检测能力验证统计分析结果合理性判断示例，包括水中 Cr Ⅵ ，水中重金属，土壤、沉积物、化妆品、粮食大米、茶叶中重金属的检测。用检测能力验证结果上报数据目标标准偏差标准化四分位距与基于经验模型的计算值之比 H 是否小于 0． 5 进行判断。13 套数据验证结果表明，大多数检测项目能力验证数据目标标准偏差正常， H 值处于正常范围。其中 3 套数据可能存在问题。2011 年组织的 Cr Ⅵ 检测能力验证项目数据过于集中，目标标准偏差偏小， H ＜0． 5，这将直接影响部分实验室上报数据合格性判断。而 2009 年相同检测项目的数据 H ＞0． 5，其上报数据统计分析结果正常。2012 年水中铅、镉的检测数据中，第Ⅱ组和第Ⅴ组 Cd 的目标标准偏差偏小，应引起关注。 499 第 6 期岩矿测试 http ∥www． ykcs． ac． cn 2012 年 ChaoXing 表 4能力验证统计分析结果合理性判断示例 Table 4Examples for evatuation of statistic result rationality in proficiency testing reports 检测项目中位值目标标准偏差 sR* 实验值计算值 H 2012 年水中铅、镉的测定值 ρB/ mgL －1 Pb Ⅰ1．550．0220．0430．51 Cd Ⅰ0． 1100．00220． 00350．63 Pb Ⅱ1．070．0220．0300．73 Cd Ⅱ0． 1510．00150． 00470．32 Pb Ⅲ1．300．0220．0360．60 Cd Ⅲ0． 1300．00300． 00410．74 Pb Ⅳ1．060．0220．0300．73 Cd Ⅳ0． 2290．00440． 00700．63 Pb Ⅴ0． 8550．0150．0240．61 Cd Ⅴ0． 1300．00150． 00410．37 2011 年水中六价铬的测定值 ρB/ mgL －1 Cr Ⅵ 0． 1500．00150． 00470．32 0． 2500．00150． 00760．20 2009 年水中六价铬的测定值 ρB/ mgL －1 Cr Ⅵ 0． 4000．00890． 01190．75 0． 4990．00820． 01460．56 2011 年土壤中微量元素的测定值 wB/ mgkg －1 As11．40． 300． 630．48 Cr70．52． 082． 980．70 Cu26．40． 631． 290．49 Ni32．90． 721． 560．46 Pb22．50． 741． 130．65 Zn69．21． 522． 930．52 Cd0．08210．00370． 00960．39 Hg0．02060．00140． 00300．48 2012 年沉积物中重金属的测定值 wB/ mgkg －1 Cu58．62． 022． 550．79 Zn1726．496． 361．02 Pb52．04． 412． 301．92 Cd1．030．2340．0822．85 Cr85．85． 043． 521．43 Mn97030． 427． 71．10 Ni39．21． 721． 810．95 Hg0． 1340．0140．0141．00 As25．31．81．21．50 2010 水中铅、镉和砷的测定值 ρB/ mgL －1 Ⅰ Pb0． 8940．0160．0250．64 Cd Ⅰ0． 1060．00350． 00341．03 As Ⅰ0．08100．00440． 00261．69 Pb Ⅱ1．100．0370．0311．19 Cd Ⅱ0． 1240．00450． 00391．15 As Ⅱ0．07040．00230． 00231．00 Pb Ⅲ1．180．0300．0330．91 Cd Ⅲ0． 1150．00300． 00360．83 As Ⅲ0．06050．00250． 00201．25 Pb Ⅳ0． 8560．0160．0240．67 Cd Ⅳ0． 1340．00440． 00421．05 As Ⅳ0．09300．00320． 00301．07 续表 4 2011 年水中铜锌铅镉镍铬的测定值 ρB/ mgL －1 Cu 1．100．0220．0310．71 0．8070．0160．0210．76 Zn 0．3060．00670．00920．73 0．3740．0100．0110．91 Pb 1．200．0300．0340．88 1．400．0400．0391．02 Cd 0．1110．00300．00350．86 0．1520．00440．00470．94 Ni 0．5970．00900．0170．53 0．5030．0100．0150．67 Cr 0．4960．00940．0140．67 0．7000．0190．0200．95 2006 年砂质土壤组分的测定值 wB/ mgkg －1 Cu 17．550．960． 911．05 14．950．700． 800．88 Pb 32．301．721． 531．12 32．552．081． 541．35 Mo 3．290．270． 221．23 2．060．160． 151．08 V 54．651．962． 400．82 84．992．373． 490．68 Zn 50．552．082． 250．93 84．703．563． 481．02 2008 年粮食中铅、镉的测定值 wB/ mgkg －1 Pb1．3250．1270．1021．24 Cd0．0700．00600．00830．72 2008 年大米中镉的测定值 wB/ mgkg －1 Cd 0．2660．0160．0260．62 0．1780．0170．0180．94 2010 年化妆品中重金属的测定值 wB/ mgkg －1 Pb 21．50．631． 090．58 25．41．831． 251．46 As 12．21．410． 672．10 10．50．890． 591．51 2011 年化妆品中重金属的测定值 wB/ mgkg －1 Pb 32．01．261． 520．83 33．74．341． 592．73 As 3．460．340． 231．48 3．420．420． 231．83 2009 年茶叶中重金属的测定值 wB/ mgkg －1 Pb 2．170．190． 151．23 1．940．130． 140．93 注 “* ” 是为便于比较，部分目标标准偏差数据有效位数多保留了 1 位。土壤中大部分重金属检测项目 2011 年的 H ＜0． 5，由此判断，这些重金属的检测数据的分布也是不正常的。用于判断数据“合格性” 的目标标准偏差过小将导致 “有问题” 的数据偏多，将会使部分实验室受到不公平评价。出现这种情况时，建议采用同样是稳健统计方法的迭代法［17 ］代替四分位法来计算目标标准偏差 sR ，或用经验模型计算结 599 第 6 期孙海容，等用经验模型判断能力验证统计分析结果的合理性第 31 卷 ChaoXing 果代替实验值计算 Z 值［6 ］。水中铜、锌、铅、镉、镍、铬检测和水中 Pb、 Cd、 As 检测两套数据用 H 进行判断，均属正常。其中采用四组数据分发不同参加单位的上报数据 H 值平均值为 0． 985，从而证明了 H 判据的合理性。表 4 还列举了沉积物、化妆品、粮食大米及茶叶中重金属检测能力数据汇总结果。用 H 判据进行判断，大多数重金属目标标准偏差基本上在正常范围，仅有部分能力验证计划项目中 Cd、 As、 Pb 精密度数据数值有些偏高，导致 H ＞ 2。这些数据表明，部分实验室对相关样品中的 Cd、 As、 Pb 的检测能力有待提高。这些结果与专业判断相符。表 4 结果表明，借助 Horwitz 经验模型可以判断能力验证数据统计分析结果的合理性，并能有效地识别并防止由于某种原因导致对能力验证结果评价失效的情况。 4结语经水样、土壤、沉积物、化妆品、粮食、茶叶等检测能力验证项目数据验证，描述分析物浓度与再现性标准偏差之间函数关系的经验模型及其 H 比值判据，可用于识别能力验证数据统计分析结果的可信度，以保证判断能力评价结论的合理性，方法简便有效。用于验证 H 判据的 13 套数据中， 3 套数据部分检测项目统计分析结果存在问题，其他 10 套数据正常，验证结果与专业经验判断相符。当目标标准偏差偏小，其数值与经验模型计算值的比值 H ＜0． 5 时，为确保所有参加 CNAS 能力验证活动的实验室获得公平的评价，建议采用迭代法代替四分位法来计算目标标准偏差 sR ，或用经验模型计算结果代替实验值计算 Z 值。有关四分位法与迭代法计算结果的比较将另文发表。下一步的研究工作计划是用更多可靠实验数据不断完善经验模型。声明本文作者特别声明，本文提出的判据仅是一种数据分析方法探索，不代表中国合格评定国家认可中心的观点。 5参考文献［ 1］中国合格实验室评定委员会． CNAS GL02 2006，能力验证结果的统计处理和能力评价指南［ S］．［ 2］Horwitz W． uation of analytical s used for regulation of foods and drugs［ J］． Analytical Chemistry， 1982， 54 67A －76A．［ 3］Massart D L，Verbeke J S，Heyden Y V． Benchmarking for analytical s The horwitz curve［J］． LC- GC EUROPE， 2005， 18 10 1 －4．［ 4］Boyer K W， Horwitz W， Albert R． Interlaboratory variability in trace element analysis［ J］． Analytical Chemistry， 1985， 57 454 －459．［ 5］Thompson M． The amazing Horwitz function［ R］． AMC Technical Brief No 17． 2004．［ 6］鲍蕾，包振民，吕宁，金莹，梁成珠，昃向君，张艺兵，门爱军，许艳丽，吴振兴，孙静克．中国出口花生黄曲霉毒素检测能力验证研究［J］．食品科学， 2009， 30 24 381 －384．［ 7］Thompson M． Recent trends in interlaboratory precision at ppb and sub- ppb concentrations in relation to fitness- for- purpose criteria in proficiency testing［J］． Analyst， 2000， 125 385 －386．［ 8］Heyden Y V，Verbeke J S． Set- up and uation of interlaboratory studies［ J］． Journal of Chromatography A， 2007， 1158 158 －167．［ 9］中国科学院地质与地球物理研究所．微量元素分析实验室，测定结果的国际对比［ EB/OL］． http ∥www． igg． cas． cn/jgsz/zcxt/sygcxt/ggsys/wlys/200908/t20090804 _2312309． html．［ 10］李玉武，狄一安，孙海容，曹实，任立军，周昊，郭婧，杨勇杰，王斗文．用经验模型评估环境样品测量不确定度［ J］．中国无机分析化学， 2012， 2 1 1 －8．［ 11］ Thompson M， Lowthian P J． The Horwitz function revisited ［ J］． Journal of AOAC International， 1997， 80 3 676 － 679．［ 12］ Thompson M， Ellison S L R， Wood R． The international harmonizedprotocolfortheproficiencytestingof analytical chemistrylaboratories IUPACTechnical Report ［J］． Pure and Applied Chemistry，2006，78 1 145 －196．［ 13］甘露，王苏明，吴晓军．砂质土壤组分检测能力验证结果分析［ J］．岩矿测试， 2007， 26 5 409 －412．［ 14］孙屏，于利军．大米中镉的测定能力验证［ J］．粮食与饲料工业， 2009 10 46 －48．［ 15］李海峰，史乃捷，王军，唐一川，马联弟．聚类分析与稳健统计方法对 CNAS T0402 数据处理的比较和分析［ J］．现代农业科技， 2009 6 258 －263．［ 16］冯仁丰．再谈我对不确定度的看法［ J］．临床实验室， 2012， 6 6 69 －72．［ 17］ISO 13528 2005 EStatistical s for Use in Proficiency Testing by Inter- Laboratory Comparisons ［ S］． 699 第 6 期岩矿测试 http ∥www． ykcs． ac． cn 2012 年 ChaoXing

展开阅读全文

用经验模型判断能力验证统计分析结果的合理性_孙海容.pdf

资源标签

最新标签