资源描述:
第5 6 卷第3 期 2004 年8 月 有色金属 N o n f e r r o u sM e t a l s V 0 1 .5 6 ,N o .3 A u g u s t2 0 0 4 用变精度粗糙集理论确定矿石 估算规则和公式的方法 黄光球,陆秋琴,崔华丽 西安建筑科技大学,西安7 1 0 0 5 5 品位 摘要用变精度粗糙集理论提出了定性和定量因素融合、品位控制点数据的自动组合和相对重要性的确定、无用因素的清 除等一系列方法,获取矿石品位估算规则和公式的原理和算法。所提出的方法可自动确定任何多因素复杂条件下的矿石品位估 计公式及其使用规则,且准确率很高。 关键词采矿工程;矿石品位;变精度粗糙集理论;规则;公式 中图分类号T D 8 5 1 ;F 4 0 7 .1 文献标识码A文章编号1 0 0 1 0 2 1 1 2 0 0 4 0 3 0 1 1 8 0 4 对于不同的矿体,矿石品位估计方法有许多种, 如距离幂次反比法⋯I 、地质统计学法【2J 、人工神经 网络方法[ 3 】3 、遗传算法和遗传规划方法[ 4 - 5 】等,所 有这些方法存在一些缺陷。 1 定性因素大量被忽略。矿石品位估算中许 多定性因素,如矿体分布形态、岩石性质、地质条件 .等等,均未能考虑进来,而有些是品位估算至关重要 的影响因素。 2 一个矿体仅用一种或少数几种品位估算方 法。因矿体分布的随机性、区域性和地质条件的复 杂性,决定了矿石品位估算方法的必然多样性。 3 仅从某种假设出发评估品位控制点对待估 点的贡献率。对一个品位待估点来说,不同品位控 制点对待估点的贡献不一样,控制点对待估点的贡 献率的评估方法决定了品位估算方法甚至品位估算 公式形态,基于某种假设评估品位控制点对待估点 的贡献率是不合适的。 理想的方法应该是不受人为因素影响,不依赖 假设,完全基于实测数据自动确定一个矿体在不同 分布和地质条件下的品位估算方法,这些方法要考 虑定性和定量因素的融合、适用于不同的使用条件、 科学评估控制点对待估点的贡献率,实质就是如何 在品位控制点实测数据中挖掘出品位估算规则和公 式。粗糙集理论提供了完成这一工作的技术方 法[ 6 l 。 收稿日期2 0 0 3 1 2 2 0 基金项目陕西省教育厅专项基金资助项目 0 1 J K l 2 4 作者简介黄光球 1 9 6 4 一 ,男,湖南桃源县人,教授,博士,主要从 事矿业系统工程的研究 1 基本原理 1 .1 品位估算规则和公式挖掘数据结构 假设已知的品位控制点为o 】,0 2 ,⋯,o N ,依 据矿体赋存条件,每个控制点对应着一系列因素,如 空间位置、岩石、矿石和伴生矿石种类、赋存特点及 其物理力学性质、矿床地质条件、地质勘探情况等 等,这些因素有些是定性的,有些是定量的,可用式 1 数据结构描述。 O i Q i l ,Q i 2 ,⋯,Q 打,⋯,Q 缸,M 1 ,N i 2 ,⋯, N i ∥一,N 如i 1 ,2 ,⋯,p 1 式中Q 西和M i 分别为定性因素 个数为M 和定量 因素 个数为秒 对应的实际数据。为方便起见,把式 1 中定性和定量因素统称为属性,属性集合用A 表示,统记为A { 6 /1 ,n 2 ,一,口。 。} o 控制点i 对应 的实际测量数据称为控制点数据对象,用o i 表示。 采集到的全部数据用【,表示,是所有控制点数据对 象的集合,即U { 0 】,0 2 ,⋯,o 。} 。为了发现控制 点数据对象集合中蕴涵的品位估算规则和公式,必 须选择一个属性作为决策属性,记为集合D 。显然, 决策属性就是控制点品位属性,即D { 控制点品 位} ;其他属性作为条件属性,记为C ,其中对于定性 因素属性记为Q ,对于定量因素属性记为N 。确定 品位估算规则和公式的粗糙集模型是要构造基于图 1 的一种层次化模型。 图1 底层叶子结点为定量型属性,最后可得不 同定性属性条件下的规则和公式相对应的定量因素 属性。对于定量因素属性,最后通过某种合适的方 法获取品位估计公式,文献[ 1 5 ] 介绍的方法均可 万方数据 第3 期 黄光球等用变精度粗糙集理论确定矿石品位估算规则和公式的方法t , t 9 使用。然而,这样的品位估计公式是一系列的,对应 不同的使用条件,归并过程可剔除无用的定性因素 属性和定量因素属性,区分采集到的无用的和重要 的控制点数据等。 图1 基于控制点数据对象的规则和公式提取层次 F i g .1H i e r a r c h yf o rr u l e sa n df o r m u l af i n d i n gb a s e d o nd a t ao b i e c t sa tc o n t r o lp o i n t s 1 .2 品位估计规则发现基本原理 品位估计规则发现是利用定性因素对定量数据 进行分类,以实现定性和定量因素的融合。融合的 结果,表现为如下的应用规则。 如果待估控制点满足定性和 或 定量因素条件 C n l ,G 2 ,⋯,C 。,则⋯⋯; 如果待估控制点满足定性和 或 定量因素条 件C 6 l ,C 6 2 ,,C 6 。,则⋯⋯; ●●●●●●- 品位估计可适用的定量属性集合为N 。 { M - ,%z ,⋯,心} ,可用的控制点数据对象为q { O g l ,0 9 2 ,⋯,o 耵} 。 不同的应用规则分别拥有不同的控制点数据对 象集合o g 和定量属性集合N g 。利用N g 和o g 获取 的品位估计公式只可在其对应规则下使用。 应用规则的发现需借助数据泛化技术。数据泛 化的常用方法是属性迁移和概念树提升技术[ 7 | ,逐 个属性进行泛化,最后得到一个如图1 所示的树形 层次泛化关系。对于控制点数据对象集合L ,及其 属性集合A ,给定 1 属性集合H A 一{ 决策属 性} ,H a { 可泛化属性a ; 即将A 中那些不可泛化 的属性剔除后留下的属性 } ,H 4 ∈H ; 2 属性a f 对应的属性阈值t ;和支持属性a ;泛化的全部控制点 数据对象在整个控制点数据对象集合中所占的比例 P ,则数据泛化算法如下。 令m P lUI ,V U ,I .I 表示集合的基 数;计算每个属性在U 中不同取值的个数d i ;若lV I ≥m 并且d i t i 则重复计算 i 1 ,2 ,⋯,JH 。 I { 选择属性a f ,使a £∈A ,并满足d ‘/t i 最大;如果 属性口;是可泛化的,则在吃中将a ;的层次提升一 级,并在y 中对a ;下的属性进行替换,否则从y 中 删除属性a 。;删除V 中重复控制点数据对象,重新 计算每个属性的d i } 。 数据泛化算法产生的结果,就是形成如图1 所 示的树形层次图。从树形层次图的根开始,沿某分 枝向下遍历到叶子,便形成一个应用规则。 1 .3 品位估计公式影响因素发现基本原理 1 .3 .1 关键影响因素的确定。对于每个规则下的 定量属性集合N 。,不同的定量属性对品位估计公 式的影响不同,有些属性甚至无用。把不同定量属 性对品位估计公式的影响程度计算出来,对最终形 成品位估计公式具有重要意义。基于粗糙集模型的 属性归约过程非常简单。 1 确定等价类[ 6 】,将控制点数据对象分组。 设g i 和毋分别为控制点数据对象o t 和o f 对应的品 位,£为正常数,若O ,和o j 满足I 毋一毋I ≤£,则 将控制点数据对象o i 和o i 分到同一组。这样所有 控制点数据对象【,被分割成若干子集,每个子集称 为一个等价类,用U /I N D D 表示。 2 计算近似集,确定控制点数据对象的可用 性。对于任何一个控制点数据对象子集X ,控制点 品位 决策属性D 的卢下近似集R 一脑和卢上近似 集R y x 为R 一秘 U { y ∈U /I N D D Ic y , x ≤口} ;R 牌 U { y ∈U /I N D D Ic y , X 0 时,C y ,X 1 一lXn yl /lXI ,当IXl 0 时,C y ,X 0 ;J 9 为分 类错误率,0 ≤p 0 .5 。控制点品位的卢下近似集包 含了那些具有精确含义的控制点数据对象,即完全 可用的控制点数据对象。控制点品位的口上近似集 包含了那些具有精确含义和不具有精确含义的控制 点数据对象,即可能存在无用的控制点数据对象。 3 计算条件属性对决策属性的依赖度,确定对 品位估计公式具有重要意义的属性。利用条件属性 集C 和决策属性集D 之间的依赖程度,可以确定一 个属性a 的重要性。属性集C 对D 的依赖程度用 y R ,D ,J 9 表示,y R ,D ,卢 lP O S R ,D ,卢 I / ul ,P O S R ,D ,卢 U R I x , x ∈ 【,/肋 C 。 不同属性对于决定条件属性和决策属性之间的 依赖起着不同的作用。属性a 加入C 后,对于分类 L ,/J N D D 的重要程度为S G F a ,C ,D ,J 9 y R ,D ,p 一y C 一{ a } ,D ,J 9 。 万方数据 1 2 0 有色金属第5 6 卷 4 确定冗余属性,进行属性约简,以便简化品 位估计公式。对于属性集C 和D ,属性a ∈C ,如果 P O S C ,D ,卢 P O S C 一{ a } ,D ,p ,贝4a 在属 性集C 中是冗余的,否则口在C 中对于D 是不可缺 少的。于是,对于条件属性集合C 中的每个属性,反 复约简冗余属性,最后剩下不可缺少的属性集合,记 为R E D C ,D ,卢 。 ,1 .3 .2 属性归约算法。属性归约算法就是利用上 述基本原理,计算最佳归约集。 1 计算分辨矩阵。控制点数据对象集中关于 条件属性集C 对决策属性集D 的分辨矩阵M C m f j 。。。是对称矩阵,只需计算m i j 1 ≤』≤i ≤ n 。如果O i ,o i ∈同一个等价类,则 i r r /打 空集; 如果C 在O i 中的值与o ;中不同,即o i ,o i ∈不同 等价类,则 m “ cEC 。 2 通过分辨矩阵求核心。核心是由分辨矩阵 内含单个元素的单元中的元素构成的集合,可作为 计算归约集的基础。对于任何c ∈C ,c 0 船 C , D { c ∈C m 打 { c } ,对于所有1 ≤J ≤i ≤r /} 3 计算最佳归约集。基于属性之间的依赖关 系、重要性,可以较容易且有效地找出一个最佳归约 集。对于实际数据对象集合u ,给定条件属性集c 、 决策属性集D ,令A R C ,则最佳归约集计算由5 步完成。 i 计算核心集C o R E ,R C O R E ,B R A R R E D U ; i i 对于每个属性aEB R ,计算属 性的重要性,并由大到小排序; i i i 若y R ,D ,卢 ≠7 A R ,D ,卢 ,则重复计算{ 选择属性aEB R ,使 S G F a ,R ,D ,p ~互4 X S G F 口l ,R ,D ,卢 ,a f ∈B R i 1 ,2 ,⋯,m ,R RU { a } ,B R A R 一 { a } } ,计算新的依赖程度y R ,D ,卢 ; i V 令N lRI ; V i 从0 到N 一1 ,重复计算{ 如果n i ∈ C O R EUu A ,贝4R R 一{ a f } ,计算y R ,D ,p , 如果y R ,D ,』9 ≠r A R ,D ,卢 ,贝UR RU k i } 。 该算法根据每个属性的重要性排序,每次选择 重要性最大的属性加入属性集R ,在步骤 ∽的前 向选择结束后,属性集R 已包含了一些起重要作用 参考文献 的属性,且不改变原始属性集与决策属性之间的依 赖程度。最后反馈过程是,从属性集R 中按重要性 由小到大,逐个去掉属性,如果去掉该属性会造成依 赖度变化,则恢复该属性,否则剔除该属性。最后剩 下的属性集就是最佳归约集。 1 .4 品位估计公式的应用步骤 1 依据具体问题,收集相关的定性或定量属 性,越全面越有利。 2 基于选定的属性,收集相关的品位控制点数 据。 3 利用最佳归约集进行属性归约,剔除一些不 必要的属性,防止树形层次图过大、层次过深。 4 属性归约完后,运用数据泛化算法生成如图 1 所示的树形层次图。利用该图,经过适当的整理, 生成一系列应用规则。每个应用规则表现为一些定 性和定量因素的某种逻辑组合,其中大部分定量属 性在树形层次图的底部层次,小部分定量属性分布 在树形层次图的其余层次,这小部分定量属性不再 列入用于公式发现的属性集,因为它们已含在应用 规则中。 5 从底部层次开始,缩减树形层次图的层次 级,分离出每个应用规则下的定量属性,并重新简化 整理每个应用规则。分离出来的定量属性,就是发 现品位估计公式的基础,不再含在应用规则中。 6 再次利用最佳归约橥算法对每个应用规则 的定量属性进行属性归约,确定最佳归约集,此为与 品位估计相关的关键定量因素。 7 删除控制点数据对象集【,中不属于最佳归 约集的属性和对应的控制点数据。利用约简后的数 据对象集用文献【1 5 ] 的方法发现计算公式。 2结语 运用变精度粗糙集理论提出了确定矿石品位估 计规则和公式的方法,方法原理简单,通用性强,只 要一次编成,即可确定任何多因素复杂条件下的矿 石品位估计公式及其使用规则。该方法可推广应用 于采矿工程任何规则和公式的发现。 [ 1 ] 王帖,金智求.距离幂次反比法的改进及参数优化[ J ] .中国矿业,1 9 9 4 ,3 4 6 8 7 2 . [ 2 ] 王仁铎,胡光道.线性地质统计学[ M ] .北京中国地质出版社,1 9 8 9 2 0 8 0 . [ 3 ] 黄光球.矿石品位推断的神经网络方法[ J ] .有色冶金设计与研究,1 9 9 6 ,1 7 2 7 1 2 . 下转第1 2 9 页,C o n t i n u e d0 1 2P .1 2 9 万方数据 第3 期喻 晗等G C M S 分析技术在矿冶环境科学研究中的应用1 2 9 参考文献 [ 1 ] 李长根.俄罗斯选矿述评[ J ] .有色金属 选矿部分 ,2 0 0 1 , s u p l 2 8 1 2 8 2 . [ 2 ] 栾和林,姚文.浮选药剂中典型污染物P A S H A 的G C M S 检出[ J ] .分析测试学报,2 0 0 1 ,2 0 1 8 6 1 8 8 . [ 3 ] 王宏.烷基酚聚氧乙烯醚类的环境雌激素效应[ J ] .中国环境科学,1 9 9 9 ,1 9 5 4 2 7 4 3 1 . [ 4 ] 姚文,栾和林.G C M S 检测萃取剂中内分泌干扰物[ J ] .分析测试学报,2 0 0 1 ,2 0 s u p l 1 8 3 1 8 4 . [ 5 ] 姚文,刘大星,李继梅,等.G C M S 检测C y a n e x 2 7 2 萃取剂研究[ J ] .有色金属2 0 0 1 ,5 3 1 3 5 3 7 . [ 6 ] 原福胜,马亚萍,武忠诚.不同粒径大气颗粒物中金属元素含量及其对人双核淋巴细胞微核率的影响[ J ] .卫生研究, 1 9 9 9 ,2 8 1 2 1 2 2 . ’ A p p l i c a t i o no fG C - M St oR e s e a r c ho fM i n eE n v i r o n m e n tS c i e n c e Y UH a n l ,L U A NH e - l i n 2 1 .S c h o o lo fR e s o u r c ea n dE n v i r o n m e n t a lS c i e n c e ,W u h a nU n i v e r s i t y ,W u h a n4 3 0 0 7 2 ,C h i n a ; 2 .B e i j i n gG e n e r a lR e s e a r c hI n s t i t u t eo fM i n i n ga n dM e t a l l u r g y ,B e i j i n g1 0 0 0 4 4 ,C h i n a A b s t r a c t T h ei m p o r t a n tr o l eo fG C - M Sa n a l y t i c a lt e c h n o l o g yi ni n v e s t i g a t i o no fe n v i r o n m e n ts c i e n c ef o rm i n i n ga n d m e t a l l u r g yi sd e s c r i b e da n dt h ep r a c t i c a la c h i e v e m e n t sa r ei n t r o d u c e d .T h eG C - M Sa n a l y t i c a lt e c h n o l o g yi sa p . p l i e dt op o l l u t a n t sd e t e r m i n a t i o na n dt r a c i n g ,s u c ha sP O P s ,P A H s ,P A S H ,D E C sa n dP M 2 .5c o m p l e xc o n t a i n . i n a t i o n ,a n dt h ec o r r e c td a t aa r ep r o v i d e df o rc o n t a i m i n a t i o nr e s o u r c ee v l u a t i o n ,u n d e r s t a n d i n gp o l l u t i o nm e c h a . n i s m ,s e l e c t i o no fd i s p o s a lm e a s u r e s .T h eG C - M Sa n a l y t i c a lt e c h n o l o g yi san e c e s s a r yd e t e r i m i n a t i o nm e t h o da n d t e c h n i ce n s u r a n c e . K e y w o r d s e n v i r o n m e n te n g i n e e r i n g ;d e t e c t a t i o n /d e t m i n a t i o no fp o l l u t a n t ;G C - M S ;c o m p l e xc o n t a m i n a t i o n ;o r g a n i cp o l l u t a n t ;e n v i r o n m e n to fm i n i n ga n dm e t a l l u r g y 上接第1 2 0 页,C o n t i n u e df r o mP .1 2 0 [ 4 ] 黄光球,桂中岳.距离幂次反比法品位估计公式中参数确定的遗传算法[ J ] .中国锰业,1 9 9 7 ,1 5 3 2 0 2 5 . [ 5 ] 黄光球,桂中岳.确定矿体真实品位估计公式中的遗传规划方法[ J ] .中国钼业,1 9 9 7 ,2 1 6 1 0 1 5 . [ 6 ] 张文修,吴伟志,梁吉业等.粗糙集理论与方法[ M ] .北京科学出版社,2 0 0 1 2 6 6 0 . [ 7 ] 刘同明.数据挖掘技术及其应用[ M ] .北京国防工出版社,2 0 0 1 8 0 1 0 0 . A nA p p r o a c ht oD e t e r m i n eR u l e sa n dF o r m u l ao fO r eG r a d eE s t i m a t i o n U s i n gV a r i a b l eP r e c i s i o nR o u g hS e tT h e o r y H U A N GG u a n g - q i u ,L 【,Q i u q i n ,C U IH u a l i X i a nU n i v e r s i t yo f A r c h i t e c t u r ea n dT e c h n o l o g y ,X i a n7 1 0 0 5 5 ,C h i n a A b s t r a c t T h ep r i n c i p l e sa n da l g o r i t h m sf o re s t a b l i s h m e n to ft h er u l e sa n df o r m u l ao no r eg r a d ee s t i m a t i o nb ym e a n s o fc o m b i n a t i o no fq u a l i t a t i v ea n dq u a n t i t a t i v ef a c t o r s ,a u t o m a t i c a l l yg r o u p i n ga n dd e t e r m i n a t i o no fr e l a t i v ei m p o r t a n c eo fc o n t r o lp o i n t sd a t a ,e l i m i n a t i o no fr e d u n d a n td a t aa n df a c t o r so nt h eb a s i so fv a r i a b l ep r e c i s i o nr o u g h s e tt h e o r ya r ed e s c r i b e d .T h er u l e sa n df o r m u l ao fo r eg r a d ee s t i m a t i o nu n d e ra n yc o m p l i c a t e dc o n d i t i o n sc a nb e a c c u r a t e l yf o u n do u tb yt h ep r o p o s e dm e t h o d ,a n dt h er e s u l t sa r ep r e c i s e l yc o n s o n a n tw i t ht h ep r a c t i c e . K e y w o r d s m i n i n ge n g i n e e r i n g ;o r eg r a d e ;v a r i a b l ep r e c i s i o nr o u g hs e tt h e o r y ;r u l e ;f o r m u l a 万方数据
展开阅读全文