资源描述:
第55卷 第3期 2 0 0 9年5月 地 质 论 评 G E O L O G I C A LR E V I EW V o l . 5 5 N o . 3 M a y 2009 注 本文为国家8 6 3项目“ 矿产资源评价数字矿床模型及可视化技术研究” (2 0 0 6 AA 0 6 Z 1 1 4) 和“ 中央级公益性科研院所基本科研业务费专 项资金” ( 编号K 0 8 1 3) 的成果。 收稿日期2 0 0 8 0 1 1 1; 改回日期2 0 0 8 0 3 2 0; 责任编辑 章雨旭。 作者简介 阴江宁, 男,1 9 7 5年生。博士研究生, 主要从事矿产资源评价研究。通讯地址1 0 0 0 3 7, 北京市西城区百万庄大街2 6号; 电话 0 1 0-8 6 3 7 4 6 1 5;E m a i lm a r k - j o h n s o n @1 6 3. c o m。 铜矿数字矿床模型专家系统的 原理与技术实现 阴江宁1 ) ,肖克炎1 ) ,何凯涛2 ) ,邹伟1 ) ,丁建华1 ) 1)中国地质科学院矿产资源研究所, 北京,1 0 0 0 3 7; 2)中国地质调查局, 北京,1 0 0 0 1 1 内容提要数字矿床模型是指将传统的地质学语言描述的矿床特征, 转化成计算机可以识别的数字和符号, 并 加入人工智能的推理规则和知识, 使之具备矿床自动推理和勘查辅助决策的功能。本项研究是在基于前人的工作 基础上, 结合国内外数字矿床模型的先进理论和经验进行了系统的实现。本文论述了铜矿床数字化的方法原理以 及在系统实现时的关键性技术问题。系统知识库和规则库的建立是在多位铜矿专家的协助下完成的, 专家对一系 列先验概率等相关参数进行赋值, 并用统计学方法下进行了处理。铜矿专家系统中知识库和规则库的保存和管理 使用了数据库开发技术, 采用数据挖掘作为知识发现的新手段。系统使用产生式规则, 采用主观贝叶斯方法为推理 的总体算法, 搜索策略采用广度优先向前搜索的策略; 在地质证据的输入方面不只提供与铜矿类型直接相关的证 据, 同时系统也提供了更为充分的地质证据, 使推理的过程更加可靠和合理, 同时地质词典功能的加入方便用户对 相关地质术语进行查询和检索。系统不仅能实现单一成因的矿床进行推理, 也能对复合矿床类型进行推理。 关键词铜矿; 数字矿床模型; 专家系统; 矿产资源评价 在矿床成矿学研究和矿产勘查工作中, 传统矿 床模型是用自然语言来对矿床概念模型进行描述, 它通过对大量类似矿床和典型矿床进行研究, 归纳 出成矿地质环境、 控矿因素、 物探、 化探、 遥感找矿标 志、 矿床学及岩石矿物学等信息构成的组合标志特 征( 陈毓川等, 1 9 9 3) 。数字矿床模型是由美国地质 调查局提出来的概念(C o xe ta l .,1 9 8 6) , 赵鹏大 ( 1 9 9 0) 也提出了类似的概念。数字矿床模型从广义 角度讲就是将上述地质矿床的自然描述语言转换成 计算机能够识别的数字和符号, 从而实现矿床类型 的计算机自动推理和辅助决策( 肖克炎等, 2 0 0 6) 。 随着G I S等计算机技术在地学领域的广泛应用, 如 使用计算机技术实现辅助找矿和矿产资源评价, 已 成为当前资源评价研究的热点和前沿问题。在这方 面, 美国和加拿大由于研究起步较早, 分别已经有相 应的比较成熟的数字矿床模型软件问世, 比较著名 的是上世纪8 0年代美国地质调查局的D u d a等开 发的“ 勘探者” (P R O S P E C T O RⅡ) (D u d a ) , 以及 2 0 0 3年加拿大地质调查局开发的M i n eM a t c h软件 及其网络版。中国地质科学院矿产资源研究所肖 克炎等已在数字矿床模型研究中取得了成果, 开发 了铜金矿床的专家系统, 并初步实现了铜金矿床类 型的计算机推理以及专家系统和G I S的结合( 肖克 炎等, 2 0 0 3) , 但是在铜矿知识库和规则库的构建以 及推理网络的设计方面尚存在一些问题, 人机交互 的界面也需要改进。本项目研究是在基于前人的工 作基础上, 为了更深一步挖掘铜矿知识库和推理规 则, 设计更为合理的推理网络和推理机制, 实现专家 系统准确合理的推理功能。本项目研究在以下几方 面做了创新和改进①铜矿知识和规则采用全部证 据输入的方式;②数据库技术在系统中的应用;③ 搜索策略的改进和更新;④在基于自主开发的G I S 平台上实现专家系统与G I S技术的有机结合, 在此 基础上建立起既可以推断矿床类型、 又能预测矿床 位置的数字矿床模型专家系统。 1 铜矿专家系统的功能 本专家系统的功能主要是矿床类型的计算机自 动推理和辅助决策。矿产资源评价中首先要确定矿 床类型, 不同矿床类型的成矿条件、 控矿条件、 找矿 预测评价指标、 矿产品位吨位等有明显不同, 因此要 分类型进行预测评价, 这是符合地质和成矿规律的。 “ 三步式” 评价体系第一步首先就需要根据矿床类 型, 圈定成矿远景区。系统首先根据在预测区获得 的实际观测地质资料推出该地区铜矿的可能的成矿 类型, 并且给出概率值。在此基础上, 通过提取控矿 要素的组合以及对地质、 物探、 化探、 遥感等成矿信 息的提取, 总结出直接、 间接找矿标志, 使用G I S信 息查询, 获得找矿标志信息, 含有的标志信息越多越 是有利。然后使用矿产资源评价的办法, 如神经网 络法、 证据权法等对远景区进行优选排序, 找到成矿 的最有利单元。本系统最大的特色是将专家系统的 推理功能和G I S的地理空间查询功能相结合, 形成 了既能推测矿床类型, 又能预测矿床位置的推理系 统。相比之前的推理系统是基于MA P G I S平台, 此 次开发是完全就基于中国地质科学院矿产资源研究 所自主开发的G I S平台进行开发。为了便于用户 在输入证据时的查询需要, 特加入了地质词典的功 能, 该地质词典收录了地质、 矿床、 物探、 化探以及遥 感方面的1 0 0 0 0多条术语和专业词汇, 并配有相应 的解释, 可以方便的进行查询和检索。如图1所示。 图1地质词典检索的界面 F i g . 1T h e i n t e r f a c eo f r e t r i e v a l s y s t e mo fg e o l o g i c a l d i c t i o n a r y 2 铜矿专家系统知识库的设计 知识库是专家系统E x p e r tS y s t e m(E S) 的核 心, 它其实是各个专业系统专家的知识和经验的总 结, 知识库在推理系统中起着举足轻重的作用。铜 矿专家系统知识库的构建是通过和一批铜矿矿床学 家例如芮宗瑶、 黄崇柯、 朱裕生等密切合作, 广泛征 求各方地质矿床专家的意见和建议, 充分汲取他们 在铜矿成矿规律方面的观点和认识, 形成系统化的 知识库。对于矿床的知识库不应只是一些公认的观 点, 由于成矿规律是一个不断深化和无限延伸的动 态过程, 一些新的观点和认识不断提出, 系统也选择 性的吸收了一些新的观点, 当然这些知识系统会做 相应的处理, 在权重的划分上会有区别。同时系统 对新知识的输入都留有相应的接口, 随时便于用户 将新的知识输入专家系统中。这样专家知识库中专 家知识既有“ 共性” 又保持了专家系统中专家的“ 明 显的个性” 。在知识库的设计工程中应自始至终有 矿床专家参与并进行指导和建议。 2. 1 铜矿预测类型的划分 根据全国矿产总量预测技术要求( 叶天竺, 肖克 炎等, 2 0 0 7) , 铜矿预测类型划分为6个类型, 分别为 基性超基性岩型铜镍( 银铬) 矿, 与中酸性、 酸性浅成 或超浅成侵入岩有关的斑岩型铜钼金银矿, 矽卡岩 型铜钼铁硫( 金银) 矿, 海相火山岩型铜锌( 银铅金) 矿VHM S,海 相 ( 火 山)沉 积 岩 型 铜 ( 银 金)矿 S E D E X, 砂岩铜( 银) 矿6种。在铜矿推理的结论 中, 将以这六种类型为划分依据。 2. 2 铜矿专家系统的描述性模型的建立 铜矿专家系统的知识库的建立其实是铜矿描述 性模型建立的过程。一个矿床的描述性模型是在扎 实可靠的地质资料的基础上建立的。铜矿描述性模 型的建立是根据全国矿产资源总量预测技术要求 ( 叶天竺等, 2 0 0 7) 所划分的2 6个一级要素和若干二 级要素来进行的。涉及的一级要素如下 ①成矿时代,②大地构造位置,③ 大地构造 演化阶段,④沉积建造/沉积作用,⑤岩相古地 理/构造古地理/建造古构造,⑥火山建造/火山作 用,⑦火山岩性岩相构造/火山构造,⑧岩浆建造/ 岩浆作用,⑨侵入岩浆构造,变质建造/变质作 用, 变质变形构造,大型变形构造/区域断裂构 造,成矿构造,成矿特征,矿床资源储量, 磁测资料,重力资料,伽玛能谱资料,化 探资料,遥感资料,自然重砂异常,找矿线 054 地 质 论 评 2 0 0 9年 索( 包括 矿点、 矿化点、 规模性蚀变带、 老窿、 转石矿 化线索等) ,水文条件,湖泊,地貌,河流。 2. 3 铜矿知识库要素类别的划分原则 铜矿专家系统的建立是为铜矿资源潜力评价服 务的, 而矿产资源的潜力评价是基于地质、 物探、 化 探、 遥感综合信息预测的结果, 其中以地质为评价的 基础。在铜矿描述性模型建立中, 根据这2 6个要素 在预测评价该类型矿床的作用地位, 分出必要要素、 重要要素和次要要素。必要要素是该类型矿床存在 的必要条件, 缺乏该要素, 就不能找到该类型的矿 床, 比如与基性、 超基性岩体有关的铜、 镍矿床, 基性 超基性岩体就是一个必要条件。尽管不是每个基 性、 超基性岩体都含矿, 但没有基性、 超基性岩体, 也 就没有与之有关的铜镍硫化物矿床。必要要素的发 现是非常重要的, 它对预测区的选择和单元的划分 都起着重要作用, 专家在对必要要素进行充分性分 值的时候, 都要赋予一个很高的分值, 一般都大于 1 0 0。重要要素对预测区优选、 资源量估算起重要作 用的要素。次要要素是对矿床类型的推断起较小作 用的因素, 一般遥感异常和找矿线索在资源评价中 都划为次要要素, 其充分性量度都小于5 0。但是对 于铜镍硫化物矿床由于遥感异常特征非常明显, 两 者之间有时互为因果, 这样遥感异常的先验概率值 就会有一个比较高的分值。 3 铜矿知识库的表达 在专家系统中, 知识库是按照一定的规则建立 起来的, 在铜矿专家系统中采用的是常见的产生式 规则表示方法。知识形式化为具有5个环节, 分别 是地质命题、 地质假设、 地质证据、 命题的合成、 地质 推理。 3. 1 地质命题 矿产资源中的大量知识, 可以用命题来表示, 命 题是实现地质知识形式化的重要工具。例如 “ 出现 斑岩体” 、 “ 铜地球化学异常” 、 “ 青磐岩化” 等都是地 质命题。在矿产资源评价中, 地质命题除以语句形 式外, 更多的是以数学模型的形式出现。 3. 2 地质假设 地质假设实际上是矿产资源评价的目标。从逻 辑学的角度而言, 假设也是一种命题。一般的, 记假 设为犺, 例如 犺1 铜矿化有利; 犺2 大地构造背景有利; 犺3 火山岩组合有利; 犺4 含矿地层。 这些都是关于矿产的假设, 它们是地质学家进 行资源评价的目的, 即通过评价程序证实这些假设, 也就是结论命题狇。 3. 3 地质证据 一个假设成立与否, 要通过证据来判定。证据 也是命题, 证据一般记为犲。矿产资源评价中的证 据, 实际就是各种各样的地质资料和数据, 主要是地 质、 地球物理、 地球化学和遥感信息。以下构成一个 证据子集 犲1 上石炭统黄龙灰岩; 犲2 中二叠纪栖霞灰岩; 犲3 燕山期花岗闪长斑岩; 犲4 铜化探异常; 犲5 激电异常; 犲6 铁帽。 3. 4 地质证据及命题的合成 铜矿专家系统的推理工程需要对证据及同证据 有关的函数进行大量的不同形式的合成, 合成时使 用不同的算子进行, 一般采用基本的逻辑算子或概 率算子, 应用时发展了一些更为复杂的合成算法。 例如, 假设犺“ 斑岩特征” 是证据犲 1“ 网状细脉” 和犲 2“ 浸 染 状 硫 化 物 颗粒” 的 合 成。合 成 时 使 用 “AN D” 逻辑运算 犺=犲1∧犲2。对于需要多个证据结 合的结论可用 犺=犲1∧犲2∧∧犲狀。 若多个证据只需出现一个结论即可成立, 则使 用“O R” 进行逻辑合成 犲1 华北陆块北缘,犲2 哈萨 克斯坦地块东北缘, 犲3 哈萨克斯坦地块南缘,犺 位 于古亚洲成矿带, 可以表示为 犺=犲1∨犲2∨犲3。 除“AN D” 和“O R” 逻辑算子外,“NO T” 有时也 需要参与证据的合成, 从而构成更为多样的逻辑合 成形式。犲 1 围岩为碎屑岩,犲2 同期火山,犺 斑岩铜 矿的围岩特征。 犺=犲1∧┐犲2, 这里“┐” 即“ 非(NO T) ” 。 3. 5 地质推理 在矿产资源评价中, 最常用的就是假言推理三 段论。在铜矿推理系统中, 应用的基于产生式的规 则表示方法, 即I F-THE N的表现形式。假言推理 三段论规则 狆→狇i f 犡为犃 t h e n 犢为犅 (犃→犅) ( 知识) 狆1犡为犃 ( 证据) 狇1 犢为犅 ( 结论) 在结论的推理中, 主观贝叶斯法为推理的主要 154 第3期阴江宁等 铜矿数字矿床模型专家系统的原理与技术实现 算法 犘(犺犻|犲1,犲2,犲狀)= 犘(犲1,犲2,犲狀|犺犻)犘(犺犻) ∑ 犽犘( 犲1,犲2,犲狀|犺犽)犘(犺犽) 式中, 犺犻为第犻个假设。 知识表达形式是由使用专家系统的人工智能 A I模型决定的, 它可以是逻辑表达、 概率表达、 模糊 表达、 粗集合表达、 人工神经网络表达等。由于逻辑 关系是知识表达的基本形式, 最常用的表达形式以 逻辑关系为基础, 加上该模型特有的不确定性或模 糊性度量。例如 I F 出现孔雀石THE N 会出现铜矿化; 这是经典的逻辑描述知识, 而 I F 出现孔雀石THE N会出现铜矿化( μ=0. 8) ; 则这是一条用模糊逻辑描述的知识, 式中μ为 隶属函数, 是该条知识的模糊性度量。 对于一个大型专家系统, 知识库的知识以数万 条、 数十万条计算。铜矿专家系统经过分类筛选后 储存有近2 0 0 0条规则, 除此之外, 该系统还储存有 近万条标准的地质词库及其语义描述, 可以方便地 为用户进行岩石矿物的解释, 所有人机交互时地质 词汇的选择都将以词表中的词汇为标准。 4 铜矿专家系统规则库的设计 4. 1 规则库的结构 规则库是由若干“ I FTHE N” 规则的总和组成, 它是推理系统的核心部分, 这些规则通常来源于专 家知识, 一般可以通过请教专家或采用基于学习的 算法得到。系统的其它部分的功能在于解释和利用 这些规则来解决问题。在多输入和输出的推理系统 中, 常常可能有多条规则, 而且这些规则的前提部分 和结论部分可能会有多条规则, 如图2所示, “ I F- THE N” 只是最简单的形式。 在确立不确定性的表示方法时, 有两个直接相 关的因素需要考虑 一是要能根据领域问题的特征 把不确定性比较准确地描述出来, 满足问题求解的 需要; 另一个是要便于在推理过程中对不确定性进 行推算。只有把这两个因素结合起来统筹考虑, 相 应的表示方法才是实用的。 目前, 在专家系统中知识的不确定性一般是由 领域专家给出的, 通常是一个数值, 它表示相应知识 的不确定性程度, 称为知识的静态强度。静态强度 可以是相应知识在应用中成功的概率, 也可以是该 图2基本推理结构搭建的推理树状网络 F i g . 2T h e t r e en e t w o r ko fb a s i cr e a s o n i n go r g a n i z a t i o n 条知识的可信程度或其它, 其值的大小范围因其意 义和使用方法的不同而不同。 4. 2 规则库的规则组织方式 为了便于规则库的组织和管理, 本专家系统的 规则库使用数据库技术进行保存和管理, 相比之前 使用文本文件存贮和读取, 计算机检索和执行效率 大大提高, 而且扩展性能好, 数据添加和修改非常方 便, 数据库技术是这次专家系统的重要技术之一。 数据库是规则库很好的载体, 但是规则库在数据库 中如何组织是系统建立的关键问题, 组织好不仅易 于系统实现, 而且效率高。规则库的规则按类别进 行归类, 一级、 二级、 观测证据逐级管理。对于单证 据组合, 或者规则间以“O R” 的组合就全部分开来管 理, 而对于证据组合“AN D” , 数据库单独管理, 从而 便于规则的匹配检索。涉及的一级、 二级地质要素 组合如下图3所示 4. 3 证据不确定性的表示 在推理中, 有两种来源不同的证据 一种是用户 在求解问题时提供的初始证据, 比如观察到的地质 特征等; 另一种是在推理中用前面推出的结论作为 当前推理时的证据。对于前一种情况, 即用户提供 的初始证据, 由于这种证据多来源于观察, 因而通常 是不精确、 不完全的, 即具有不确定性。对于后一种 情况, 由于所使用的知识及证据都具有不确定性, 因 而推出的结论当然也具有不确定性, 当把它用作后 面推理的证据时, 它亦是不确定性的证据。 4. 4 证据不确定性的量度 对于不同的知识及不同的证据 , 其不确定性的 程度一般是不同的, 需要用不同的数据表示其不确 定性的程度, 同时还需要事先规定它的取值范围 , 只有这样每个数据才会有确定的意义 。在本系统 中, 使用充分性量度来表示知识的强度, 用可信度来 254 地 质 论 评 2 0 0 9年 图3矿床类型推理地质建模方法示意图 ( 据肖克炎等, 2 0 0 7) F i g . 3T h es k e t c ho fg e o l o g i c a lm o d e l i n go fd e p o s i t r e a s o n i n g(a f t e rX i a oK e y a ne t a l . , 2 0 0 7) 表示证据的不确定性, 取值范围为[-5, 5] , 当可信 度取大于零的数值时, 其值越大, 表示相应的知识或 证据越接近于“ 真” ; 当可信度的取值小于零时, 其绝 对值越大表示相应的知识或证据越接近于“ 假” 。 4. 5 组合证据不确定性的算法 在基于产生式规则的系统中, 知识的前提条件 既可以是简单条件, 也可以是用AN D或O R把多 个简单条件连接起来构成的复合条件。进行匹配 时, 一个简单条件对应于一个单一的证据, 一个复合 条件对应于一组证据, 称这一组证据为组合证据。 在不确定性推理中, 由于结论的不确定性通常是通 过对证据及知识的不确定性进行某种运算得到的, 因而需要有合适的算法计算组合证据的不确定性。 目前, 关于组合证据不确定性的计算已经提出了多 种方法, 如最大最小方法、H a m a c h e r方法、 概率方 法、 有界方法、E i n s t e i n方法等, 其中目前用得较多 的有如下三种 ( 1) 最大最小方法 犜(犈1 O R 犈2)=m a x[犜(犈1) ,犜(犈2) ] ( 2) 概率方法 犜(犈1 O R 犈2)=犜(犈1)+犜(犈2)-犜(犈1) 犜(犈2) ( 3) 有界方法 犜(犈1 O R 犈2)=m i n{1, [犜(犈1)+犜(犈2) ]} 其中,犜(犈) 表示证据犈为真的程度, 如可信 度、 概率等。另外, 上述的每一组公式都有相应的适 用范围和使用条件, 如概率方法只能在事件之间完 全独立时使用。铜矿专家系统中采取的是第一种证 据组合方法。 4. 6 规则库搜索策略 由于铜矿专家系统采用的产生式规则, 所以在 推理方面必须采用合适的推理策略, 才能快速高效 地找到匹配的规则。之前系统提供的证据组合比较 有限, 只是列出了与铜矿类型推理直接相关的证据, 但是如果用户看到的证据系统没有提供, 将不能给 以推理。本次系统对此进行了更新, 在叶子证据的 输入中, 几乎囊括了所有地质、 矿床的有关证据, 在 系统中都分别对应有相应的规则组合, 但这也无形 中增大了系统搜索规则的难度, 节点越多, 搜索越困 难。经过测试和分析, 系统采用了广度优先向前搜 索逐级传递的策略。中国铜矿床普遍存在多期次、 多时空、 多成因叠加的现象, 具有类型重叠, 成因复 杂的特点。运用这一推理模式, 在对铜矿类型的推 理结论中, 可以对复合成因类型的铜矿床进行推理, 而不是只对推理单一成矿类型进行推理。推理的过 程中采取的是三层树状推理结构, 分别对应的是资 354 第3期阴江宁等 铜矿数字矿床模型专家系统的原理与技术实现 源评价的一级要素、 二级要素、 底层观测地质证据。 推理模式如下图4所示。 图4基本推理流程示意图 F i g . 4T h e i l l u s t r a t o ro fb a s i cr e a s o n i n gp r o c e d u r e 4. 7 不确定性的传递方法 不确定性推理的根本目的是根据用户提供的初 始证据, 通过运用不确定性知识, 最终推出不确定性 的结论, 并推算出结论的不确定性程度。为达到这 一目的, 除了需要解决前面提出的问题外, 还需要解 决推理过程中不确定性的传递问题, 它包括如下两 个密切相关的子问题 ( 1) 在每一步推理中, 如何把证据及知识的不确 定性传递给结论。 ( 2) 在多步推理中, 如何把初始证据的不确定性 传递给最终结论。 对于第一个子问题, 在不同的不确定推理方法 中所采用的处理方法各不相同, 对于第二个子问题, 各种方法所采用的处理方式基本相同, 即把当前推 出的结论及其不确定性量度作为证据放入数据库 中, 供以后推理使用。由于最初那一步推理的结论 是用初始证据推出的, 其不确定性包含了初始证据 的不确定性对它所产生的影响, 因而当它又用作证 据推出进一步的结论时, 其结论的不确定性仍然会 受到初始证据的影响。由此一步一步地进行推理, 必然就会把初始证据的不确定性传递给最终结论。 5 铜矿专家系统关键技术问题的解决 方案 5. 1 核心推理算法的确定和研究 目前专家系统的推理系统的设计基本有两种模 式, 一种是基于主观贝叶斯的推理; 一种是基于可信 度的不确定性推理。两种推理算法各有其优点和缺 点, 主观贝叶斯法有严格的概率论作为基础, 推理算 法较为周密可靠, 在需要以概率给出的结论中较为 适用, 但是推理算法十分复杂。而基于可信度的不 确定性推理相对较为简单, 但是缺乏概率论为基础, 推理结论是一种更为主观的判断( 陆汝钤, 2 0 0 0) 。 在铜矿专家系统的算法选择中, 考虑到矿产资源的 预测和评价大多数需要以概率为基础进行评价, 所 以选择主观贝叶斯法作为总体推理算法, 同时在证 据的不确定性上选择可信度进行衡量。 主观贝叶斯方法推理知识的静态强度犔 犛及 犔犖是由领域专家根据实践经验给出的, 这就避免 了大量的数据统计工作。另外, 它既用犔 犛指出了 证据犈对结论犎的支持程度, 又用犔犖指出了犈 对犛的必要性程度, 这就比较全面地反映了证据与 结论间的因果关系, 符合现实世界中某些领域的实 际情况, 使推出的结论有较准确的确定性。 主观贝叶斯法不仅给出了在证据肯定不存在情 况下由犎的先验概率更新为后验概率的方法, 而且 还给出了在证据不确定情况下更新先验率为后验概 率的方法。另外, 由其推理过程可以看出, 它实现了 不确定性的逐级传递。因此, 可以说主观贝叶斯法 是一种比较实用且较灵活的不确定性推理方法。 但是主观贝叶斯法推理公式和流程比较复杂, 它要求铜矿专家在给出知识犔 犛和犔犖时, 还得给 出结论的先验概率犘(犎) , 专家代价较高, 计算量也 比较大。 5. 2 数据挖掘(犇 犪 狋 犪犕 犻 狀 犻 狀 犵 ) 数据挖掘(D a t aM i n i n g) , 又称为数据库中的知 识发现(K n o w l e d g eD i s c o v e r y i nD a t a b a s e,K D D) , 数据挖掘是知识发现的核心技术, 它是一种信息提 取活动, 通过综合使用机器学习, 统计分析, 模拟技 术和数据库技术, 发现那些隐藏在数据库中数据的 模式, 人们难以辨认的复杂关系和推理规则, 以便对 事物的未来进行预测和分析。 在铜矿专家系统中数据挖掘采用的主要方法是 概率统计方法和数据库技术, 将专家对铜矿床的一 般描述性语言“ 必要, 很重要, 重要, 次要, 很次要” 等 转化为分值, 并将其以合理的概率输出是数据挖掘 的过程, 通过使用数据库查询语言S Q L语法和数学 模型参数来实现。 5. 3 铜矿专家系统的解释模块 铜矿专家系统的推理过程对用户是完全透明 的, 而不是“ 黑盒子” , 所以它有很好的解释功能, 使 用户能够清晰了解每一步推理的思路和流程。系统 的解释采用的是事后解释, 即在每次推理工作完成 454 地 质 论 评 2 0 0 9年 之后, 解释子系统可以对推理工程及结果做出令人 信服的解释, 例如预测结论是什么, 推理过程使用了 那些知识、 知识的详细内容, 哪些事实未使用, 各个 事实分别产生何种独立结果, 结论是怎么得到的。 同时系统还尝试性的加入了深层解释功能, 即对推 理流程解释的同时, 对推理的原理进行说明, 在此调 用了铜矿知识库的相关内容。 5. 4 铜矿专家系统的神经网络模块 人工神经网络是一个高度自适应的非线性系 统, 具 有 并 行 分 布 处 理 能 力 以 高 度 的 鲁 棒 性 (R o b u s t) , 同时也具有很强的学习功能和联想记忆 能力。它与E S在技术上具有定量分析和定性分 析、 自动获取知识和手工获取知识的互补性。因此 用人工神经网络来解决E S知识获取的“ 瓶颈” 问题 成为研究的热点, 集两者的学习和推理功能于一体 的神经网络专家系统为新一代专家系统的主流。在 E S中, 将使用B P神经网络进行学习。 在实际矿产预测中, 地质、 物探、 化探、 遥感与矿 产之间具有较强的非线性关系, 它们很难通过某种 解析表达式进行表达, 而神经网络是一种高度自适 应的非线性动力系统, 通过神经网络学习可以得到 输入和输出之间的高度的非线性映射, 从而建立输 入和输出的非线性关系。在本系统中, 将采用B P 神经网络构建, 学习出不同预测指标的知识, 从而进 行较为合理的预测。 6 结论 ( 1) 铜矿专家系统结合铜矿资源预测和评价的 新思路和新方法, 对铜矿的知识库和规则库进行了 扩充和更新, 使其更加系统化和完善化; ( 2) 系统使用数据库技术对知识和规则进行管 理和保存, 计算机检索和执行效率大大提高, 而且扩 展性能好, 数据添加和修改比较方便; ( 3) 经过分析, 确定以主观贝叶斯方法为推理的 总体算法, 该方法虽然复杂, 但是有着较强的概率论 基础, 在矿产资源评价中比较适用; ( 4) 利用数据挖掘进行知识发现, 确定以广度优 先向前搜索的策略, 搜索的效率得到提高, 是一种驾 驭式的推理机制; ( 5) 将模糊系统、 神经网络和E S技术相结合, 引入了驾驭式的推理机制, 除具有第一代的专家系 统的较强符号推理和解释功能之外, 还具有良好的 人机交互能力和较强的学习功能, 是一个全新的第 二代铜矿专家系统。 注 释 / 犖 狅 狋 犲 狊 D u d aRO . 1 9 8 0. T h eP r o s p e c t o r s y s t e mf o rm i n e r a l e x p l o r a t i o n . M e n l oP a r k,C a l i f .,S t a n f o r d R e s e a r c hI n s t i t u t eF i n a lR e p o r t, P r o j e c t 8 1 7 2. C l i n t o n S m y t h.2 0 0 4.Q u a l i t a t i v ep r o b a b i l i s t i c m a t c h i n g w i t h h i e r a r c h i c a l d e s c r i p t i o n s . 参 考 文 献 / 犚 犲 犳 犲 狉 犲 狀 犮 犲 狊 陈毓川, 朱裕生. 1 9 9 3.中国矿床成矿模式.北京 地质出版社. 肖克炎, 王勇毅, 薛群威, 张寿庭, 黄文斌. 2 0 0 3.中国铜矿数字矿床模 型评价系统的开发.矿床地质,2 2(4) 4 2 5~4 2 9. 赵鹏大, 魏民, 金友渔. 1 9 9 0.地质勘探中的统计分析.武汉 中国地 质大学出版社. 5 0~1 0 0. 肖克炎, 王勇毅, 陈郑辉, 薛群威, 黄文斌, 朱裕生, 杨永华, 张寿庭, 杨 毅恒, 张晓华, 刘锐. 2 0 0 6.中国矿产资源评价新技术与评价新模 型.北京 地质出版社. 叶天竺, 肖克炎, 严光生. 2 0 0 7.矿床模型综合地质信息预测技术研 究.地学前缘,1 4(5) 4 0~4 5. 肖克炎, 张晓华, 李景朝, 丁建华. 2 0 0 7.全国重要矿产总量预测方 法.地学前缘,1 4(5) 2 1~2 6. 陆汝钤. 2 0 0 0.人工智能.北京 科学出版社. C o xD Pa n dS i n g e rD A.1 9 8 6.M i n e r a ld e p o s i tm o d e l s .U. S G e o l o g i c a lS u r v e yB u l l e t i n,1 6 9 33 7 9~3 8 2. 犜 犺 犲犘 狉 犻 狀 犮 犻 狆 犾 犲狅 犳犆 狅 狆 狆 犲 狉犇 犻 犵 犻 狋 犪 犾犇 犲 狆 狅 狊 犻 狋犕 狅 犱 犲 犾 犪 狀 犱犐 狋 狊犜 犲 犮 犺 狀 犻 犮 犪 犾 犐 犿 狆 犾 犲 犿 犲 狀 狋 犪 狋 犻 狅 狀 Y I NJ i a n g n i n g 1), X I AOK e y a n 1),HEK a i t a o2), Z OU W e i 1), D I NGJ i a n h u a 1) 1)犐 狀 狊 狋 犻 狋 狌 狋 犲 狅 犳犕 犻 狀 犲 狉 犪 犾犚 犲 狊 狅 狌 狉 犮 犲,犆 犺 犻 狀 犲 狊 犲犃 犮 犪 犱 犲 犿 狔狅 犳犌 犲 狅 犾 狅 犵 犻 犮 犪 犾犛 犮 犻 犲 狀 犮 犲,犅 犲 犻 犼 犻 狀 犵,1 0 0 0 3 7; 2)犆 犺 犻 狀 犪犌 犲 狅 犾 狅 犵 犻 犮 犪 犾犛 狌 狉 狏 犲 狔,犅 犲 犻 犼 犻 狀 犵,1 0 0 0 1 1 犃 犫 狊 狋 狉 犪 犮 狋T h ed i g i t a ld e p o s i tm o d e l i sm e a n tt ot r a n s f e rt h ed e p o s i tf e a t u r e sd e s c r i b e di nt r a d i t i o n a l g e o l o g i c a l t e r m s i n t o t h ed a t a a n dc o d e t h a t c a nb eu n d e r s t o o db yc o m p u t e r a n dp u tA I k n o w l e d g e a n d r u l e s i n t oc o m p u t e rs ot h a tt h ec o m p u t e rc a nr e a s o n i n ga u t o m a t i c a l l ya n d a s s i s tg e o l o g i s t s,e x p l o r a t i o n c o m p a n i e st om a k ed e c i s i o n s . T h e r e s e a r c h i sb a s e do n t h e a c h i e v e m e n t o f t h ep r e d e c e s s o r s,c o m b i n e dw i t h 554 第3期阴江宁等 铜矿数字矿床模型专家系统的原理与技术实现 a d v a n c e dt h e o r ya n de x p e r i e n c e f r o md o m e s t i c a n da b r o a d. T h ep a p e r s e t f o r t ht h ep r i n c i p l e a n dm e t h o do f d i g i t a l c o p p e rd e p o s i tm o d e l a n ds o m ek e y t e c h n i q u e s i n t h e i m p l e m e n t a t i o no f t h e s y s t e m. T h ek n o w l e d g e a n dr u l e sw e r eb u i l tw i t ht h eh e l po ft h ec o p p e rg e o l o g i s t s,w h op r o v i d e dt h ep a r a m e t e r sr e l a t e dt ot h e r e a s o n i n gs u c ha sp r ep r o b a b i l i t i e s,w h i c hw e r eh a n d l e dw i t hs t a t i s t i c sm e t h o d . T h ed a t a b a s ed e v e l o p m e n t s k i l l sw e r ea p p l i e d t os t o r ea n dm a n a g e t h ek n o w l e d g e a n d t h e r u l e sw h i l e t h ek n o w l e d g e f o u n d i n ga d o p t e d d a t am i n i n gt e c h n o l o g y .T h es y s t e m u s et h ep r o d u c t i o nr u l e sa n da d o p ts u b j e c t i v eB a y sm e t h o da st h e a l g o r i s mT h e s e a r c hs t r a t e g y i s s p a np r i o r i t ya n d f o r w a r ds e a r c h. D i f f e r e n t f r o mt h ep r e v i o u s s y s t e mw h i c h p r o v i d e dl i m i t e de v i d e n c eo n l yd i r e c t l y r e l a t e dw i t ht h e c o p p e rd e p o s i t,t h e a b u n d a n t e v i d e n c e i so f f e r e d f o r u s e r st
展开阅读全文