RGMAPGIS-常用地质数理统计方法等说明书.doc

返回 相似 举报
RGMAPGIS-常用地质数理统计方法等说明书.doc_第1页
第1页 / 共36页
RGMAPGIS-常用地质数理统计方法等说明书.doc_第2页
第2页 / 共36页
RGMAPGIS-常用地质数理统计方法等说明书.doc_第3页
第3页 / 共36页
RGMAPGIS-常用地质数理统计方法等说明书.doc_第4页
第4页 / 共36页
RGMAPGIS-常用地质数理统计方法等说明书.doc_第5页
第5页 / 共36页
点击查看更多>>
资源描述:
RGMAPGIS-常用地质数理统计方法等说明书 二〇〇六年十二月 35 RGMAPGIS-常用地质数理统计方法等说明书 1 地球化学图 1.1 启动功能 打开某个图幅PRB库,点击菜单“常用方法”,选择“地球化学图”。 弹出“地球化学图(网格化数据)”处理对话框 1.2 地球化学数字特征 (1)选择地球化学图层(网格化的点图层),选择需要进行数字特征统计和绘制等值线的元素 (2)计算数字特征 分为三种方式计算数值特征、计算log10对数数字特征、计算自然对数ln数字特征。计算时需要用户填写“小于此值剔除”和“高值替代值”,默认分别为-98和9999。点击按钮“计算数值特征”,或“计算log10对数数字特征”,或计算自然对数数字特征,得到这三种方式下的数字特征最大值、最小值、标准方差等。下图是“计算log10对数数字特征”的情况 (3)数字特征图的表示 在进行数字特征计算时,将通过数字特征图把数据划分成不同的级别,体现数据自身的特征,形成专题图,包括饼图和直方图。注若需要定制详细的专题图,可使用“图幅PRB工程”下的“数字特征统计”功能(包括数字特征统计、用户指定子区进行统计、按子区划分进行统计)。以下是饼图的绘制情况 (4)数字特征图件的配置 在图框内的数字特征图是矢量格式的图件,支持图形的放大、缩小、移动等功能(同时支持快捷键操作F5-放大,F6-移动,F7-缩小)。右击图件,弹出快捷菜单,即可进行操作 选择快捷菜单的“图件设置”,弹出图件设置属性框,可以进行各个图形参数的设置。 详细的设置请参考“数字特征图件编辑”部分。 (5)数字特征图件的配置 可以将图件保存为MPJ工程文件和gif格式的图片,用户可以根据需要对工程文件进行再编辑。选择图件快捷菜单的“保存图件” 弹出“另存为”对话框,选择需要保存的文件格式,输入文件名,点击保存即可。 1.3 数字特征图件编辑 (1)图件标题修改包括图件的标题、字体、颜色的设置。 (2)图件坐标轴修改包括X、Y轴的数量单位、刻度、间距、是否显示等参数。 (3)图件基本参数设置设置图形的范围、线型、图形字体、背景颜色等。 (4)针对当前统计图的特殊参数设置例如,当前生成的是直方图,可设置直方图的方块的颜色、大小;如果是曲线图,可设置曲线的颜色、线宽等。 (5)标记与图例设置设置图件的标注位置、是否显示、在图上是否显示数据表这些参数。 1.4 等值线极值点参数设置 (1)子图号设置点击“子图号”按钮,弹出“选择子图”对话框。 (2)标注字体点击“标注字体参数”按钮,弹出“标注字体选择对话框”。可以选择字体和颜色,可以设置字体大小。 (3)标注格式点击“标注格式参数”,弹出“标注格式”对话框。可以选择输出标注使用“固定小数位数”还是“科学计数法”;小数部分是几位;需要注意的是若计算数字特征时选择了对数计算方式(数据已对数),则需要进行还原显示,如若在计算数字特征时选择了“计算log10对数数字特征”,则此处须选择“10为底”。 1.5 等值线追踪 输入需要生成的等值线文件名,点击“OK”按钮。若有重名文件,则提示是否翻盖旧文件。 弹出“设置等值线参数”对话框, 注意选中“等值线套区”、“绘制色阶”、“保留边界线”;选中“等值线光滑处理”;制图幅面选择“原始数据范围”;选中“示坡线”。 点击“注记参数”,弹出等值线注记参数设定对话框 选择频度为1,表示每个等值层均进行标注,注记的最大倾角表示注记与等值层线的夹角。 选择“注记格式”和“注记字体”,操作方法同等值线极值点“标注字体和标注格式”。 需要注意的是若计算数字特征时选择了对数计算方式(数据已对数),则需要进行还原显示,如若在计算数字特征时选择了“计算log10对数数字特征”,则此处须选择“10为底”。 点击“确定”,进行“规则网数据等值线追踪处理”,生成的地球化学图(等值线图)如下,其中空白区表示该区的值无效。 2 等值线图 本系统提供通用的等值线计算与绘制功能。 2.1 启动功能 打开某个图幅PRB库,点击菜单“常用方法”,选择“等值线图” 选择用于追踪等值线的点图层 接下来的操作除了“等值线方法选择”上与地球化学图操作有所区别外,其他的操作(包括数字特征的计算、数字特征图、极值点参数设置等)均一样。可以参见“地球化学图”部分。 2.2 等值线方法选择 注意本操作必须在点击“OK”进行等值线参数设置之前进行。 (1)TIN方法 该方法提供无效区的剔除功能,若需要无效区剔除,选择无效区的区文件,并输入横向网格数和纵向网格数 (2)GRID方法 在方法参数栏中,用户可以选择搜索网格点的方法,包括所有点、K-临近、四方向、八方向,用户需要输入横向网格数和纵向网格数。 (3)KRG方法 用户输入横向网格数和纵向网格数即可。 2.3 等值线生成 通过等值线方法选择、等值线极值点参数设置及等值线的追踪过程,生成等值线图层,并将相关图层加入PRB库中,用户可以根据这些等值线图层进行其他工作。 下图是GRID方法绘制的等值线图 3 数字特征统计 3.1 统计的目的 通过最大值、最小值、方差等基本统计量以及分级统计,以反映数据的空间分布规律。 进入RGMAPGIS系统,选择某个工作图幅进入PRB库中。将目标图层数据(点)加入工程后即可通过常用方法菜单对这些数据进行操作。 3.2 基本数字特征统计 选择需要统计的目标点图层 在元素选择中列出了该地球化学数据具有的元素属性,如Ag、As等,选择某个元素后即可获得具有有效元素值的所有点的基本统计量,包括对数据集中趋势、数据离散程度和数据分布形态等的统计。 在此基础上可以通过分级把数据划分成不同的级别,体现数据自身的特征,为应用研究及专题制图提供基础。 分级方法有 (1)自定义分级根据应用目的设定各个级别的数值范围来实现分级。 (2)模式分级按照固定模式进行分级,级差由特定的算法自动设定。模式分级分为等间距分级、分位数分级、等面积分级、标准差分级、自然裂变点法分级、其他分级方法(有规律的不等间距分级、按嵌套平均值分级、按面积正态分布分级)。 专题图类型有直方图、饼图、折线图。 用户选择等间距分级并输入级数、选择专题图类型、选择统计方式后,生成专题图件如下 图件的设置参考“地球化学图”的“数字特征图件编辑”部分内容。 图件的保存右击图形窗口,选择图件保存,保存为MAPGIS工程文件 3.3 用户制定子区进行统计 根据用户自定义的区文件,在某个划分的区域内对数据进行统计 选择某个区文件,确定。点击图层,选择某个区图元 选择是,则统计该区范围内的地球化学数据的情况,弹出的对话框如下 内圈,子区内的空洞的处理 如打勾选择,则考虑子区内的空洞情况,统计地球化学点时,严格判断点是否落在区域内,若落在区域的空洞内,也认为是落在区域外边。 其他操作如第一部分,区别就是统计的是某个区内的信息,而不是所有点的信息。 3.4 按子区划分进行统计 对第2部分进行扩展,用户根据需要划分的不同子区,全局浏览这些子区内的相关数据统计信息,用户也可以动态选择某个区浏览统计信息。 选择某个区文件,确定,弹出对话框 子区号全部子区和各个子区情况浏览 4 多元统计分析 4.1因子分析 在地质学中,由于地质对象的复杂性,往往需要较多的变量来刻划,但由于变量较多,很难看清它们之间的相互关系,不易找出起主导作用的变量。因子分析方法通过研究变量之间的协方差阵的内部结构,将原来较多的变量组合成少数的“因子”。这些因子是原始变量的线性组合。它们保留了原始变量的大部分相关信息和变异性。各因子给出了地质变量的几种基本的结合关系,往往表示对地质问题起决定作用的几个基本的地质因素。通过因子可以再现原始变量之间的相关关系。提示产生这些关系的内在原因,从而有助于探索事物的因果关系。因子分析方法在压缩地质中的原始数据,指示成因推理方向,分解叠加的地质过程方面都有许多成功的例子。 (1)选择菜单“常用方法-多元统计-因子分析” (2)选择点图层数据 (3)因子分析参数设置对话框 该对话框的主要操作包括 l 因子数的设置 l 判断是否需要正交四次幂的解 l 判断是否需要斜交因子解 l 判断是需要正规化解还是标准化的解 l 变量的选择,选择几个变量进行计算因子得分 l 数据计算结果文件的名称设定。 l 点击“确认”按钮进行计算 (4)浏览分析结果 4.2聚类分析 聚类分析就是根据多个指标进行数字分类的一种多元统计分析方法。近年来,在地质上已有许多成功的应用。根据分类对象的不同,聚类分析可分为两类一类是根据变量(指标或地质特征)对标本或样品进行分类,叫做Q型聚类分析;一类是根据变量在各标本上的观测值对变量进行分类,叫做R型聚类分析。 两类分析的具体作法基本一致首先选择一个适当的统计量,用以度量分类对象的相似性程度或非相似性程度,然后用适当方法进行聚类,建立分类谱系图。 方法1通过计算计算相关系数或者相似性系数来获得R型聚类分析谱系图 方法2通过选择计算距离系数的方法和聚类方案的选择进行大样本Q型系统聚类分析,内容包括数据的处理方式(数据标准化、数据规格化、不作变换),计算距离的方式(欧式距离、平方欧式距离、角距离、Bray-Curtis距离、Canberra距离),聚类的方案选择(最短距离法、最长距离法、松弛法(1)、松弛法(2)、非加权类平均法、加权类平均法、非加权类重心法、加权类重心法、平方和增量法)。结果的表达是通过选择聚类系数或者选择种子样本的方式,进行分类。 以下时R型聚类分析操作。 (1)选择菜单“常用方法-多元统计-聚类分析” (2)选择点图层数据 (3)聚类分析参数设置 针对这个对话框的操作是 l 数据预处理的方法选择数据作标准化还是数据作规格化。 l 选择相似程度的度量方式相关系数、相似系数,还是选择距离系数(多种系数的选择) l 变量的选择,选取进行计算和研究的变量 l 计算结果的保存文件名称的设置。 点击“确认” 按钮,那么会弹出绘图窗口,显示绘制的聚类分析谱系图。 (4)聚类分析谱系图 可以将图像结果另存到其他目录,图像为bmp格式。 (5)相关结果浏览 4.3多元判别分析 在判别分析中,人们希望用尽可能多的变量构造判别函数,因为它能包含较全面与判别有关的信息。但和逐步回归一样,如果包含变量过多,反而会使判别效果降低。原因是在求判别函数时,需要对协方差矩阵S求逆,S的阶数等于所含变量的个数,若包含的变量较多,阶数较高,那么计算的精度较差;特别地,当所含主量线性相关时,S接近于降秩矩阵,求逆计算的结果很不稳定,判别效果就会很差。 (1)选择菜单“常用方法-多元统计-多元判别分析” (2)选择点图层数据 (3)模型样本的选择 针对这个对话框的操作有以下几个方面 l 变量水平的设置 l 模型样本数的设置(不宜过多,程序中控制在20组以内) l 根据模型样本数在左边的窗口中选择变量;操作是鼠标双击认为是模型的样本号,将把这个样本选中,并且将该样本号添加到模型样本列表中 l 参与计算的变量的选择,在变量列表中选择(多选) l 设置预测结果的文件名称 (4)结果浏览 (5)保存的计算结果文件内容 5 人工神经网络分析 5.1 BP模型进行分类 多阶层神经网络及误差逆传播学习算法(Error Back-propagationEBP,或直接称之为前反馈神经网络BP学习算法)是目前应用最广、实现途径最直观、运算机制最易理解、研究深入的一种人工神经网络。误差逆传播学习算法是Pall Werbas博士于1974年在他的博士论文中首先提出来的。1986年以Rumelhart和McCelland为首的科学研究小组提出了完整的学习算法,并进行了详尽分析与介绍,对其潜在能力进行了深入的探讨。 BP神经网络是一种具有三层或三层以上阶层型结构的神经网络。层间各种神经元实现全连接,即下层的每一个单元与上层的每个单元都实现权连接,而每层各种神经元之间不连接。网络按有导师示教的方式进行监督训练学习,当一对学习模式提供给网络后,神经元的激活值,从输入层经各中间层向输出层传播,在输出层的各种神经元均获得网络的输入响应。并按照减少希望输出值与实际输出值之间误差的方向,从输出层经各中间层逐层修正各连接权值,最后回到输入层,所以称作“误差逆传播算法”。随着这种误差逆传播修正的不断进行,网络对输入模式响应的正确率也不断上升。最后在达到允许的误差范围内,网络达到平衡状态(实际输出值接近于希望输出值)而自动收敛。 由于BP神经网络及其算法增设了中间隐含层并且有相应的学习规则可循,使其具有对非线性模式的识别能力。尤其是其数学意义明确、算法步骤分明,更使其具有广泛的应用前景。 (1)选择菜单“常用方法-神经网络-BP模型” (2)选择点图层 (3)模型样本的选择 针对这个对话框的操作有以下几个方面 l 变量水平的设置 l 模型样本数的设置(不宜过多,程序中控制在20组以内) l 根据模型样本数在左边的窗口中选择变量;操作是鼠标双击认为是模型的样本号,将把这个样本选中,并且将该样本号添加到模型样本列表中 l 参与计算的变量的选择,在变量列表中选择(多选) l 设置预测结果的文件名称 点击“确定”,进行模型参数的设置。 (4)设置BP模型的参数 该对话框的操作有 l 设置隐含层的层数,根据不同的隐含层数,会改变每个隐含层的节点数 l 设置迭代次数,在一定的迭代次数下使得网络趋于稳定 l 设置“学习参数”和设置“控制误差” (5)结果浏览 (6)保存的结果文件 6 用户选择数据源进行数理统计 用户可以通过选择文件形式选择不同类型的数据文件,进行常用的数理统计,包括因子分析、聚类分析、多元判别分析、BP模型;数据文件类型可以为ACCESSS数据库文件、EXCEL数据表文件、MAPGIS点文件、TXT文本文件、DBF数据库文件。其中格式要求如下 (1)TXT文件 文本的第一行“GEOSTDATA1.0”; 第二行第一个数为坐标点个数,第二个数据为变量个数(包括坐标点的X/Y变量),第三个数为观测点数; 第三行变量名称(包括坐标点的X/Y变量); 第四行开始变量值。 (2)EXCEL文件 第一行变量名称(包括坐标点的X/Y变量); 第二行开始变量值。 6.1 选择数据源 选择菜单“常用方法”-“多元统计(选择文件.)”-“因子分析”。(其他分析方法类似)。 弹出文件选择对话框,选择文件类型,选择文件,点击打开,进入数据处理界面。 6.2 处理过程 参见“多元统计分析”和“人工神经网络分析”章节。
展开阅读全文

资源标签

最新标签

长按识别或保存二维码,关注学链未来公众号

copyright@ 2019-2020“矿业文库”网

矿业文库合伙人QQ群 30735420