资源描述:
第 1 6卷 第5期 总第 1 0 2期 2 0 1 1 年 1 O月 煤 矿 开 采 Co a l mi n i n g Te c h n o l o g y V o 1 . 1 6 N o . 5 S e ri e s N o . 1 0 2 Oc t o b e r 2 Ol 1 基于聚类挖掘的安全 阀试验 位移数据处理 刘婧 瑶 煤炭科学研究 总院 检测研究分院 ,北京 1 0 0 0 1 3 [ 摘要] 在安全阀试验中,位移是计算流量的重要数据,由于液压系统振动及位移传感器数 据采集误差等原因,需对原始位移数据进行处理。依据位移数据的时序性和分布特征,建立新的相似 函数作为数据聚类的判定准则,改进聚类挖掘方法;并提出新的聚类中心不同的聚类方法,按照时间 顺序将数据聚类与初始聚类中心的选取交替进行,完成数据样本的全部聚类。最后对各簇数据样本中 的异常点进行检测和处理,并采用平均值法计算每簇数据新的聚类中心,作为实际的位移数据。 [ 关键词] 安全阀;数据挖掘;聚类分析;数据处理 [ 中图分类号]T H1 3 7 . 5 [ 文献标识码]A [ 文章编号]1 0 0 6 4 5 2 2 5 2 0 1 1 0 5 - 0 0 0 8 - 0 3 Di s p l a c e me n t Da t a Pr o c e s s i n g o f Sa f e t y- v a l v e Te s t Ba s e d o n Cl us t e r Ana l y s i s UU J i n g . y a o T e s t R e s e a r c h B r a n c h ,C h i n a C o a l R e s e arc h I n s t i t u t e ,B e i j i n g 1 0 0 0 1 3, C h i n a Ab s t r a c t Di s p l a c e me n t i s a n i mp o r t a n t d a t a f o r i la f l o w c a l c u l a t i o n i n s a f e t y v a l v e t e s t Or i g i n a l d i s p l a c e me n t d a t a mu s t b e p r o c e s s e d b e c a u s e o f h y d r a u l i c s y s t e m v i b r a t i o n a n d c o l l e c t i o n e r r o r o f d i s p l a c e me n t s e n s o r s Ba s e d o n t i me - s e q u e n c e a n d d i s t r i b u t i o n c h a r a c t e ri s t i c o f d i s p l a c e m e n t d a t a , t h i s p a p e r s e t u p a n e w s i m i l a r f u n c t i o n a s j u d g m e n t p r i n c i p l e o f d a t a c l u s t e r t o i m p r o v e c l u s t e r e x c a v a t i o n m e t h o d Ne w c l u s t e r me t h o d wa s p u t for w ard Th a t i s ,alt e r n a t i n g d a t a c l u s t e r a n d o r i g i n al c l u s t e r c e n t e r s e l e c t i o n a n d fi n i s h i n g all c l u s t e rs o f d a - t a s a mp l e s fi r s t l y ,t h e n t e s t i n g a n d p r o c e s s i n g o u t l i e r s i n d a t a s a mp l e s ,a p p l y i n g e v e n v a l u e me t h o d t o c a l c u l a t i n g n e w c l u s t e r c e n t e r o f e v e r y c l u s t e r a s a c t u al d i s p l a c e me n t d a t a . Ke y wo r d s s a f e t y v a l v e ;d a t a e x c a v a t i o n ;c l u s t e r a n aly s i s ;d a t a p r o c e s s i n g 安全阀是液压系统中重要的安全保护元件 ,需 在一定压力下通过试验测定安全 阀流量 ,标定其性 能,一般通过采集液压缸活塞位移 ,采用位移 一 时 间法确定安全阀的流量 ,因此 ,位移数据精确与否 将直接影响流量的测定 。 在国内液压系统数据采集研究中,鲁永秋等人 设计了液压系统压力和流量的数据采集系统 ,采用 D S P芯片控制数据采集模块的软硬件实现⋯。胡学 军等人基于 M A T L A B的数据采集工具箱开发了液 压元件试验 台 C A T系统软件和硬件 2 J 。国内对液 压系统压力和流量的研究多集中在数据采集系统的 软硬件实现,针对试验数据误差分析处理的深入研 究甚少 。 针对液压系统试验数据分析和处理存在 的问 题,通过多次安全阀流量试验,提出采用数据挖掘 对实时获取的位移试验数据进行分析处理。由于传 感器采集频率较高时出现数据点重复或迂回扰动现 象及液压系统振动等因素的影响,采集得到的位移 数据点主要特征是 时序性和呈分段带状分布。根 据位移数据的特征,建立新的相似函数作为聚类判 定的准则 ,改进聚类挖掘方法 ,提出依据聚类簇的 部分数据依次确定聚类中心,并按照时间顺序完成 每簇数据的聚类。利用改进的聚类分析法对位移数 据点进行有效地聚类分析 ,再通过异常点检测处理 原始试验数据的误差点。最后利用平均值法得到每 簇数据新 的聚类中心,作为实际的位移数据。 1 系统工作原理及数据定义 1 . 1 液压系统工作原理 在安全阀试验过程 中,为了计算单位时间内工 作缸液体体积的变化量以确定安全阀实时流量值, 需通过位移传感器采集工作缸活塞位移数据,系统 工作原理如图 1 所示 。 1 . 2 获取位移数据 通过位移传感器实时采集得到原始试验数据, 需对数据属性进行定义。每个数据点具有 3种属 [ 收稿日期]2 0 1 1 0 6 1 5 [ 基金项目]“ 十一五”科技支撑项目大采高综放开采技术标准体系研究 2 0 0 8 B A B 3 6 B 1 1 [ 作者简介]刘婧瑶 1 9 7 9 一 , 女,河北邯郸人,博士,工程师 ,主要从事煤炭机械检测设备研究。 8 学兔兔 w w w .x u e t u t u .c o m 刘婧瑶 基于聚类挖掘的安全阀试验位移数据处理 2 0 1 1年第5期 图 1 安全 阀流 量测试 原理 性 X属性值表示时间,y 属性值表示位移,标识 属性值表示该簇数据所属簇的编号。原始数据样本 记录如表 1所示 。 表 1 原始数据样本记录 2 改进聚类分析与优化 聚类分析是一种数据挖掘方法,从大量、杂乱 连续的数据中发现新的、有实际意义的数据点 。数 据挖掘的方法有 分类挖掘 、关联挖掘、聚类挖掘 和异类挖掘 等。聚类挖掘是将大量数据划分为 性质相 同的子类 ,以便于分析数据的分布情况 。聚 类的结果是得到一组数据对象的集合,称其为簇。 定义 l 设 Q表示一个有 n个样本的集合, s i 表示其中的样本, 为预设阈值,若对于任意的 .s , |s ∈C, 都有 F .s 。S ≤6 1 则 C称为一类。 划分算法是聚类挖掘的一种重要方法,划分算 法首先给定要构建 的划分数 目,并创建初始划分 , 然后采用一种迭代的重定位技术改进划分,使同一 簇类中的对象尽可能接近,反之,尽可能远离。 2 . 1 划分算法改进 聚类分析对于任意形状的数据分布难以实现有 效聚类。初始聚类中心选取是否适当,将直接影响 到聚类效果 。 基于距离 法和相似系数法 2种聚类方法 的特 征,提出改进聚类算法对任意形状数据簇进行聚类 分析。改进聚类算法主要是具有一定规则有序分布 的数据对象,按照顺序对原始数据点分组,选取第 1组内第 1点作为该组的初始聚类 中心,然后选定 阈值以相似函数作为优化目标函数进行迭代运算, 确定第 1 簇聚类的数据样本点。第 1 组内未被选人 第 1簇的其余点作为第 2簇的数据点,并通过平均 值计算其数据中心作为第 2簇聚类的初始聚类中 心。按照这种算法依次交替确定每一簇的聚类中心 和数据样本点。 假设数据库 D 中包含所 有位移数据样本 ,该 集合记做 Q ,集合中有 n 个有序元素 S i .Y i i 1 , 2 。 ⋯n 。对全样本集按照时序进行分类后, 生成簇的个数为m 1 ≤m≤n , 每个簇用 Q的子 集 G j j1 , 2 , ⋯m表示 。选取相似函数 y y K S f , f。 l i ≠ i . j1 , 2 , ⋯n 2 ‘ J 改进聚类算法框架如下 1 按照顺序将原 始样本数据分为 m簇 ,表 示为 G ,每簇样本数据个数相 同为 P,并设定数 据样本分类阈值 。 2 选第 1 个数据样本点 .s 。 作为第 1 簇 G 的 种子点,计算种子点与簇 G 中每个点的相似函数 值即 y.一 y .s l ,|s f l, u2 ,3 ,⋯p 3 “ 1 ““ 将 初 次 聚 类 分 析 后 的 簇 记 做 G ,若 .s l , .s , 则将样本 .s 作为异常点滤除。 3 按 照 步 骤 2 中 的 方 法 依 次 滤 除 簇 G f 2 ,3 ,⋯m中的粗大误差点 ,并相应得到 不包含异常点的数据聚类簇G ; 1 , 2 ,⋯ m 。 2 . 3 确定新的聚类中心 为了消除数据误差的影响,将得到的每簇数据 样本新聚类中心作为进行流量计算时实际位移点。 计算方法如下 1 计算数据簇 G ; 中数据样本 的平均值, ∑r y e ; 作 为 数据 集的聚 类中 心。 cl 2 依次计算G ; 1 , 2 ,⋯m 数据集的聚 类中心 ,记做 G 1 ,2,⋯m。 3 最后确定每簇样本集新的聚类中心。 截取部分数据样本簇并显示其新聚类中心,如 表 2所示。 表2 新聚类中心记录 3 位移数据处理 3 . 1 位移数据聚类分析 在对位移数据进行处理的过程中,首先按照时 间顺序对原始数据进行分组,然后应用改进聚类分 析法对位移数据进行聚类分析,并基于距离法检测 和处理异常点,得到的聚类簇数据记录如表3 。 3 . 2 确定新的聚类中心 为了消除误差影响,通过聚类挖掘和计算得到 1 0 表 3 聚类簇数据记录 每簇数据样本新的聚类中心作为流量计算时的实际 位移点。截取部分数据样本并显示其聚类中心如表 4和图2所示。 表4 聚类中心记录 n 2 3 2 3 5 0 .2 4 0 .2 4 5 0 .2 5 0 . 2 5 5 0 .2 6 时间/ s 图2 位 移数据聚 类中心 如图2中所示,菱形表示对原始试验数据进行聚类 分析后得到各簇数据的聚类中心。 4结论 提出新的聚类判定准则 相似函数法 ,改进聚 类分析方法 ,可有效 、快速地实现数据样本的归属 判定和聚类。采用改进的聚类分析法, 先将原始数 据按照时序划分为 n个数据组 G i 1 , 2 ,3 , ⋯ ,n ,当第 G 2 ,3 ,⋯,m 簇数据样本聚 类时, 将 G 簇数据中不属于 G 簇的数据样本划分 为第 G 簇数据样本,依据这部分数据样本计算 确定第 G 簇的聚类中心;改进的聚类分析法依 据位移数据的有序性及其分布特征,将聚类中心初 下转4页 学兔兔 w w w .x u e t u t u .c o m 总第1 0 2期 煤矿 开 采 2 0 1 1年第5期 3结论 图5沿空 留巷工艺流程 1 为适应村庄等建筑物不搬迁采煤 的需要 , 逐渐发展了充填开采 、部分开采 、采空区冒矸空隙 注浆充填 、覆岩 离层 区注浆 、完 全开采 、顺 序开 采 、协调开采 、连续开采 、对称背向开采 、同时开 采等一系列建筑物下 、铁路下、水体下采煤方法。 就控制地表沉陷效果来说,充填开采无疑是最有效 的方法 。 2 对于现代煤矿充填技术的应用分类,是 近几年我国煤矿比较常用的充填采矿技术 ,有些充 填技术没有罗列,例如水砂充填、风力充填等在现 代煤矿中利用较少,也不是煤矿充填开采技术的发 展方 向。而对于未来充填技术的发展 ,必须满足控 制地表变形、处理矿井废弃物、保障矿井产量、降 低充填成本等条件 ,只有同时满足这些条件的充填 采矿方法才是真正意义的绿色开采。 3 随着绿 色开采理论 的提 出,充填采矿技 术拥有了更广阔的发展空间 ,但发展的同时也存在 许多问题需要完善,例如干式矸石充填其充填体的 压缩率较大,最终产生的地表变形较大 ,对地表沉 陷控制要求较高的场合该方法不太适合;膏体充填 与高浓度胶结材料充填其充填成本过高,存在充填 工作面积水与淤泥过多等问题,而所有充填采矿的 主要问题还是充填工作面产量过低。因此,对于以 后充填开采技术的研究提出了更高的要求。 4 煤矿充填开采技术的工艺与设备已趋于 完善 ,但是对 于充填 开采技术 的理论研究 还很缺 乏 ,在充填开采条件下顶板及上覆岩层的活动与破 坏规律、充填工作面矿山压力显现规律等问题还需 做更深入的研究。 [ 参考文献] [ 1 ]钱鸣高,许家林,缪协兴 . 煤矿绿色开采技术 [ J ].中国矿 业大学学报 , 2 0 0 3 o 4 3 4 3 3 4 8 . [ 2 ]钱鸣高,许家林 ,缪协兴 .煤矿绿 色开采技 术的研 究与实 践 [ J ].能源技术与管理 ,2 0 0 4 0 4 1 4 . [ 3 ]闰少宏 ,张华兴 .我国 目前煤矿充填开 采技术现状 [ J ].煤 矿开采 ,2 0 0 8,1 3 0 3 1 3 ,l 0 . [ 4]孙文标 ,郭军杰 ,张建 立 ,等 .煤 系 固体废 弃物用 作充填 材 料改善煤矿安全和环境状况 [ J ].矿业安全与环保,2 0 0 8 0 1 7 O 一 7 2 . [ 5 ]刘鹏亮. 邢东矿充填巷式开采数值模拟与现场实测研究[ D ]. 北京 煤炭科学研究总院 ,2 0 0 7 . [ 6 ]李兴尚. 建筑物下条带开采冒落区注浆充填减沉技术的理论 研究 [ D].徐州 中国矿业 大学 ,2 0 0 8 . [ 7 ]刘建 功,赵庆彪 ,张 文海 ,等 .煤 矿井 下巷道矸 石充填技 术 研究 与实现 [ J ].中国煤炭 ,2 0 0 5 0 8 3 6 3 8 . [ 8 ]张吉雄 .矸石直接充填综采 岩层移动控制及其应用研究 [ D]. 徐州 中国矿业大学 ,2 0 0 8 . [ 9 ]张吉雄, 缪协兴 . 煤矿矸石井下处理的研究[ J ]. 中国矿业大 学学报 , 2 0 0 6 0 2 1 9 7 2 0 0 . [ 1 0 ] b 万奎, 李强,徐慧,等.条带开采矸石充填控制变形 的数值模拟研究 [ J ]. 矿业安全与环保, 2 0 0 8 0 2 4 7 . [ 1 1 ]刘长友 , 杨培举,侯朝炯,等.充填开采时上覆岩层的活动 规律和稳定性分析 [ J ].中国矿业大学学报 ,2 0 0 4 0 2 . [ 1 2 ]郭振华. 村庄下膏体充填采煤控制地表沉陷的研究 [ D ]. 徐州中国矿业大学, 2 0 0 8 . [ 责任编辑施红霞] 上接 1 0页 始化与数据样本特征相关联 ,避免 由于聚类中心的 选取不当引起聚类误差;同时,改进的聚类算法按 照时间顺序对数据样本进行分组,大大降低了迭代 运算次数,提高了计算效率。 利用改进聚类技术有效地对原始数据样本进行 聚类分析后,对每簇数据进行异常点检测和处理, 减小了误差;并采用平均值法计算每簇数据的新聚 类中心作为实际位移数据点,以便更为准确地计算 安全 阀流量。 [ 参考文献] [ 1 ]鲁永秋,高钦和,蒋威 . 液压系统的压力、流量数据采集 4 系统设计 [ J ].机床与液压,2 0 0 8 ,3 6 1 1 1 2 4 1 3 0 . [ 2 ]胡学军, 滕达,谈宏华 . 基于 M A T L A B的液压试验台的数 据采集与处理 [ J ].自动化技术 与应用 ,2 0 1 0,2 9 3 . [ 3 ]王晗,孔令富. 一种新的增量式关联规则数据挖掘方法研 究 【 J ]. 仪器仪表学报, 2 0 0 9 ,3 0 2 4 3 8 4 4 3 . [ 4 ]张贺,蔡江辉,张继福,等 . 信息熵度量的离群数据挖掘 算法 [ J ]. 智能系统学报, 2 0 1 0 , 5 2 1 5 0 1 5 5 . [ 5 ]孙庆先,陈秋平, 方涛,等 . 基于模糊聚类的多尺度空间 数据挖掘模型及其矿 山应用 [ J ].上海交通大学学报 ,2 0 0 8 , 4 2 2 1 9 4 1 9 7 . [ 6 ]周荃 ,赵风英,王崇俊 ,等 .数据 挖掘方 法在入侵 检测 中 的应用研究 [ J ]. 模式识别与人工智能,2 0 0 8 , 2 1 4 . [ 7 ]陈大峰,汪加才,韩冰青 .基于离群数据挖掘的计算机审计 [ J ]. 南京审计学院学报, 2 0 0 9 , 6 2 6 2 6 6 . [ 责任编辑李宏艳] 学兔兔 w w w .x u e t u t u .c o m
展开阅读全文