谱聚类算法研究及其在铝土矿浮选工况识别中的应用.pdf

返回 相似 举报
谱聚类算法研究及其在铝土矿浮选工况识别中的应用.pdf_第1页
第1页 / 共70页
谱聚类算法研究及其在铝土矿浮选工况识别中的应用.pdf_第2页
第2页 / 共70页
谱聚类算法研究及其在铝土矿浮选工况识别中的应用.pdf_第3页
第3页 / 共70页
谱聚类算法研究及其在铝土矿浮选工况识别中的应用.pdf_第4页
第4页 / 共70页
谱聚类算法研究及其在铝土矿浮选工况识别中的应用.pdf_第5页
第5页 / 共70页
点击查看更多>>
资源描述:
中图分类号卫2 2 垒 U D C 鱼2 Q 硕士学位论文 学校代码 Q 5 3 三 密级公珏 谱聚类算法研究及其在铝土矿浮选工况识别中的应用 I m p r o v e m e n to fS p e c t r a lC l u s t e r i n gA l g o r i t h ma n dI t s A p p l i c a t i o ni nB a u x i t eF l o t a t i o nC o n d i t i o n sR e c o g n i t i o n 作者姓名 学科专业 研究方向 学院 系、所 指导教师 陈斌 控制科学与工程 数据挖掘与聚类分析 信息科学与工程学院 王雅琳教授 论文答辩日期型三生答辩委员会主席么垄兰 中南大学 2 0 t q - 年5 只 万方数据 学位论文原创性声明 l | U l I I I I I I I II II I II I I I I III If Y 2 6 8 9 16 1 本人郑重声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得中南大学或其他教育机构的学位或证书而使用过的材料。与我共 同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 作者签名丛邀日期二型二年上月生日 学位论文版权使用授权书 本学位论文作者和指导教师完全了解中南大学有关保留、使用学位 论文的规定即学校有权保留并向国家有关部门或机构送交学位论文的 复印件和电子版;本人允许本学位论文被查阅和借阅;学校可以将本学 位论文的全部或部分内容编入有关数据库进行检索,可以采用复印、缩 印或其它手段保存和汇编本学位论文。 保密论文待解密后适应本声明。 作者签名疆坠垫 旦日 万方数据 谱聚类算法研究及其在铝土矿浮选工况识别中的应用 摘要谱聚类作为一种高效的聚类算法,其聚类质量不受样本数据中集 簇类形状的影响,不管样本空间是否非凸,都能得到全局最优。然而, 在聚类过程中对尺度参数的敏感以及需要事先人为设定聚类数使得谱 聚类具有一定的局限性。本文研究能够自适应获得尺度参数和最优聚类 数目的谱聚类算法,并用于基于机器视觉的铝土矿浮选过程工况识别仿 真。 论文的主要内容为 1 分析了谱聚类算法的基本思想及相关理 论,给出了经典谱聚类的算法步骤。 2 通过构建新的相似度函数, 利用数据点邻域内的点密度对数据点之间的相似度进行调整,使之更加 符合实际簇类中数据点之间的相似关系,解决了谱聚类算法在构建相似 度矩阵时对尺度参数敏感的问题;同时,在计算相似度时使用近邻距离 来自适应计算尺度参数,构成基于密度调整的自适应谱聚类算法,克服 了人为设定尺度参数的困难。 3 针对传统谱聚类算法需要事先确定 数据集聚类数的问题,基于数据集中实际簇类之间的数据点在特征空间 中的相对位置关系,通过计算不同聚类数取值时所有数据点在特征空间 的对应映射点之间的夹角,来确定数据集的最佳聚类数,给出了自动确 定聚类数算法,并与基于密度调整的自适应谱聚类算法相结合,提出了 改进的自适应谱聚类算法。 4 以铝土矿的浮选生产过程为对象,利 用基于机器视觉的浮选工况识别系统采集的浮选泡沫图像特征数据进 行仿真实验。实验结果表明,改进的自适应谱聚类算法能够根据浮选泡 沫图像特征准确地识别铝土矿浮选过程中的工况,验证了所提算法的有 效性。图2 0 幅,表1 2 个,参考文献6 6 篇。 关键词谱聚类;尺度参数;聚类数;密度调整;铝土矿浮选过程;工 况识别 分类号T P 2 7 4 万方数据 I m p r o v e m e n to fS p e c t r a lC l u s t e r i n gA l g o r i t h ma n dI t sA p p l i c a t i o n i nB a u x i t eF l o t a t i o nC o n d i t i o n sR e c o g n i t i o n A b s t r a c t A sa r te f f i c i e n tc l u s t e r i n ga l g o r i t h m ,t h ec l u s t e r i n gq u a l i t yo f s p e c t r a lc l u s t e r i n gi sn o ta f f e c tb yt h ec l a s ss h a p eo ft h ec l u s t e rs a m p l ep o 缸. A n d r e g a r d l e s so ft h es a m p l es p a c ei sc o n v e xo rn o t , i tc a l lo b t a i nt h eg l o b a l o p t i m u m .H o w e v e r ,i tm a k e ss p e c t r a lc l u s t e r i n gh a sc e r t a i nl i m i t a t i o n sw h i l e t h ec l u s t e r i n gp r o c e s si ss e n s i t i v ew i 廿lt h es c a l ep a r a m e t e ra n dn e e dt os e t t h en u m b e ro fc l u s t e r sa r t i f i c i a li na d v a n c e .I no r d e rt og e tt h es c a l e p a r a m e t e ra n do p t i m a ln u m b e ro fc l u s t e r sa d a p t i v e l y ,t h i sp a p e rf o c u s e so n t h es p e c t r a lc l u s t e r i n ga l g o r i t h ma n df o rt h es i m u l a t i o no fb a u x i t ef l o t a t i o n c o n d i t i o n sr e c o g n i t i o nb a s e do nm a c h i n ev i s i o n . 1 A n a l y z e dt h eb a s i ci d e ao fs p e c t r a lc l u s t e r i n ga l g o r i t h ma n di t s r e l a t e dt h e o r y ,t h a nd e s c r i b e dt h e a l g o r i t h ms t e p s o fc l a s s i c s p e c t r a l c l u s t e r i n g . 2 T h r o u g hc o n s t r u c t i n gan e ws i m i l a r i t yf u n c t i o nu s i n gt h e d o t d e n s i t yo fd a t ap o i n t s ’n e i g h b o r h o o dt oa d j u s tt h es i m i l a r i t yb e t w e e nt h e d a t ap o i n t s ,t om a k ei tm o r ec o n s i s t e n tt h es i m i l a rr e l a t i o n s h i pb e t w e e nd a t a p o i n t so ft h ea c t u a lc l u s t e r s ,s o l v e dt h ep r o b l e mt h a tS p e c t r a lc l u s t e r i n g a l g o r i t h mi ss e n s i t i v et ot h es c a l ep a r a m e t e rw h e nc o n s t r u c t i n gt h es i m i l a r i t y m a t r i x .M e a n w h i l e ,t h es c a l ep a r a m e t e ri so b t a i n e da d a p t i v e l yb yn e i g h b o r s ’ d i s t a n c ew h e nc a l c u l a t i n gt h es i m i l a r i t y ,c o n s t i t u t et h ea d a p t i v e s p e c t r a l c l u s t e r i n ga l g o r i t h mb a s e do nd e n s i t ya d j u s t m e n t st oo v e r c o m et h ed i f f i c u l t y o fs e tt h es c a l ep a r a m e t e ra r t i f i c i a l l y . 3 A st r a d i t i o n a ls p e c t r a lc l u s t e r i n gn e e dt od e t e r m i n et h en u m b e ro f c l u s t e r i n gi na d v a n c e ,t h i sp a p e rb a s e do nt h er e l a t i v ep o s i t i o n a lr e l a t i o n s h i p i nf e a t u r es p a c eo ft h ed a t ap o i n t sw h i c hi sf r o mt h ea c t u a lc l a s s e si nt h e d a t a s e ti sp r o p o s e d , b yc a l c u l a t i n gt h ea n g l eb e t w e e nt h em a p p i n gp o i n t s i nt h ef e a t u r es p a c eo fa l ld a t ap o i n t sf r o md a t as e t sw h e ns e t t i n gt h e d i f f e r e n tc l u s t e r sn u m b e rt od e t e r m i n et h eo p t i m a ln u m b e ro fc l u s t e r s ,a n d a l l i m p r o v e da d a p t i v es p e c t r a l c l u s t e r i n ga l g o r i t h m i s p r o p o s e db y Ⅱ 万方数据 c o m b i n i n gw i t ht h ea d a p t i v es p e c t r a lc l u s t e r i n gb a s e do nd e n s i t ya d j u s t m e n t . 4 T a k i n gt h eb a u x i t ef l o t a t i o np r o c e s sa st h er e s e a r c ho b j e c t , t h ep a p e r U S et h ei m p r o v e da d a p t i v es p e c t r a lc l u s t e r i n gw h i c hi s p r o p o s e d t od o s i m u l a t i o ne x p e r i m e n t sw i t ht h ei m a g ef e a t u r e so ft h e f l o t a t i o nb u b b l e s c o l l e c t e db yt h e f l o t a t i o np r o c e s sc o n d i t i o n sr e c o g n i t i o ns y s t e mb a s e do n m a c h i n ev i s i o n .E x p e r i m e n t a lr e s u l t ss h o wt h a tt h e i m p r o v e da d a p t i v e s p e c t r a lc l u s t e r i n ga l g o r i t h mt a i la c c u r a t e l yi d e n t i f yt h ec o n d i t i o n so ft h e b a u x i t ef l o t a t i o np r o c e s sb a s e dO nt h ef r o t hi m a g ef e a t u r e sa n dv e r i f yt h e e f f e c t i v e n e s so ft h ep r o p o s e da l g o r i t h m . K e y w o r d s s p e c t r a lc l u s t e r i n g ;s c a l ep a r a m e t e r ;c l u s t e r i n gn u m b e r ;d e n s i t y a d j u s t m e n t ;b a u x i t ef r o t hp r o c e s s ;c o n d i t i o n sr e c o g n i t i o n C l a s s i f i c a t i o n T P 2 7 4 Ⅲ 万方数据 目录 摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..I 目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..I V 1 .绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..1 1 .1 论文研究背景与意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1 1 .2 国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2 1 .2 .1 聚类算法研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.2 1 .2 .2 谱聚类研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.4 1 .2 .3 浮选工况识别方法研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5 1 .3 论文主要研究内容与结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯6 2 .谱聚类理论及算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯8 2 .1 图的分割思想⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯8 2 .2 相似图的建立⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.9 2 .3 谱图理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯9 2 .4 图的拉普拉斯矩阵⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1 0 2 .5 图的划分准则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..1l 2 .6 经典谱聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1 3 2 .7 本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1 3 3 .基于密度调整的自适应谱聚类算法 D A .A S C A ⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.15 3 .1 传统谱聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1 5 3 .1 .1 尺度参数敏感性分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1 5 3 .1 .2 多重尺度数据集⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1 7 3 .2S e l f - T u n i n g 算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1 8 3 .3 基于密度调整的自适应谱聚类算法 D A .A S C A ⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1 9 3 .3 .1 提出算法的思路⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1 9 3 .3 .2 算法分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..2 0 3 .3 .3 算法步骤⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2 0 3 .4 仿真实验结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.2 1 3 .4 .1 有效性实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2 1 3 .4 .2 对比性实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2 3 3 .5 本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..2 6 W 万方数据 4 .改进的自适应谱聚类算法 t a S C A ⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2 7 4 。1 聚类数的影响⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。2 7 4 .2 自动确定聚类数算法 A D C t , r ⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2 8 4 .2 .1 算法的基本思想⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2 8 4 .2 .2 算法步骤⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3 1 4 .3 改进的自适应谱聚类算法0 A S C A ⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一3 2 4 .4 仿真实验与结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.3 3 4 .4 .1 实验方案⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3 3 4 .4 .2 仿真结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3 4 4 .4 .3U C I 数据集聚类效果实验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯3 7 4 .5 本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..3 9 5 .I A S C A 算法在铝土矿浮选工况识别中的应用研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.4 l 5 .1 铝土矿浮选工艺及影响因素分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.4 1 5 .1 .1 铝土矿浮选工艺介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4 l 5 .1 .2 浮选工艺影响因素分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4 3 5 .2 基于机器视觉的浮选工况识别系统⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.4 5 5 .3 浮选泡沫表面特征与工况分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..4 6 5 .3 .1 浮选泡沫表面特征信息⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4 6 5 .3 .2 不同工况下的浮选泡沫表面状态特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4 7 5 .3 .3 浮选泡沫表面特征与工况分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4 9 5 .4 基于改进谱聚类算法的铝土矿浮选工况识别方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5l 5 .5 仿真实验及其结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5 2 5 .5 .1 实验方案⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5 2 5 .5 .2 仿真结果与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯5 3 5 .6 本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5 4 6 .总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。5 5 6 .1 结论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯5 5 6 .2 展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.5 6 参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯5 7 攻读硕士学位期间主要研究成果⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯6 2 致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯6 3 V 万方数据 硕士学位论文1 绪论 1 .绪论 1 .1 论文研究背景与意义 在自然界的所有元素中,铝元素的含量仅次于氧与硅。而作为一种金属元素, 铝的含量又是最丰富的,且其重要性位于铁之后,排在第二。铝元素在自然界的 主要存在形式为氧化物、氢氧化物或铝硅酸盐。铝的相对密度比较小,由其制成 的各种铝合金普遍用于制造各种运输工具和航空航天设备;除去银、铜、金,导 电性第四强的就是铝,所以它常用于制造电线电缆以及各种电器;铝还是导热性 能绝佳的材料,各种热交换器、散热材料都有用到铝;此外,铝的质地偏软,易 于机械加工,可以塑制成各种铝制品。由于这些优良的性能,铝及其化合物成为 了当今社会最经济适用的材料之一,并广泛地应用于现代工业和人们的日常生活 中。因此,确保铝的长期稳定供应对我国国民经济健康、持久、稳定地发展具有 重要意义。 作为氧化铝工业的最佳生产原料,铝土矿在我国的含量非常丰富。但是,我 国的铝土矿资源含硅矿物形态复杂,矿石中铝的含量很高,同时硅的含量也很高, 使得铝土矿的铝硅比偏低,属于中低品位的铝土矿。由此导致在氧化铝生产过程 中的能源消耗过高、生产成本不菲。为此,对我国中低品位的铝土矿进行脱硅去 杂以提高其铝硅比成为了我国铝生产工业的必然选择。细磨正浮选工艺【1 】就是一 种分离铝硅的预脱硅方法。该工艺首先利用磨机将铝土矿磨细,进行矿石解离, 然后通过浮选工艺获得脱硅铝精矿。 矿物浮选为目前选矿过程中最常用的分选矿物的方法,它根据矿物之间物理 或化学性质的差异性,通过将疏水的有用矿物附着在泡沫表面,同时亲水的其余 矿物留于水中,以此来达到分离有用矿物与其它矿物的目的。矿物浮选是一个复 杂的工业过程,其涉及的控制和操作变量很多,一般包括矿浆的P I L l 值、各种浮 选药剂的量、浮选槽的通风量等等。通过对以上变量的控制就能使浮选过程运行 在一个较优的状态[ 2 】。浮选泡沫表面包含着丰富的状态特征信息,而这些信息反 映着浮选过程当前运行状态下浮选效果的好坏【拍】。所以,在工厂的实际浮选工 业过程中,操作人员通过肉眼对浮选泡沫呈现的表面状态来控制浮选药剂和通入 空气的量【7 J 。这种操作的主观性必将导致浮选工业过程无法稳定在一个较优的环 境下运作【8 】。因此,将现在先进的计算机技术引入矿物的浮选过程中对浮选过程 效率的提升以及精矿品位质量的提高具有很好的应用前景【9 】。 近年来,机器视觉与人工智能的迅猛发展为选矿工业朝着自动化、智能化的 万方数据 硕士学位论文1 绪论 方向发展提供了有利条件【1 叭l l 】。首先通过工业摄像机对浮选过程的各个浮选槽建 立实时监控,然后利用数字图像的相关处理技术对由摄像机得到的泡沫表面状态 图像进行分析,获得浮选泡沫的特征信息,最后使用人工智能的算法处理这些数 据,对浮选工况进行辨识,为后续的优化控制创造条件【1 2 ’1 4 】。 本课题研究受国家自然科学基金项目 6 1 2 7 3 1 8 7 “具有复杂非一阶破碎特 性的铝土矿球磨过程建模与粒度分布预测方法研究”、国家自然科学基金创新研 究群体科学基金 6 1 3 2 1 0 0 3 “复杂有色冶金过程控制理论、技术与应用”以及 湖南省科技计划项目 2 0 1 2 C K 4 0 1 8 “锌湿法冶炼绿色生产的自动化关键技术 及应用示范”的资助。论文以谱聚类算法为基础,对其进行研究,提出一种改进 的自适应谱聚类算法,鳃决传统谱聚类存在的问题。同时,将改进算法引入铝土 矿浮选工业工程,利用所提算法对浮选过程产生的浮选泡沫进行聚类分析,实现 对浮选过程工况的监测与识别,为铝土矿浮选工业过程的优化控制提供有力依 据,以提高铝土矿的浮选性能。 1 .2 国内外研究现状 1 .2 .1 聚类算法研究现状 2 1 世纪飞速发展的计算机信息技术产生了越来越多的各类数据,其中的大部 分都蕴涵着对人类有价值的信息,为了帮助人们挖掘出海量数据中所包含的这些 有价值的知识,数据挖掘应运而生【15 1 。数据挖掘就是从大量的数据中寻找出隐 含在其中的一些对人们有用的信息的过程。分类与聚类都属于数据挖掘技术的一 个分支。虽然它们的本质是一样的,都是将数据分成若干个类别,但仍存在区别。 分类过程中所使用的数据对象是事先知道类别标识的,而且数据集含有的类别个 数也是确定的。而聚类却是对没有类别标签、类别数也不知道的数据进行处理。 现实生活中存在大量的无标签的数据,而对大量的数据进行类别标注需要耗费巨 大的人力与时间。聚类由此在数据挖掘中得到了广泛地研科1 6 】。 聚类分析就是根据某种相似规则将数据样本点分割成由近似样本点构成的 多个集合的过程。由聚类得到的同一集合中的样本点彼此相似,而不同集合中的 样本点彼此相异。聚类算法大致可分成下面几类 一 层次聚类算法 层次聚类算法是将数据集中的数据点通过逐渐的合并或分裂构成一棵树以 得到若干个簇类的过程,比如C U R E 算法【1 7 】、C H A M E L E O N 算法【1 8 】。根据聚类 过程中数据点聚成簇类的方式是合并还是分裂,层次聚类算法包括凝聚聚类和分 万方数据 硕士学位论文1 绪论 裂聚类。 凝聚聚类,顾名思义,就是将没有类标识的离散数据点凝聚组成若干个簇类。 凝聚聚类一开始就将数据集中的每个数据对象都看作一个独立的类,然后再根据 某种相似性规则逐步地归并这些类,当最后只剩下一个类或者达到某个终止条件 才结束。 分裂聚类的聚类过程与凝聚聚类刚好相反,它首先将数据集的所有数据点归 为一个类,然后对该类进行一步步地分裂,形成多个更小的类,直到最后每个数 据对象构成一个类为止。 层次聚类算法实现简单,但其聚类过程是不可逆的,如果聚类中的任意一个 步骤发生错误或出现偏差,都将导致聚类质量的下降。 二 分割聚类算法 分割聚类算法以某种评价指标作为目标函数,首先把数据集粗略地划分为若 干个类,然后根据某种相似度度量准则循环不断地对簇类进行调整,直至目标函 数最小或者满足某个终止条件,结束循环,得到最优分类。分割聚类算法的种类 多种多样,其中经典的代表算法有k .均值算法【1 9 】、k - 中心算法以及数据点的类别 带有模糊性的F C M 算法【2 0 】。 由于这些聚类算法在分割聚类的过程中都是基于距离准则来划分的,在凸样 本空间上有比较好的聚类效果,但是当数据集中数据点的样本空间呈现非凸时, 这些算法就很容易陷入局部最优【2 1 1 。 三 密度聚类算法 密度聚类算法是基于密度提出的。从簇类中心出发,作为起始样本点,只要 样本点邻近区域内数据点的密度达到某个值,就将该区域内的点归为一类,重新 以区域边界点为样本点继续往下聚类。D B S C A N 算法阎和O P T I C S 算法∞】都属 于密度聚类算法。 密度聚类算法解决了分割聚类当样本空间呈现非凸时无法得到全局最优解 的问题,但当数据集的样本点分布不均匀时,最后的聚类效果往往不够理想。 四 网格聚类算法 将聚类过程中的每个操作转移到通过把数据集数据点空间划分成有限个大 小相等的单元而构成的一个网格上,这是网格聚类的基本思想。具有代表性的算 法有S T I N G 算法【2 4 1 。 网格聚类算法要想获得比较精确的聚类结果,分割成的单元就得比较小,降 低了算法运行效率。 五 模型聚类算法 模型聚类算法将拟合的思想引入聚类,通过将数据集的各个簇看成一个模 万方数据 硕士学位论文1 绪论 型,然后用数据点进行拟合,对模型最佳拟合的数据点被分为与该模型对应的簇 类,主要有统计学方法【2 5 调和神经网络方法[ 2 7 1 两类。 为了提高算法的聚类效果,改善最后的聚类质量,诸如谱聚类的一些新型聚 类算法相继被提出。 1 .2 .2 谱聚类研究现状 谱聚类[ 2 8 - 3 0 ] 跟经典聚类算法不一样,它不管数据集的簇类分布情况,直接利 用样本点间的相似度进行聚类分析。所以谱聚类在任意分布的簇类结构中都能得 到全局最优。为此,谱聚类算法得到了广泛的研究f 3 1 。3 7 1 。 谱聚类将谱图理论幽】中图的最优分割思想结合到聚类中,通过数据集中数 据点之间的相似度构建成能真实反映簇类结构的带权相似图,利用对图的最优分 割实现对数据点的聚类。传统谱聚类算法的大体步骤可以归纳为一、根据数据 集中样本点的相似度构建数据集的加权图,得到数据集的拉普拉斯矩阵;二、计 算得到拉普拉斯矩阵的特征向量,并以此建立特征向量空间;三、使用K 均值 等传统聚类算法对映射到特征空闻中的数据点进行聚类,获得聚类结果。 尽管谱聚类算法具有不受数据集中簇类形状的影响和不易陷入局部最优值 的优点,但其仍然存在一些缺陷,比如对尺度参数敏感、需人工确定聚类数等。 为寻求这些问题的解决方法,大量研究工作者进行了钻研。 一 避免尺度参数敏感 G o n g 等人【3 9 1 通过数据点的邻近点信息来构造相似图,以此获得数据点之间 的相似性,提出了一种基于局域信息的谱聚类算法。O z e r t e m 等人1 4 0 J 利用M e a n S h i f t 算法求得的权值来建立谱聚类中的相似图,提出了一种M e a nS h i f t 谱聚类 算法。周林等人【4 1 l 提出的基于谱聚类的聚类集成算法,根据谱聚类算法的相关 性质得到多样性簇类子集,再通过连接三元组及N y s t r 6 m 采样方法构建样本点的 相似度矩阵,使得样本点之间的相似性得到扩充。P e n gY a n g 等人【4 2 1 通过对数据 样本点相似性的分析同时结合数据的聚类性质,提出了一种依赖于样本点分布情 况的相似度准则,并将其引入谱聚类得到密度敏感的谱聚类算法。Z e h a i k - M a n o r 等人【4 3 】研究的S e l f - T u n i n g 算法,在计算相似度时加入了样本点周围区域的信息, 使样本点邻域内的数据分布对样本点间的相似度产生作用,更真实地反映了样本 点问的内在联系。 二 自适应确定聚类数目 N g 等人1 4 4 1 利用特征值的特征间隙 e i g e n g i p 来获得最佳聚类数。 Z e l n i k .M a n o r 等人【4 3 】指出这是缺乏理论依据的,并提出了一种S e l f - T u n i n g 谱聚 4 万方数据 硕士学位论文l 绪论 类算法,首先对拉普拉斯矩阵进行排序,然后利用旋转矢量对其本征矢结构反复 重组,以此来找寻最小代价的本征矢集合,得到最优的聚类数目。C a iX i a o y a n 等人【4 5 】通过对样本点相似矩阵以及特征向量进行分析,定义了一个评价聚类优 劣的目标函数一质量分,利用质量分的寻优求解获得最佳的聚类数目。S a n g u i n e t t i 等人断】通过研究一种改进的k - 均值算法,在非标准的拉普拉斯矩阵的特征向量 上多次运行该算法以搜索聚类数的最佳选择。 三 引入监督信息 K a m v a r 等人H 7 】根据随机游动模型利用成对约束信息来修正数据集的亲合矩 阵,提出了K K M 算法,达到了监督信息指导谱聚类的效果。但是X U 等人[ 4 8 】 表示删算法存在一定缺陷,为此在K K M 的基础上进行改进提出了C S C 算法。 D eB i e 等人【4 9 】提出利用已知的约束信息来调整数据集的特征向量空间,提高聚 类效果。赵风、焦李成等人【5 0 】提出了一种半监督谱聚类特征向量选择算法,通 过已有的监督信息找到能很好反映数据点原始分布结构的特征向量组合,改善了 传统谱聚类的聚类性能。王娜等人【5 l 】提出了一种利用监督信息相关性质的主动 学习策略,通过该策略挖掘隐含的数据监督信息,并利用这些监督信息来调整样 本点的相似度矩阵。王玲等人【5 2 ] 通过获取到的监督信息和事先已知的监督信息 一起来指导聚类,弥补了只利用成对约束信息监督聚类过程的不足。蔡世玉、夏 战国等人【5 3 】在带有类标签的样本点中选择谱聚类的初始簇类,提出了一种基于 时间序列相似度的半监督谱聚类算法。 其中,前面两个是影响谱聚类算法聚类性能的主要方面,也是广大学者们对 谱聚类研究的热点问题。尽管为了解决这两个问题已有大量的改进算法提出,可 是大部分算法得到的聚类效果或运算性能依然不够理想。因此,如何避免对尺度 参数敏感以及获得最佳聚类数仍旧是谱聚类算法需要解决的两个重要问题。 1 .2 .3 浮选工况识别方法研究现状 矿物浮选过程中浮选泡沫表面所呈现的特征信息,如色泽、尺寸大小、流动 速度等,跟浮选过程的工况息息相关,充分地反映着工况的好坏。泡沫颜色的深 浅说明泡沫上附着矿物的多少;泡沫流动的快慢反映矿浆液位的高低;泡沫形态 的不稳定表明药剂剂量的不合适。而矿物的入料量、浮选药剂的剂量、浮选槽的 通风量等决定了泡沫的这些特征信息。 如何对浮选泡沫图像进行分析、得到泡沫的特征信息以识别出浮选工况,引 起了国内外学者的大力关注。诸如神经网络、遗传算法等一些人工智能算法逐渐 广泛地应用于浮选过程泡沫图像分析与浮选工况识别中。 万方数据 硕士学位论文1 绪论 刘文礼等人【5 4 】基于煤泥浮选工业过程,利用S O M 算法将由灰度共生矩阵算 法提取的泡沫特征信息进行分类,实现了对煤泥泡沫图像的识别。 郝元宏等人【5 5 ] 针对灰度共生矩阵在提取特征信息时存在参数重叠的问题, 提出对原始特征参数进行正交投影变换,然后对变换后的参数使用支持向量机进 行分类,使得泡沫图像识别的准确性得以提高。 通过灰度共生矩阵对泡沫特征的提取方向不同将导致所提取的矩阵存在很 大差异。为了解决这一问题,阳春华等人【5 6 】提出了基于泡沫纹理信度分配S V M 的矿物浮选工况识别方法,先通过信息增益对各个特征参数于分类器的信度进行 分配,再对浮选泡沫使用一对一加权支持向量机进行工况识别。 V e e r e n d r aS i n 曲等人【5 7 】首先将获取到的浮选泡沫图像分块处理,然后利用 R B F 神经网络对每一小块的R G B 信息进行分类识别。 周开军等人【5 8 】利用分水岭算法、像素分析法等多种方法来提取浮选泡沫的 表面状态信息,并以此信息为输入,通过最小二乘S V M 方法构造的预测模型实 现了浮选过程回收率的在线预测。 虽然在矿物浮选的工况识别中已经应用了很多的人工智能算法,但是谱聚类 算法在该领域内的应用研究未见报道。利用图像处理技术提取泡沫图像的表面特 征信息,再通过谱聚类算法对这些特征信息进行分类,实现浮选泡沫对应工况的 识别,这是一种新颖的矿物浮选工况识别方法。 1 .3 论文主要研究内容与结构安排 谱聚类算法可对任意簇类形状的数据集进行聚类且能得到全局最优的簇类 结果,但传统谱聚类存在对尺度参数敏感以及需要人为确定聚类数等问题。为此, 本文针对传统谱聚类存在的这两个问题开展研究工作,
展开阅读全文

资源标签

最新标签

长按识别或保存二维码,关注学链未来公众号

copyright@ 2019-2020“矿业文库”网

矿业文库合伙人QQ群 30735420