蚁群投影寻踪回归在湖泊水质富营养化评价中的应用.pdf

返回 相似 举报
蚁群投影寻踪回归在湖泊水质富营养化评价中的应用.pdf_第1页
第1页 / 共5页
蚁群投影寻踪回归在湖泊水质富营养化评价中的应用.pdf_第2页
第2页 / 共5页
蚁群投影寻踪回归在湖泊水质富营养化评价中的应用.pdf_第3页
第3页 / 共5页
蚁群投影寻踪回归在湖泊水质富营养化评价中的应用.pdf_第4页
第4页 / 共5页
蚁群投影寻踪回归在湖泊水质富营养化评价中的应用.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述:
蚁群投影寻踪回归在湖泊水质富营养化评价中的应用 * 方崇 1 黄伟军 1 周秀平 2 1. 广西水利电力职业技术学院, 南宁 530023;2. 四川大学水利水电学院, 成都 610065 摘要 根据湖泊富营养化特性, 选择总磷 TP 、 总氮 TN 、 耗氧量 CODMn 、 透明度 SD 、 生物量等 5 个评价指标作为 评价因子, 建立湖泊富营养化评价的投影寻踪分析模型, 采用蚁群算法对评价模型进行优化, 并将该模型应用于我国 8 个湖泊富营养化程度的评价。研究表明 投影寻踪回归分析法, 避免了传统评价方法由于主观原因造成的误差, 评 价结果合理可信、 方法简单, 为湖泊水体营养化状态的评价提供了新途径。 关键词 投影寻踪; 蚁群优化算法; 湖泊; 富营养化; 综合评价; MATLAB APPLICATION OF PROJECTION PURSUIT REGRESSION BASED ON ANT COLONY ALGORITHM IN UATION OF LAKE EUTROPHICATION Fang Chong1Huang Weijun1Zhou Xiuping2 1. Guangxi Technology College of Water Conservancy and Electric Power, Nanning 530023,China; 2. School of Water Resource and Hydropower,Sichuan University,Chengdu 610065, China AbstractBased on characteristics of lake eutrophication,total phosphorus TP ,total nitrogen TN ,oxygen consumption CODMn ,transparency SD ,microbial population numbers,etc. 5 uation indicators were chosen as uation factors. Projection pursuit analysis model of uation of the lake eutrophication was established,The uation model was optimized using ant colony algorithm,which was applied to analysis of eight lakes. The uation results are accurate,this is simple,and some errors were eliminated due to avoiding the subjective factors for traditional s. Projection pursuit analysis is a new uation of the lake eutrophication. Keywordsprojection pursuit; ant colony algorithm; lake; eutrophication;comprehensive uation; MATLAB * 国家自然科学基金项目 No. 50679047、No. 50779042 。 0引言 湖泊富营养化评价的目的是为了准确反映水环 境质量和污染状况, 预测将来的发展趋势, 为开展环 境污染和综合治理及环境规划提供科学依据 [ 1]。多 年来, 国内外学者对湖泊富营养化评价进行了深入研 究, 提出了众多评价模型和方法 [ 2- 7], 对湖泊富营养化 评价理论的发展起到一定的促进作用。但由于各湖 泊的成因、 地理位置、 环境条件等方面的差异以及受 人类活动的影响程度不同, 湖泊富营养化的类型和富 营养化的进程均不一样, 其评价标准也不尽相同 [ 8]。 本文综合考虑影响湖泊富营养化的各种因素, 选 择总磷 TP 、 总氮 TN 、 耗氧量 CODMn 、 透明度 SD 、 生物量等 5 个具有代表性的因素作为评判指 标, 采用投影寻踪回归理论对原始数据进行处理, 提 取原始样本的特征, 将蚁群算法引入到投影方向优化 计算中, 建立湖泊富营养化等级评价的数学模型, 在 此基础上, 编制基于 MATLAB 语言相应的计算程序。 利用该评价模型对湖泊水体富营养化进行综合评价, 并通过实例予以验证。投影寻踪回归评价理论克服 以往分析方法的不足, 为湖泊富营养化等级的评定提 供了一种简单方便、 客观准确的新方法, 对我国湖泊 污染的综合治理与防治具有重要意义。 1基于蚁群算法投影寻踪回归评价模型 1. 1投影寻踪评价模型的建模步骤 投影寻踪评价方法是针对目前常规的系统综合 评价方法的形式化、 数学化等局限性, 以及对某些高 维非正态评价问题的适应能力不强等不足之处, 提出 的一种由样本数据驱动的探索性数据分析方法。该 方法的思路是把高维数据通过某种组合投影到低维 子空间上, 对于投影值的构形, 采用投影目标函数来 401 环境工程 2010 年 6 月第 28 卷第 3 期 描述投影值暴露原系统综合评价某种分类排序结构 的可能性大小, 寻找出使投影指标函数达到最优的投 影值。然后根据该投影值来研究和分析高维数据的 分类结构特征 [ 9]。设等级评价表中各指标值的样本 集为 { xij| i 1, 2, , n; j 1, 2, , m} , 则建立投影 寻踪评价模型的步骤如下 [ 10-11] 1 数据预处理。对数据进行归一化处理, 见式 1 、 式 2 对于越大越优的指标, 见式 1 x* ij xij- xjmin xjmax- xjmin 1 对于越小越优的指标, 见式 2 x* ij xjmax- xij xjmax- xjmin 2 其中 x* ij表示指标值经过归一化处理后的数据序列; xjmin、 xjmax分别表示第 j 个指标的最小值和最大值。 2 线性投影。若 a a1, a2, , am 为 m 维单位向 量, 则样本 j 在一维线性空间的投影特征值 zj的表达 式如式 3 zj ∑ m j 1 ajx* ij , i 1, 2, , n 3 3 建立投影目标函数。将目标函数 Q a 定义 为类间距离 S a 与类内密度 D a 的乘积, 即投影目 标函数可以表示为式 4 Q a S a D a 4 其中 类间距离用样本序列的投影特征值方差按式 5 计算 S a ∑ n i 1 zi- zi 2 n - 1 槡 5 其中珋zi为在投影方向上投影特征值的均值, S a 值 愈大, 越发散。 设投影特征值间的距离 rik | zi- zk| k 1, 2, , n , 则式 6 为 D a ∑ n i 1 ∑ n k 1 R - rik f R - rik 6 其中 R 为局部密度窗宽参数, 其取值与样本数据结 构有关。类内密度 D a 愈 大, 分 类 愈显著; 函数 f R - rik 为一单位跃阶函数, 当 R≥rik时, 其值为 1, 反之为 0。 4 优化最佳投影方向。当各指标值的样本集给 定时, 投影指标函数 Q a 只随着投影方向 a 的变化 而变化。不同的投影方向反映不同的数据结构特征, 最佳投影方向就是最大可能暴露高维数据某类特征 结构的投影方向, 因此可通过求解投影目标函数最大 化问题来寻找最佳投影方向, 即求解见式 7 maxQ a s. t. ‖a‖ { 1 7 可以利用蚁群优化算法来解决上述优化问题。 5 湖泊水质富营养化等级评价。得到近似最佳 投影方向后, 计算各训练等级样本点的投影值, 根据 各训练等级及其对应的投影值建立基于投影值的等 级评价方法, 并将待评价样本进行归一化处理后计算 其投影值, 利用投影值等级评价方法得到评价样本所 属等级。 1. 2蚁群优化算法的实现过程 蚁群算法 ant colony algorithm, ACA 是意大利 学者 Marco Dorigo 等提出的一种仿生寻优算法。参 加寻径的蚂蚁根据留在链路上的信息素交互来选择 新的路径, 从而达到寻优的目的。蚁群算法具有分布 式计算机特性和较强的稳健性, 易于与其他优化算法 融合 [ 12]。 自然界中的蚂蚁在寻找食物或遇到障碍物时, 总 能找到一条从食物到蚁巢或绕过障碍物的最优路径。 原因在于蚂蚁运动中会在所经过的路径上释放出信 息素, 后续蚂蚁可根据前面蚂蚁遗留下来的信息素选 择下一条要走的路径。一条路径上的信息素越高, 说 明这条路径被选中的次数越多, 即路径的性能更优, 后续蚂蚁选择这条路径的概率就更大, 由此构成一个 学习信息的正反馈, 从而逐渐逼近最优解。 蚁群算法最初用于 TSP 问题, 以此建立算法的 模型 [ 13]。TSP 问题组合优化问题中的标准问题, 可 以用有向图 G V, E 表示, 其中 V 1, 2, , n 表 示节点的集合, E { ij } 表示边的集合, D dij 表 示 i, j 间的欧氏距离。在应用蚁群算法求解 TSP 问题 之前需要限定每个人工蚂蚁在一个路径上每个城市 只能选择 1 次。所有的蚂蚁都搜索到一个完整合法 的路径之后, 根据蚂蚁走过的线路更新各个边对应的 信息素, 在搜索过程中, 蚂蚁根据各个路径上的信息 素以及路径的启发信息计算概率, 根据此概率选择下 一个城市。人工蚂蚁在 t 时刻由 i 转移到城市 j 的概 率见式 8 rk ij t [ tij t ] a[ h ij t ] b  sDk[tis t ] a[ h is t ] b, jDk 0, { 其他 8 501 环境工程 2010 年 6 月第 28 卷第 3 期 其中 Dk { 0, 1n - 1}- tabuk 表示人工蚂蚁到达 第 k 个城市时, 下一步允许选择城市的集合。人工蚂 蚁具有记忆功能, 用 tabuk k 1, 2, m 记录该蚂蚁 当前已走过的城市, 随着进化过程作动态调整。随时 间推移, 以前留下的信息逐渐消失。hij t 为 ij 间的 能见度, 取 hij 1 /dij; tij t 表示 ij 在 t 时刻的信息素; d 表示信息素的相对重要程度。1 - ρ 表示信息素挥 发程度。经过一定时刻蚂蚁完成一次循环, 对各个路 径上的信息素根据公式 9 , 公式 10 进行调整。 tij t 1 rtij t Dtij t 9 D tij t  m k 1Dt k ij t 10 式中Dt k ij t 第 k 只蚂蚁在本次循环中留下 ij 上的信息素; Dtij 本次循环留在路径 ij 上的信息素 的增量。Dtk ij值见式 11 Dtk ij Q Lk , 若第 k 只蚂蚁在本次循环中经过 ij 0, { 否则 11 其中 信息素强度 Q 是常数, Lk表示第 k 只蚂蚁在本 次循环中走的路径总长。初始时刻, tij 0 C 常 数 , Dtij 0 i, j 0, 1, , n - 1 。 2应用实例 2. 1评价因子及评价标准的选取 由于影响水质富营养化程度的因素较多, 因此, 在选择评价参数时要尽可能选取从不同方面、 不同角 度真实 客 观 地 反 映 湖 泊 水 质 富 营 养 化 程 度 的 因 子 [ 14]。本文选用了文献[ 15] 中的分级标准和原始数 据进行计算。根据富营养化的特性, 选择总磷 TP 、 总氮 TN 、 耗氧量 CODMn 、 透明度 SD 和生物量 作为评价因子; 湖泊富营养化状态综合评价等级为 5 级, 即 Ⅰ级 极贫营养 、 Ⅱ级 贫营养 、 Ⅲ级 中营 养 、 Ⅳ级 富营养 、 Ⅴ级 重富营养 。富营养化评 价分级标准如表 1 所示。 2. 2湖泊富营养化状态投影寻踪评价模型的建立 表 1 中的每个样本有 5 个评价指标 总磷、 总氮、 耗氧量、 透明度和生物量。对湖泊富营养化评价等级 的标准样本建立投影寻踪评价模型, 即以 5 个水质特 征参数来综合判定湖泊富营养化状态, 为了使得投影 函数 Q a为最大, 必需对以上 5 个参数同时进行优 化, 实质上属于多维参数寻优的问题。本文采用蚁群 表 1水质富营养化评价因子与分级标准 序号营养状态级别 评价指标 ρ TP/ mg m - 3 ρ TN/ mg m - 3 ρ CODMn / mg L - 1 生物量 / 1 104 L - 1 SD / m 投影值 1Ⅰ级 极贫营养1200. 09437. 000. 000 2Ⅱ级 贫营养4600. 361512. 000. 016 3Ⅲ级 中营养233101. 80502. 400. 040 4Ⅳ级 富营养11012007. 101000. 550. 280 5Ⅴ级 重富营养660460027. 1010000. 171. 362 算法进行参数优化选, 利用 MATLAB 语言进行编程, 由于在基本蚁群算法中, 信息素增加强度 Q 、 信息启 发因子 α 、 期望启发因子 β 和蚂蚁总数 m 等有关参 数的设定, 尚无严格的理论依据, 至今仍然没有确定 最优参数组合的有效方法, 一般情况下都是根据经验 而定的。本模型中上述参数的确定是依据文献[ 12] 总结出的方法进行蚁群算法最优组合参数的选择。 最后选择各参数为 信息启发因子 α 0. 5; 期望启 发因子 β 1; 信息素挥发系数为 ρ 0. 8, 则信息残 留因子 1 - ρ 0. 2; 蚁群数量为 m 100, 信息素增 加强度 Q 1, 迭代次数 k 50 。蚁群算法的迭代过 程见图 1。 图 1蚁群算法的迭代过程 在回归分析过程中, 首先用式 1 、 式 2 对样本 数据进行归一化处理, 在 MATLAB 环境下运行程序 后, 得 到 最佳 投 影 方 向 a* - 0. 344,- 0. 547, - 0. 835,- 0. 477, 0. 040 , 把最佳投影方向代入式 3 即可求得等级标准样本投影特征值。将待评价 湖泊样本的投影特征值与等级标准样本的投影特征 值相比较, 根据投影值的大小, 即可确定待评价湖泊 富营养化等级。 601 环境工程 2010 年 6 月第 28 卷第 3 期 2. 3实例分析 本文选用文献[ 15] 中的分级标准和实例进行分 析。对我国青海湖、 抚仙湖、 洪泽湖、 巢湖、 滇池、 武汉 东湖、 杭州西湖和草海等 8 个湖泊进行富营养化等级 评价。选取 5 项富营养化评价因子的监测数据作为 待评价样本值。根据水质评价样本, 建立综合分类评 价的投影寻踪评价模型, 其计算结果列于表 2。 表 2湖泊富营养化指标值及评价结果 序号湖泊名称 评价指标 ρ TP / mg m - 3 ρ TN / mg m - 3 ρ CODMn / mg L - 1 生物量 / 104L - 1 SD / m 投影值评价等级SVM 6青海湖202201. 4014. 604. 500. 021贫营养中营养 7抚仙湖202101. 6119. 007. 030. 026中 - 贫营养中营养 8洪泽湖1004605. 5011. 500. 300. 153富营养富营养 9巢湖3016708. 2625. 300. 250. 308富营养富营养 10滇池2023010. 13189. 200. 500. 172富营养富营养 11武汉东湖105200010. 701913. 700. 400. 554富营养重富营养 12杭州西湖130216010. 326920. 000. 350. 919重富营养重富营养 13草海177186051. 007060. 000. 411. 585重富营养重富营养 从湖泊样本投影特征值的大小来看, 投影特征值 越大, 说明湖泊营养化程度越严重, 水质越差。由表 2 可知, 样本 12、 13 杭州西湖、 草海的投影特征值 分别为 0. 919、 1. 585, 与分级标准中Ⅴ级的投影特征 值 1. 362 接近, 因此, 可以判定杭州西湖和草海的富 营养化程度等级为Ⅴ级, 即属重富营养化状态, 说明 水体污染最严重, 环境管理部门应及时对相应水域采 取治理措施; 同理, 可以判定样本 8、 9、 10、 11 洪泽 湖、 巢湖、 滇池、 武汉东湖 的富营养化程度等级 Ⅳ 级, 属富营养化状态; 样本 7 抚仙湖 的富营养化程 度等级介于Ⅱ级和Ⅲ级之间, 属中 - 贫营养化状态, 水质较优; 样本 6 青海湖 的富营养化程度等级Ⅱ 级, 属贫营养化状态, 水质最优。 由表 2 可知,基于蚁群投影寻踪分析模型的评 价结果与支持向量机方法 SVM 的评价结果, 水质 状况基本相符, 从而验证了本文方法的准确性。两种 方法的评价结果不同的是武汉东湖。从原始数据来 看, 武汉东湖除了生物量指标超过Ⅴ级外, 其余的 4 项指标值均属Ⅳ级范围内, 说明本方法所得结果更切 合实际情况。 3结论 1 将投影寻踪评价模型应用于湖泊富营养化等 级评价, 采用蚁群算法对评价模型进行优化, 并利用 该模型对我国 8 个湖泊进行了实例检验。结果表明, 利用投影寻踪进行湖泊富营养化等级评价是切实可 行的。 2 投影寻踪回归分析在评价过程中避免了人为 主观因素影响, 评价结果具有客观公正、 精度较高, 易 于推广应用。 3 蚁群算法是优化领域中相对较新的一种随机 启发式搜索算法, 具有全局寻优、 搜索能力强、 工作效 率高等优点。将蚁群算法应用于投影寻踪评价模型 中的优化问题, 可以有效地寻找最佳投影方向, 为投 影寻踪优化问题的解决提供了一条行之有效的途径。 但蚁群算法在解决大型优化问题时, 易出现过早收敛 于非全局最优解以及计算时间过久的缺点, 还需要进 一步研究。 参考文献 [1 ] 张忠祥,钱易. 城市可持续发展与水污染防治对策 [M] . 北 京 中国建筑工业出版社,1998. [2 ] 赵泽斌. 模糊数学在湖泊水质富营养化评价中的应用[J] . 黑 龙江水专学报, 2007,34 2 115- 117. [3 ] 李祚泳,邓新民. 湖泊富营养化的灰色层次决策法综合评价 [J] . 上海环境科学, 1992,11 3 17- 21. [4 ] 邬敏,李祚泳,刘智勇, 等. 一种改进的集对分析法在湖泊富 营养化评价中的应用[J] . 水资源保护, 2009,25 2 5- 9. [5 ] 孔健健,张江山. 属性识别理论模型在湖泊水质富营养化评 价中的应用[J] . 环境工程, 2004,22 5 66- 68. [6 ] 饶清华,张江山. 熵权物元分析模型在湖泊富营养化评价中 的应用[J] . 环境工程,2006,24 6 80- 82. 下转第 94 页 701 环境工程 2010 年 6 月第 28 卷第 3 期 物, 在适宜的 pH 值条件下, 微生物大量繁殖, 堆料中 的有机质在胞外酶的作用下发生水解, 变成水溶态有 机质, 从而被微生物分解利用, 同时产生大量的氨气, 大量的氨气挥发会影响堆肥的 pH 值, 致使堆肥的 pH 值上升, 当 pH 值过高 pH 9 或过低 pH 4 时, 会抑制微生物对有机质的分解速度。因此, 在堆 肥后期, 氨气含量减少, 有机质含量的变化也不显著。 3结论 1 堆肥初始, 氨气含量很低, 随着堆肥的进行, 氨气的释放量也 随之 升 高, 在 第 5 天 达 到 最 大 值 156. 15 mg/kg , 然后, 氨气下降, 堆肥后期氨释放 量基本稳定在5 mg/kg左右。 2 在整个堆肥过程中, 全氮含量先降低后增加; NH 4 -N 含量先快速增加, 后缓慢减小至稳定的变化 趋势, NO - 3 -N 含量先下降后上升; pH 值先下降后升 高, 最终稳定在中性范围内; w C /w N 先增加后下 降, 但最终没有趋于稳定; 有机质含量呈显著下降 趋势。 参考文献 [1 ] 杨延梅, 张相. 锋, 杨志峰, 等. 厨余好氧堆肥中的氮素转化与 氮素损失研究[J] . 环境科学与技术, 2006, 29 12 54- 56. [2 ] Barrington S,Choinire D,Trigui M, et al. Effect of carbon source oncompostnitrogenandcarbonlosses [J ] .Bioresource Technology, 2002, 83 3 189- 194. [3 ]贺琪, 李国学, 张亚宁. 高温堆肥中的氮素损失及其变化规律 [J] . 农业环境科学学报, 2005,24 l 169- 173. [4 ] 徐灵, 王成端, 姚岚. 污泥堆肥过程中主要性质及氮素 转变 [J] . 生态环境, 2008, 17 2 602- 605. [5 ]单德鑫, 李淑芹, 许景钢. 固体有机废物堆肥过程中氮的转化 [J] . 东北农业大学学报, 2007,38 2 265- 269. [6 ] Raviv M, Medina S,Karasnovsky A, et al.Conserving nitrogen during composting[J] . Biocycle,2002, 43 9 48. [7 ] 逯延军, 吴星五. 城市生活垃圾和污泥混合堆肥中氮素变化规 律研究[J] . 环境污染与防治, 2008, 30 2 59- 63. [8 ] Eklind Y, Kirchmann H.Composting and storage of organic household waste with different litter amendments.II nitrogen turnover and losses[J] .Bioresource Technology, 2000, 74 2 125- 133. [9 ]杨延梅, 刘鸿亮, 杨志峰. 控制堆肥过程中氮素损失的途径和 方法综述[J] . 北 京 师 范 大 学 学 报 自 然 科 学 版 ,2005, 41 2 213- 216. [ 10] 赵秋, 鲍艳宇. 堆肥过程中氮素损失的控制[J] . 中国农学通 报, 2007, 23 7 375- 377. [ 11]林小凤, 李国学, 贺琪. 堆肥过程中氮素损失控制材料的添加 [J] . 农业环境科学学报, 2005,24 5 975- 978. [ 12] Morisaki N,Phae C,Nakasaki K,et al. Nitrogen transation during thermophilic composting[J] .J Ferment Bioengin,1989 6 57- 61. [ 13] Vuorinen A H,Saharinen M H. Evolution of microbiological and chemical parameters during manure and straw co-composting in a drumcompostingsystem [J ] .AgricultureEcosystemand Environment,1997,66 9- 29. 作者通信处单爱丽116622辽宁省大连市大连大学环境与化 学工程学院 E- mailshanlovely 163. com. 2009 - 09 - 25 櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄櫄 收稿 上接第 107 页 [7 ] 张晓丹,黄朝君,徐菡, 等. 基于 RBF 神经网络的湖库水质富 营养化程度评价模型[J] . 环境工程, 2007,25 02 80- 82. [8 ] 苏平,伊海龙. 多层前向人工神经网络在东部平原湖泊富营 养化评价中的应用[J] . 系统仿真技术, 2006,2 3 166- 170. [9 ] 金菊良,丁晶. 水资源系统工程 [M] 成都四川科学技术出 版社,2002. [ 10] Friedman J H, Tukey J.Aprojectionpursuitalgorithmfor exploratory data analysis[C ]∥ IEEE Trans Computers, 1974 881- 889. [ 11] 付强,金菊良,梁川. 基于实码加速遗传算法的投影寻踪分类 模型在水稻灌溉制度优化中的应用[J] . 水利学报, 2002 10 39- 45. [ 12]段 海 滨.蚁 群 算 法 原 理 及 其 应 用 [M] .北 京科 学 出 版 社,2005. [ 13] 吴斌,史忠植. 一种基于蚁群算法的 TSP 问题分段求解算法 [J] . 计算机学报, 2001,24 12 1328- 1333. [ 14] 邱林,唐红强,陈海涛, 等. 集对分析法在地下水水质评价中 的应用[J] . 节水灌溉, 2007 01 13- 15. [ 15] 李祚泳,丁晶,彭荔红. 环境质量评价原理与方法 [M] . 北 京化学工业出版社, 2004. 作者通信处方崇530023广西南宁市长堽路 99 号广西水利电 力职业技术学院水工系 电话 0771 2085225 E- mailfangchong2009 163. com 2010 - 01 - 30 收稿 49 环境工程 2010 年 6 月第 28 卷第 3 期
展开阅读全文

资源标签

最新标签

长按识别或保存二维码,关注学链未来公众号

copyright@ 2019-2020“矿业文库”网

矿业文库合伙人QQ群 30735420