资源描述:
BP 人工神经网络在环境空气 SO2 质量浓度预测中的应用 * 申浩洋1韦安磊1王小文1冯舒2张娟娟1 1. 西北大学 城市与环境学院, 西安 710127; 2. 陕西安科安全生产技术研究所有限公司, 西安 710061 摘要 根据西安市雁塔区小寨环境空气监测点 2011 年 7 月 31 日起 400 d 的 SO224 小时平均浓度监测数据时间序列 建立 BP 人工神经网络 ANN 预测模型, 并用接下来100 d 的数据对模型的仿真性能进行检验, 从而验证了 BP 人工神 经网络模型预测环境空气 SO224 小时平均浓度的可行性与准确度。经反复调试, 最终选用 2- 3- 1 的网络结构并以 trainbr 作为训练算法, 经 34 次迭代网络收敛, 耗时 7 s, 预测结果相对于实际监测数据的平均绝对百分比误差为 0. 082, 模型显示出良好的预测性能。预测结果表明, 结构设定合理、 训练算法选用适宜的 BP 人工神经网络模型能较 好地反映 SO2浓度的动态变化规律, 具有可行性。 关键词 BP 人工神经网络; 预测模型; SO2浓度; 时间序列 DOI 10. 13205/j. hjgc. 201406028 RESEARCH ON APPLICATION OF BP ARTIFICIAL NEURAL NETWORK IN THE PREDICTION OF THE CONCENTRATION OF SO2IN AMBIENT AIR Shen Haoyang1Wei Anlei1Wang Xiaowen1Feng Shu2Zhang Juanjuan1 1. College of Urban and Environmental Sciences,Northwest University,Xian 710127,China; 2. Institute of Production Safety Science Ltd,Xian 710061, China AbstractIn order to verify the feasibility and accuracy of the back- propagation BPartificial neural network ANNmodel used in predicting the 24 h average concentration of SO2in ambient air,a BP artificial neural network ANNmodel was developed using the 24 h average concentration of SO2in 400 days, which was monitored on July 31, 2011 at an environmental monitoring station in Xian. With the data in the next 100 days,the simulation perance of model was tested. After commissioning ,“trainbr”was adopt as the training algorithm and the 2- 3- 1 network structure was used finally. After network convergence of 34 iterations in 7 s,the model showed a good prediction perance with MAPE 0. 082 the mean absolute percent error between predictors and monitoring values . The prediction perance of the model indicates that a BP- ANN with proper network structure and training algorithm is able to reflect the dynamic variation of SO2concentration. KeywordsBP artificial neural network;predict model;concentration of SO2;time series * 国家自然科学基金 51208424 ; 西北大学 “十二五 ” “211 工程” 创新 人才培养项目 YZZ13004 。 收稿日期 2013 -07 -09 0引言 近年来, 随着我国国民经济的持续快速发展、 能 源消费量不断增长, SO2的排放量迅速增加。截至目 前, 我国已成为全球 SO2污染面积最大、 浓度最高的 国家 [1 ]。SO 2是酸雨形成的关键因素。同时, 大量研 究证明 SO2会对人体呼吸系统造成损伤, 城市环境空 气中 SO2浓度与人群呼吸道疾病病例数存在相关性。 近些年越来越多的研究集中于环境空气 SO2的 污染及控制领域, 而其中 SO2浓度的准确预测是提前 做好防备工作并予以控制的基础, 因而有大量学者致 力于 SO2浓度预测模型的建立及其性能的优化。孙 根年等基于西安市 19912003 年环境空气质量监测 数据进行数值模拟, 分析了 SO2和 NO2的时空变化 规律, 预测了未来 SO2和 NO2的变化趋势[2 ]。格丽 玛等利用灰色系统理论建立了乌鲁木齐市环境空气 711 监测与评价 Environmental Monitoring & Assessment 中 SO2产生量的 GM 1, 1 预测模型, 并基于 2001 2004 年乌鲁木齐市 SO2监测数据, 预测了未来 6 年 的 SO2年平均值[3 ]。由于环境空气中污染物浓度的 预测是一个复杂的非线性问题, 因此在各种预测方法 中, 人工神经网络以其刻画非线性现象强的特点, 对 于空气中污染物浓度的预测有独有的优越性[4- 5 ]。 目前尽管有学者已经做了人工神经网络在空气 污染指数 API [6 ]及 O 3浓度预测 [7- 8 ]中的研究, 亦有 学者将人工神经网络应用于燃煤电厂等点源污染物 排放量的预测 [9 ], 然而在环境空气中 SO 2浓度预测 方面的研究还鲜有报道。李德志等利用 BP 人工神 经网络建立了环境空气 SO2浓度年际时间序列预测 模型 [10 ], 但其采用的数据样本量较小, 且在训练人工 神经网络的过程中只设置训练样本而没有检验样本, 模型的泛化能力有待进一步考察。 本研究利用 BP 人工神经网络对某环境空气质 量监测点 SO224 h 平均浓度进行了时间序列的预测, 以期验证 BP 人工神经网络模型预测环境空气中 SO2 浓度的可行性与准确度。 1实验部分 1. 1原始数据 主要利用西安市环境监测站雁塔区小寨环境空气 质量监测点的 SO224 小时平均浓度监测数据, 数据统计 时段为2011 年7 月31 日至2011 年12 月8 日, 共计500 d。 500 d SO224 小时平均浓度数据构成的时间序列 见图 1, 其中将 500 d 的数据样本分为两部分, 前 400 d的数据作为模型的训练样本构成训练集, 后 100 d的数据作为模型的测试样本构成测试集。 图 1SO2 24 h 平均浓度时间序列 Fig. 1Time series of 24- hour average concentration of SO2 1. 2数据处理 为了使神经网络有更高的训练效率和预测精度, 需要对原始数据进行归一化处理, 经线性函数转换后 得到一组新的无量纲时间序列。归一化方法如下 X x - xmin xmax- xmin 1 式中 X 为归一化后数值; x 为原始值; xmax为原始值 最大值; xmin为原始值最小值。 1. 3BP 人工神经网络模型 1. 3. 1BP 人工神经网络的理论基础 神经网络系统通过 “学习” 所研究的输入输出数据 得到一个描述输入变量与输出变量间关系的非线性映 射。神经网络的类型很多, 其中 BP Backpropagation 神 经网络利用了误差反向传播算法, 是人工神经网络模 型中使用最广泛的一种。 BP 神经网络模型的基本结构为 由一个输入层、 一个或多个隐含层和一个输出层连接而成, 各层神经 元仅与相邻层神经元之间有连接, 而与层内神经元无 连接, 各层神经元之间无反馈连接, 如图 2 所示。 图 2人工神经网络模型结构 Fig. 2Structure of ANNs sub- model BP 人工神经网络模型建立的基本过程是 给定 网络一个输入, 它由输入层单元传递到隐藏层单元, 经隐藏层单元处理后再传递到输出层单元, 由输出层 单元处理后产生一个输出, 此为前向传播过程; 计算 实际输出与期望输出之间的误差, 将误差值沿网络反 向传播并修正连接权值, 此为误差反向传播过程; 给 定另一个输入, 重复上述过程, 直到网络输出的误差 减小 到 可 接 受 的 程 度 或 达 到 设 定 的 训 练 次 数 为止 [11 ]。 1. 3. 2BP 人工神经网络的建立 第一步 设计神经网络的输入层和输出层。本研 究采用的 BP 神经网络的总体设计思路是以一定天 数的环境空气质量监测点 SO224 小时平均浓度监测 数据为基础, 利用神经网络预测未来某一天的 SO224 小时平均浓度。若将第 n 3 天的浓度记作 x n 3 n 0, 1, 2, 3, , 则本研究是用 x n 1 、 x n 2来预测 x n 3 。例如, 当 n 0 时, 就以第 1 天 811 环境工程 Environmental Engineering 和第 2 天的数据为基础来预测第 3 天的 SO2浓度; 当 n 1 时, 就以第 2天和第 3 天的历史数据为基础来预 测第 4天的 SO2浓度, 依次类推。根据这样的设计思 路, 将输入矩阵 P 和输出矩阵 T 设计为 P x 1 x 2 x 3 x 2 x 3 x 4 x 496 x 497 x 498 x 497 x 498 x 499 T , T x 3 x 4 x 5 x 498 x 499 x 500 T 即神经网络的输入层为单层两个神经元, 输出层 为单层一个神经元。其中输入输出数据皆为将原始 数据归一化处理后的数据。 第二步 设计神经网络的隐含层。理论已证明, 当隐含层神经元数目足够多时, 三层的 BP 神经网络 可以以任意精度逼近一个具有有限间断点的非线性 函数 [12 ]。因此本研究采用三层神经网络模型, 即隐 含层数为 1。 至于 BP 神经网络隐含层神经元个数选取多少 最为合理, 目前尚无定论。虽然理论上隐含层神经元 个数越多, 神经网络的运算能力越强, 只要神经元个 数多到某一程度, 神经网络的拟合精度便能无限提 升, 但是并不能因此认为隐含层神经元个数越多, 网 络的预测性能就越强, 因为一方面拟合精度过高会引 发过拟合现象, 造成神经网络的泛化能力下降, 另一 方面过多的神经元会造成系统内存占用过大, 训练速 度下降。本研究分别选择 6 种网络结构 2- 1- 1、 2- 2- 1、 2- 3- 1、 2- 4- 1、 2- 5- 1、 2- 10- 1、 2- 20- 1 , 进行性能测试 对比, 最终确定隐含层神经元的个数。 第三步 训练算法的选取。在诸多训练算法中, 选取常用的 trainbr、 trainlm、 traingdm 三种算法对神经 网络进行训练, 对比其训练效果。 1. 4预测性能评价函数 本研究采用均方误差 MSE 和平均绝对百分比 误差 MAPE 对各模型的预测性能进行评价, 两种评 价函数表达式如下 MSE ∑ N i 1 xi- yi 2 N 2 MAPE 1 N ∑ N i 1 xi- yi x i 3 式中 xi和 yi分别为监测值和预测值。 2结果与讨论 2. 1人工神经网络模型的选择 基于相同的训练集和预测集, 以不同网络结构和 训练算法搭配建立 BP 人工神经网络模型, 计算各模 型拟合训练集以及预测集的均方误差 MSE 表 1 , 并进行比较 见图 3、 图 4 。 表 1不同神经网络预测性能 Table 1The prediction perance of different ANNs 网络结构训练算法 MSE 训练集测试集 2- 1- 1trainlm0. 01010. 0260 2- 1- 1trainbr0. 01020. 0264 2- 1- 1traingdm0. 01120. 0281 2- 2- 1trainlm0. 00960. 0292 2- 2- 1trainbr0. 01020. 0255 2- 2- 1traingdm0. 02250. 0460 2- 3- 1trainlm0. 00960. 0287 2- 3- 1trainbr0. 01000. 0250 2- 3- 1traingdm0. 01400. 0367 2- 4- 1trainlm0. 00940. 0269 2- 4- 1trainbr0. 00980. 0255 2- 4- 1traingdm0. 01100. 0270 2- 5- 1trainlm0. 00860. 0502 2- 5- 1trainbr0. 00950. 0260 2- 5- 1traingdm0. 01100. 0269 2- 10- 1trainlm0. 00650. 0524 2- 10- 1trainbr0. 01000. 0263 2- 10- 1traingdm0. 01090. 0317 2- 20- 1trainlm0. 00570. 0724 2- 20- 1trainbr0. 00890. 0328 2- 20- 1traingdm0. 01050. 0337 图 3不同神经网络的训练集 MSE Fig. 3MSE of training set of different ANNs 结果表明 2- 3- 1 与 trainbr 算法的搭配, 预测效果 最好, 测试集 MSE 达到了 0. 0250。 从图 3 可以看出 随着隐含层神经元个数的增 加, 三种训练算法建立的模型对于训练集的 MSE 基 911 监测与评价 Environmental Monitoring & Assessment 图 4不同神经网络的测试集 MSE Fig. 4MSE of test set of different ANNs 本呈下降趋势 只有 traingdm 神经元数为 1 时较 2 时 训练集 MSE 小 , 然而从图 4 可以看出 测试集 MSE 并未随训练集 MSE 的下降而下降, 这是因为虽然理 论上隐含层神经元个数越多, 神经网络的运算能力越 强, 只要神经元个数多到某一程度, 神经网络的拟合 精度便能无限提升, 但是对训练集拟合精度的过度提 升, 有可能造成神经网络的泛化能力下降, 预测能力 并不能增强。 对比图 3 和图 4 可以看出 随着隐含层神经元个 数的增加, trainlm 算法的泛化能力下降得最为明显; 对于 traingdm 算法, 训练集 MSE 和测试集 MSE 均较 同一点 trainbr 算法更高。综合以上两点, 可以认为 trainbr 算法比其他两种算法更适合本研究。 在图4 中观察 trainbr 算法对应的曲线, 可以看出 其测试集 MSE 呈先下降后上升趋势, 在网络结构为 2- 3- 1 处降至最低点 0. 0250, 之后随着隐含层神经元 个数的增加而不断上升。 基于以上分析, 本研究最终采用 2- 3- 1 网络结构 与 trainbr 算法搭配, 建立 BP 人工神经网络模型。 2. 2人工神经网络模型的预测效果 采用 2- 3- 1 网络结构与 trainbr 算法的搭配, 建立 的 BP 人工神经网络模型, 经 34 次迭代, 网络收敛, 耗时 7 s。将预测结果进行反归一化后与原始数据进 行比 较,计 算 得 出 测 试 集 MSE 7. 32 μg/m3, MAPE 0. 082; 绘制出预测值时间序列曲线和监测值 时间序列曲线以及二者的绝对误差曲线 见图 5 , 比 对后可以发现 图 5预测值和监测值的对比 Fig.5Comparison between predicted values and monitoring values 1 对于 SO2常规浓度的预测, 预测值时间序列 曲线和监测值时间序列曲线在整体趋势上吻合程度 较高。测试集数据 98 d 中绝对误差的绝对值超过 5 μg/m3的只有第 5 天、 第 15 天和第 65 天; 两种预测 性能 评 价 函 数 皆 在 可 接 受 的 范 围 内 MSE 7. 32 μg/m3, MAPE 0. 082 , 说明模型对常规浓度 的预测效果良好。 2 对于 SO2浓度突发性升高的预测, 模型显示 出一定的预测能力, 但仍有不足。测试集 98 d 数据 中第 5 天、 第 15 天和第 65 天 SO2质量浓度监测值分 别为 47, 41, 40 μg/m3, 而预测 值 分 别 为 33. 74, 31. 25, 31. 02 μg/m3, 相差较为明显。 3结论 本研究建立的 BP 人工神经网络模型对西安市 雁塔区小寨监测点 SO224 小时平均浓度的预测效果 表明, BP 人工神经网络能较好地反映 SO2浓度的动 态变化规律, 基于 BP 人工神经网络的环境空气 SO2 质量浓度预测是可行的; 结构设定合理、 训练算法选 用适宜的 BP 神经网络模型能够达到较高的预测准 确度, 然而对于 SO2浓度突发性升高的预测能力还有 021 环境工程 Environmental Engineering 待提高。 本研究建立了网络结构为 2- 3- 1 的 BP 神经网络 模型, 采用 trainbr 算法进行训练, 具有收敛速度快 只需7 s , 迭代次数少 34 次迭代即可达到收敛 和 预测性能好 预测集 MSE 7. 32 μg/m3 的特点。因 此本研究网络结构调试和算法选用的过程可为相关 研究提供参考。 BP 人工神经网络应用于环境空气 SO224 小时 平均质量浓度的预测是可行的, 但其能否应用于 SO2 每小时平均浓度的预测, 还有待进一步研究。 参考文献 [1]王春霞,朱利中,江桂斌,等. 环境化学学科前沿与展望 [M]. 北京科学出版社, 2011 3- 10. [2]孙根年,吴晓娟,周立花,等. 西安大气 SO2/ NOX污染时空 变化的分析[J]. 干旱区资源与环境, 2006, 20 5 99- 103. [3]格丽玛, 冷中笑, 何清, 等. 乌鲁木齐市大气中SO2的灰色预测 [ J] . 湖南环境生物职业技术学院学报, 2006, 12 1 20- 22. [4]唐旭清, 胡锦滨. 人工神经网络的 BP 算法及其应用[J] . 信息 技术, 2004, 28 4 1- 4. [5]Lisboa P G J.Neural Networks Current Applications[M]. England International Thomson Computer Press, 1992 15- 17. [6]郭庆春,何振芳,李力. 人工神经网络在大气污染预测中的应 用研究[J] . 工业仪表与自动化装置, 2012, 42 4 18- 22. [7]沈路路,王聿绚,段雷. 神经网络模型在 O3浓度预测中的应 用[ J] . 环境科学, 2011, 32 8 2231- 2235. [8]万显烈,杨凤林,王慧卿. 利用人工神经网络对空气中 O3浓 度进行预测[J]. 中国环境科学, 2003, 23 1 110- 112. [9]张砺彦,麦永强,张月辉,等. 基于神经网络的大型燃煤电厂 SO2和 NOX的污染物预测模型[J] . 热力发电, 2008, 37 10 9- 13. [ 10]李德志,李朝阳,李峰,等. 大气 SO2含量时间序列的 BP 人 工神经网络预测模型[J] . 重型机械, 2010, 31 4 31- 34. [ 11]Hagan M T,Demuth H B,Beale M H. Neural Network Design [ M] . BostonPWS Publishing, 1996 4- 1. [ 12]张德丰. Matlab 神经网络应用设计[M] . 北京机械工业出版 社, 2010 54- 55. 第一作者 申浩洋 1990 - , 男, 硕士研究生。hoyhn. shen gmail. com 通讯作者 韦安磊 1981 - , 男, 博士, 讲师, 主要研究领域为环境系统 模拟理论与方法。 櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅 alwei nwu. edu. cn 上接第 51 页 [4]Camel V,Bermond A. The use of ozone and associated oxidation processes in drinking water treatment [J].Water Res, 1988, 32 11 3208- 3222. [5]刘海龙, 王东升, 王敏, 等. 臭氧对有机物混凝的影响[J] . 环 境科学, 2006, 27 3 456- 460. [6]StevenT, Summerfelt.OzonationandUVirradiation/an introduction and examples of current applications[J]. Aquaculture Engineering, 2003 28 21- 36. [7]Mohammad R Ghomi, Abbas Esmaili, Gholamhosein Vossoughi, et al.Comparison of ozone, hydrogen peroxide and removal of infected eggs for prevention of fungal infection in sturgeon hatchery [ J]. Fisheries Science, 2007, 73 1332- 1337. [8]Bullock G L,Summerfelt S T,Noble A, et al. Ozonation of a recirculating rainbow trout culture systemEffects on bacterial gill disease and heterotrophic bacteria [J] .Aquaculture,1997, 158 1 43- 55. [9]吴小军, 杨艳华. 臭氧对淡水鱼虾毒性的研究[J] . 河南水产, 2007 5 32- 33. [ 10]Kenji F,Naoki N,Tetsuya S,et al.Mechanism of oxidative damage to fish red blood cells by ozone[J] . IUBMB Life,1999, 48 631- 634. [ 11]Reid B, Arnold C R.Use of ozone for water- treatment in recirculating water raceway system[J]. Progressive Fish Culturist, 1994, 56 1 47- 50. [ 12]姜国良, 刘云, 杨栋, 等. 用臭氧处理海水对鱼虾的急性毒性效 应研究[ J] . 海洋科学, 2001 3 11- 13. [ 13]曹广斌, 贾慧文, 蒋树义, 等. 循环水养殖系统中臭氧混合设备 设计与性能测试[ J] . 农业工程学报, 2011, 27 10 73- 78. [ 14]Masschelein W J. Ozone generationUse of air,oxygen,or air symphonized with oxygen [J]. Ozone Science and Engineering, 1998, 20 191- 203. [ 15]王华然, 王尚, 李昀桥, 等. 臭氧在水中的溶解特性及其影响因 素研究[ J] . 水产学杂志, 2009, 5 2 99- 104. [ 16]ValdisKrumins, JamesEbeling, FredWheaton.Part- day ozonation for nitrogen and organic carbon control in recirculating aquaculture systems[J] . Aquacultural Engineering,2001 24 231- 241. 第一作者 曹广斌 1957 - , 男, 研究员, 主要从事渔业工程研究。 laocao hotmail. com 121 监测与评价 Environmental Monitoring & Assessment
展开阅读全文