资源描述:
收稿日期 2010- 09- 08 作者简介 李万庆 1954- , 男, 河北临漳人, 教授, 从事工程管理方面的研究。 文章编号 1673- 94692010 04- 0030- 06 基于 RS- SVM 的建筑施工项目安全预警模型 李万庆, 安 娟 河北工程大学 经管学院, 河北 邯郸 056038 摘要 针对目前建筑施工项目安全风险管理的现状, 应用粗集理论对建筑施工项目的安全因素 进行预处理, 将处理后的信息结构作为支持向量机的输入数据进行训练和预测, 构建建筑施工 项目安全风险预警模型, 并在小样本条件下, 与 BP 神经网络进行对比分析。结果表明, RS- SVM 预测模型的最小均方根误差为 0. 011 5, BP 神经网络的均方根误差为 0. 070 7, RS- SVM 预警模型的预测精度、 泛化能力明显优越于 BP 神经网络学习方法。 关键词 建筑施工; 粗集; 支持向量机; 安全预警 中图分类号 X947 文献标识码 A Safety early- warning model of construction project based on rough set and support vector machine LI Wan -qing, AN Juan School of Economic andManagement, Hebei University of Engineering, Hebei Handan 056038, China Abstract Aimed at the uncertainty of safety risk prediction in construction project currently, Rough set was used to pretreat the safety factors of construction project, and then the pretreatment resultswere put as the ination structure of support vector machine SVM to training and prediction. So the construction project safety risk early- warning model was established, and the validity of the algorithm was proved by empirical analysis. The MSE of SVM is 0. 011 5, andthe BP neural network is 0. 070 7. Experimental re - sults revealed that the model of rough set - support vector machine RS- SVM can realize to delete the superfluous ting ination, to reduce the complexity and improve the interfere resistance. In small sample conditions, the early- warning model of RS- SVM is greatly superior to BP neural network in pre - diction precision and generalization ability. Key words construction project; rough set; support vector machine; safety early- warning 建筑施工项目是安全风险最密集、 安全事故 发生率最多的领域之一, 加强施工项目的安全管 理与预警有着现实的政治、 经济和社会意义 [ 1- 3] 。 目前国内外关于建筑施工项目安全预警的方法主 要有趋势外推法、 动态层次分析法、 模糊综合分析 法、 故障树分析法、 神经网络等方法。然而趋势外 推模型虽然简单易懂, 但在建筑工程上的使用范 围却很小; DAHP 模型中专家评估的风险要素带有 很大的主观性; 模糊分析法的运算精度依然有待 商榷; 神经网络虽具有很好的非线性逼近能力, 但 常常出现过度训练或训练不足; 故障树分析法则 对事故类型复杂的系统处理效果欠佳。 粗集 rough set, RS 是一种处理模糊和不确定 知识的数据分析理论, 能在保持知识库分类能力 不变的条件下, 删除其中的不相关或不重要的知 识, 提取满足条件的最小属性集 [ 4] 。支持向量机 Support Vector Machine, SVM 是近年来在结构风 险最小化基础之上发展起来的统计学习理论, 它 可以按任意精度逼近非线性函数, 具有全局极小 点和收敛速度快的优点。结合 RS 的属性约简和 SVM 的回归机理, 提出了基于 RS- SVM 的建筑施 工项目安全风险预警模型, 并与 BP 神经网络进行 第 27 卷 第 4期 河 北 工 程 大 学 学 报 自 然 科 学 版 Vol27 No4 2010年 12 月 Journal of Hebei University of EngineeringNatural Science Edition Dec 2010 实证对比分析。 1RS- SVM 模型构建的基础理论 1. 1 RS 基本理论 在RS 理论中, 知识被认为是一种将现实或 抽象的对象进行分类的能力。一个知识表达系统 决策信息表达系统, 知识表达系统 由有限个研 究对象组成, 这些对象的知识通过指定对象的属 性和属性值来描述, 其表达式为 S U, V, A, F V AV 式中 S 知识表达系统; U 论域; A 属性集; 属性; V 属性 的值域; F 信息函数, 指定 论域 U中每一对象的属性值。 运用 RS 理论处理决策表时, 要求决策表中的 值用离散化数据表达, 由于本文数据较集中故采 用 C- 均值聚类算法。对于定量指标中连续数据 的离散分类, 离散后的区间数值由小到大分别用 数字 0、 1、 2、 3 对应表示; 对于定性指标, 分别用 0、 1、 2 表示差、 中、 优; 决策属性值以是否完成安全目 标分为0, 1, 0 表示未完成安全目标, 1 表示完成 安全目标。将项目的风险等级划分为 5 级, 分别 用[ 0, 0. 3] , 0. 3, 0. 5] , 0. 5, 0. 7] , 0. 7, 0. 9] 及 0. 9, 1] 表示低风险、 较低风险、 一般风险、 较高风 险及高风险。 1. 2 SVM 基本原理 SVM 是针对结构风险最小化原则提出的, 改 变了传统的经验风险最小化原则, 具有很好的泛 化能力 [ 5] 。SVM 在处理非线性问题时, 首先将非 线性问题转化为高维空间中的线性问题, 然后用 一个核函数来代替高维空间中的内积运算, 从而 巧妙地解决了复杂计算问题, 并且有效地克服了 维数灾难及局部极小问题。 给定训练数据 { xi, yi , i 1, 2, , l} 式中 xi 第 i 个学习样本的输入值, xi [ x 1 i, x 2 i, , x d i] T , xi R d ; yi 对应的目标值, yi R。 采用一个非线性映射将样本从原空间映射到 维数为 K K 可能是无穷大 的高维特征空间中, 然后在高维特征空间中进行线性回归。设回归函 数为 min 1 2 2 C1 l l i 1 i * i s. t. yi- xi - b i xi b- yi- * i i, * i0, i 1, 2, , l 通过拉格朗日变换得到其优化问题的对偶形式 max , * [ - 1 2 l i 1 l j 1 i- * i j- * j K xixj - l i 1 i * i l i 1y i i- * i ] s. t. l i 1 i- * i 0 i, * i [ 0, Cl] 式中 K xixj 核函数, K xixj xi xj ; C 惩罚参数, C 0; i- * i 拉格朗日 乘子, 对应的训练样本为支持向量, i- * i mi 0。 取 w l i 1 i- * i xi , 然后得到偏置项系 数 b b 1 NNsv 0 i C[yi - xj sv j- * jkxj,xi- ] 0 * i C [ yi- xj sv j- * j k xj, xi ] 1 式中 NNsv 支持向量的个数。 通过训练和学习得到回归预测函数为 f x xj sv i- * i k xi, xj b 2 2 RS- SVM 模型的构建 用RS 对施工项目安全因素进行预处理, 减少 SVM 数据维数和降低系统结构的复杂性, 即把粗 集作为前置系统, 再根据 RS 方法预处理后的信息 结构, 构成SVM 信息处理系统, 从而可构造出具有 更好的抑制噪声干扰和良好泛化能力的预测模 型。具体的流程如图 1所示。 2. 1 指标体系的选取 在人 机 环境系统理论、 人机工程学事故 致因理论的基础上, 分析了可能影响施工项目安 全的因素。并在遵循指标体系构建的科学性、 系 统性、 动态性、 客观性和可操作性原则的基础上, 结合专家经验, 构建了建筑施工项目安全预警指 标体系 图2 。 第 4 期李万庆等 基于 RS- SVM 的建筑施工项目安全预警模型31 2. 2 建模步骤 1 参考类似工程的项目数据建立训练样本集。 2 采用 C- 均值聚类算法, 对样本数据进行 离散, 然后用 RS 对样本集进行约简, 去除不完全 数据, 提取最优属性集。 3 利用交叉验证法法选择核函数参数 和 惩罚参数C, 根据式 1 、 式 2 并通过 MATLAB 编 程求解模型的参数 w, b 。 4 建立最优预测模型。 2. 3 预测误差的确定 采用相对误差函数 Error 和均方根误差函数 MSE 来检验模型的预测精度, 相对误差是评价预 测模型对每一个样本的测试效果, 而均方根误差 是预测模型整体效果的误差检验函数。 Error n | x n, true - x n, pred | | x n, true | 3 MSE Sqrt 1 N N n 1 x n, true - x n, pred 2 4 式中 x n, true 第 n 个测试样本的实际值; x n, pred 第 n 个测试样本的预测值。 2. 4 安全预警等级的划分 将预测模型计算求得的预测值y和实际值 y 相 比较, 得到 y - y 。根据概率统计理论, y - y 落入[ 0, 2S]的概率为95. 5, 落入[0, 3S] 的概率 为99.7,其中 S 为模型标准差 [6] 。据此, 可按以下 几种情况对施工项目安全性态进行预警 1 正常 y- y 2S。 2 基本正常 2S y- y 3S, 且测值无 趋势性变化。 3 异常 2S 3S, 应分析其成因。 32河 北 工 程 大 学 学 报 自 然 科 学 版2010年 3 实证分析 3. 1 数据采集 借鉴文献[ 7] 的数据进行预测研究, 数据如表 1 所示。 3. 2 安全预警决策表约简 采用 C- 均值聚类算法对表 1 中的数据进行 离散化 其中政治的稳定情况不具有分类能力已 被删除 , 利用 RS 将离散化后的数据在 MATLAB 7. 0 中进行约简, 得到最优属性集 12 个指标, 约简 冗余因素 5 个 表 2 。将 RS 约简后的最优属性集 作为 SVM 的训练和测试数据, 输入条件属性和决 策属性的历史数据, 取前 8 组作为训练样本来进 行机器学习, 从而得到预测模型, 余下的 4 组作为 检验样本考察模型的预测和泛化能力。 3. 3 核函数及参数的选择 SVM 采用满足Mercer 条件的核函数来代替映 射函数, 将输入变量 x 映射到高维特征空间。常 用的核函数有线性核函数、 多项式核函数、 径向基 核函数和神经网络核函数, 就函数拟合而言, 径向 基函数 radial basis function, RBF 能使 SVM 以任 意精度逼近非线性函数曲线, 其函数拟合性优于 多项式核函数。因此, 采用 RBF 核函数, 参数包括 调整惩罚参数 C, 核宽度 , 和不敏感系数 。对 参数的选取采用交叉验证法, 以最小均方根误差 MSEmin 为参数选择标准。交叉验证如下 表 1 建筑施工项目安全因素及历史数据 Tab. 1 Historical date and safety risk factors of construction project 项目C11C21C31C32C33C34C41C42C43C51C52C53C61C62C63C64C65 10. 3082中中优95差82优中0. 14 0. 12中0. 668中稳定 20. 3864差差差84差72中优0. 15 0. 14中0. 650中稳定 30. 2073中优优75中93中中0. 11 0. 15优0. 984中稳定 40. 3483中中优80中91差差0. 12 0. 05中0. 982优稳定 50. 2274中中差92优94中中0. 10 0. 12中0. 888优稳定 60. 3294优差优80中95中差0. 20 0. 13中0. 680优稳定 70. 3592中中优90中78中中0. 00 0. 00中0. 781优稳定 80. 3491中中优84差64优中0. 15 0. 14中0. 671中稳定 90. 4075中中中62差69优中0. 02 0. 04差0. 472中稳定 100. 3595中中中94优86优差0. 13 0. 11优1. 090优稳定 110. 2582优差中65中90优中0. 21 0. 21中0. 884中稳定 120. 3896优差优75中94中差0. 22 0. 12中0. 782优稳定 表2 建筑施工项目安全预警决策表 Tab. 2 Safety early- warning decision table of construction project 项目 C11C31C41C42C43C51C52C61C62C63C64C65 决策属性值 10. 70. 30. 30. 30. 50. 30. 50. 70. 70. 50. 50. 30. 420 3 20. 90. 70. 70. 30. 50. 50. 50. 70. 70. 50. 30. 70. 521 8 30. 90. 90. 90. 90. 30. 50. 90. 90. 90. 90. 30. 90. 745 9 40. 70. 70. 90. 70. 50. 70. 50. 70. 90. 70. 50. 70. 694 5 50. 30. 70. 50. 10. 30. 50. 10. 30. 30. 10. 50. 30. 361 2 60. 70. 90. 90. 90. 50. 50. 90. 70. 90. 70. 30. 90. 702 9 70. 90. 70. 70. 50. 50. 50. 70. 70. 90. 90. 50. 70. 592 8 80. 70. 90. 70. 50. 10. 10. 10. 30. 50. 50. 50. 30. 464 5 90. 50. 70. 90. 30. 70. 30. 10. 30. 10. 10. 10. 30. 359 4 100. 10. 30. 30. 10. 30. 30. 10. 30. 10. 10. 30. 30. 262 2 110. 30. 70. 90. 50. 70. 90. 30. 70. 70. 50. 50. 70. 762 3 120. 70. 70. 50. 30. 70. 50. 30. 70. 90. 30. 10. 50. 532 1 第 4 期李万庆等 基于 RS- SVM 的建筑施工项目安全预警模型33 1 固定 0. 01, C 90, 令 在[ 0. 01 0. 05 10] 期间上变动, 计算 SVM 预测的均方根误差, 如 图3 所示。由图可见, 在区间[ 0. 01, 1] 之间时, 模 型训练的均方根误差显著降低, 在区间[ 1, 10] 之 间则增长缓慢。当 0. 85 时,MSE 0. 013 7 为 最小值。 2 固定参数 C 90, 0. 8, 调整不敏感损 失函数值 , 如图 4所示。当 0. 003 时, 模型测 试的均方根误差 MSE 0. 013 7 为最小值。 3 固定参数 0. 85 以及参数 0. 000 3, 使模型的惩罚参数 C 在区间 0, 10 000] 以步长 50 进行变动以测试模型的训练精度。程序的运行结 果显示, 实例中惩罚参数 C 的变化对模型的预测 精度没有显著影响。 这样, 当取参数 C 90, 0. 8, 0. 000 3 时, 预测模型的均方根误差最小MSE 0. 011 5, 此 时的 SVM 模型便为最优模型。 3. 4 RS- SVM 模型的建立 根据选取的核函数和最优参数, 在 MATLAB 7. 0语言支持下, 利用式 1 计算出偏置项系数 b 0. 538 62; 支持向量的个数 NNsv 4, 分别为第 3、 8、 11、 12 个项目样本; 对应的拉格朗日乘子为 m3 0. 372, m8 0. 015, m11 0. 385, m12 0. 044。 将所求参数代入式 2 , 得到RS- SVM 模型 f x i- * i xxi 1 0. 538 62 式中 x 待测建筑施工项目的安全指标值向量; xi 支持向量, i 3, 8, 11, 12。 3. 5 预测结果分析 为检验 RS- SVM 算法的优越性, 将其与 BP 神经网络进行对比分析。在 BP 神经网络模型中, 采用 3 层结构, 输入向量和输出向量同 RS- SVM, 将前 8 项作为训练样本, 后 4 项作为预测样本, 隐 层选 20 个神经元。利用神经网络系统对学习数 据反复训练, 得到当均方根误差为 0. 070 7 时, 实 验结果最优。两种模型的实际值和预测值的对比 曲线见表 3, 拟合预测效果见图 5。 表 3 两种模型的预测值与实际值比较 Tab. 3 Compare by predicted result and fact of the two models 项目 编号 预测值 BPRS- SVM 实际值 相对误差 BPRS- SVM 90. 498 00. 369 40. 359 4 0. 385 60. 027 8 100. 237 80. 272 20. 262 2 0. 093 00. 028 1 110. 751 10. 752 30. 762 3 0. 009 40. 013 1 120. 541 60. 522 10. 532 1 0. 017 80. 018 7 由表 3 可以看出, 对于同一个工程项目样本, RS- SVM 的相对误差明显都低于 BP 神经网络, 这 说明 RS- SVM 的预测精度要明显优于比 BP 神经 网络的预测精度, 而且 RS- SVM 模型测试样本的 相对误差控制在 3以内。 从图 5 两种模型的预测结果拟合情况可知, 基于 SVM 建立的安全预警模型的预测拟合效果要 优于 BP 神经网络, 这主要是 BP 神经网络在处理 有限样本数据的局限性所致。BP 神经网络是一 种基于无限样本的渐近理论, 只有样本数量趋于 无穷多时理论上才收敛于全局最优值, 也难免陷 入局部极值。而 SVM 是建立在结构风险最小化的 原则之上的, 能够根据有限样本信息, 在模型的复 杂性和学习能力之间寻求最佳折衷, 得到的一定 是全局最优解, 而且这些计算单元具有有限可控 的学习能力。 34河 北 工 程 大 学 学 报 自 然 科 学 版2010年 4 结论 1 简化了建筑施工项目安全风险预警模型的 信息表达空间, 减小了SVM 构成系统的复杂性, 提 高了容错及抗干扰能力。 2 BP 神经网络的均方根误差为0. 070 7,RS- SVM 预测模型的最小均方根误差为 0. 011 5, 可见 在小样本条件下, RS- SVM 预警模型的预测精度、 泛化能力明显优越于 BP 神经网络学习方法。 参考文献 [1] 孙华山, 安全生产风险管理[M] . 北京 化学工业出 版社, 2006. [2] 程 杰. 建筑安装工程施工安全风险评价与管理[ J]. 现代管理科学, 20029 42- 43. [ 3] 张仕廉, 董 勇, 樊承仁. 建筑安全管理[M]. 北京 中 国建筑工业出版社, 2005. [4] 李万庆, 李继萍, 孟文清, 等. 基于粗糙集的载体桩 质量核心影响因素分析[J], 河北工程大学学报 自然 科学版, 2010, 27 1 88- 91. [5] 李万庆, 李海涛, 孟文清. 工程项目工期风险的支持 向量机预测模型[ J] . 河北工程大学学报 自然科学 版, 2007, 244 1- 4. [6] 苏怀智, 温志萍, 吴中如. 基于 SVM 理论的大坝安全 预警模型研究[J]. 应用基础与工程科学学报, 2009, 171 41- 47. [7] MENG W, LI W, LI J, et al. Risk prediction modelfor con - struction projects basedon rough sets and artificial neural net - works[C] FITME. 2nd International Conference on Future Ination Technology and Management Engineering. US IEEE Computer Society, 2009. 责任编辑 马立 上接第 25页 3 结论 1 利用废弃混凝土磨细粉作为水泥的掺和料 是可行的, 随着废弃混凝土磨细粉掺量的增加, 水 泥的胶砂强度越低。用掺量为 10 废弃混凝土磨 细粉可以生产出 42. 5 水泥, 掺量 20 时强度要 降低为32. 5 水泥。 2 激发剂Na2SiO3的合适掺量是 1 , 激发剂 NaOH 的作用效果不明显。说明碱性激发剂对混 凝土废弃物的激发效果不好, 硅酸盐类激发剂对 废弃混凝土有较好的激发效果。 参考文献 [ 1] CHARLSON A. Recycling and reuse of waste inthe construction industry [J]. Structural Engineer, 2008, 864 32- 37. [2] POON C S, LAM C S. The effect of aggregate- to- cement ratio and types of aggregates on the properties of pre- cast concrete blocks [ J] . 2008, 304 283- 289 [3] 李九苏, 肖韩宁, 龚建清. 再生骨料水泥混凝土的级配优 化试验研究[J]. 建筑材料学报, 2008, 111 105- 110. [4] LI JIU SU, XIAO HAN NING, GONG JIAN QING. Granular effect of fly ash repairs damage of recycled coarse aggregate [ J].Journal of Shanghai Jiaotong UniversityScience, 2008, 132 177- 180. [5] 王立久, 郑芳宇, 迟耀辉. 水泥生料组分混凝土设计理 论及试验研究[ J]. 大连理工大学学报, 2007, 472 222- 227. [6] SHUI ZHONG HE, XUAN DONG XING, WAN HUI WEI, et al. Rehyration reactivity of recycled mortar from concrete waste experiencedto thermaltreatment [J]. Construction and Building Materials, 2008, 228 1723- 1729. [7] 方开泰, 马长兴. 正交与均匀试验设计[M] . 北京 科 学出版社, 2001. 责任编辑 刘存英 第 4 期李万庆等 基于 RS- SVM 的建筑施工项目安全预警模型35
展开阅读全文