龚静① GONG Jing;徐柏才② XU Bo-cai;崔恒凤② CUI Heng-feng;孙玮② SUN Wei
(①重庆交通大学管理学院,重庆 400074;②荆州市公路管理局,荆州 434000)
摘要: 本文采用小样本最佳通用学习方法,即最小二乘支持向量机进行费用预测。分析了算法的基本原理,构建了普通公路大中修养护费用的特征指标体系与费用预测模型,借助MATLAB编制了求解程序,得到了大中修养护费用预测值,并与一般预测方法得到的结果相比较,说明了算法的优越性。利用该算法能够有效提高预测的精度,因此能够为实际制定养护费用计划提供参考。
教育期刊网 http://www.jyqkw.com
关键词 : 最小二乘支持向量机;大中修养护;费用预测;MATLAB
中图分类号:U418 文献标识码:A 文章编号:1006-4311(2015)23-0035-03
课题项目:荆州市普通公路养护市场化管理研究。
作者简介:龚静(1990-),女,四川德阳人,研究生在读,主要研究方向为工程项目管理。
0 引言
截止2014年底,我国公路总里程446.39万公里,比2013年末增加10.77万公里。公路养护里程435.38万公里,占公路总里程97.5%。
目前我国公路事业正从“重建轻养”向“建养并重”、“养护为主”的模式转变,普通公路养护工作的重要性大大提升,而养护资金的合理计划与使用便成为养护工作中的关键问题。选择科学的预测方法是实现这一目标的基础。
支持向量机(以下简称SVM)是在统计学习理论的基础上发展起来的一种学习方法,可以用于解决实际中的分类问题与预测问题,即支持向量回归。最小二乘支持向量机(以下简称LS-SVM)是在SVM的基础上结合了最小二乘的原理,与传统预测方法相比,克服了传统方法的大样本要求,能够在训练样本很少的情况下获得较好的回归效果,并有效地克服了维数灾难及局部极小问题,在处理非线性问题中显示了其优越性。国内外许多学者将其运用到高速公路工程造价估算问题上[1]。
1 普通公路大中修养护费用预测特点分析
与公路工程建设过程中的造价预测相比,养护费用的预测有着自身的特点:
1.1 样本数据小
长期“重建轻养”的发展模式导致普通公路养护费用的相关数据收集不完善,且我国在项目信息管理的方法、手段和组织管理方面还在比较传统的模式上,使得各种数据信息的共享和交流变得非常困难。因此,普通公路大中修养护费用的数据非常有限。
1.2 影响因素复杂
普通公路大中修养护费用受到许多因素的影响,例如公路建设质量、日常养护水平、自然灾害、大中修次数等,众多因素共同作用,使得养护费用的预测变得困难。除此之外,一些影响因素可以准确量化处理,而一些因素具有不可预见性或者具有不可量化性,因此在数据处理和预测方法的选择上都应兼顾这些问题。
2 LS-SVM的基本原理
LS-SVM是以“结果风险最小化”原则为基础[2],能够解决有限样本条件下学习过程的经验风险与预测风险的一致性问题,相较于一般的预测方法,如人工神经网络法,避免了所谓的“过学习”和“过拟合”现象。该方法侧重研究在有限样本量的情形下提高模型的预测性能,其有确定的解析形式,能够通过核函数及其参数的选择来实现结构风险最小化。该方法从上世纪90年代起收到了许多学者的关注,被认为目前用于小样本数据的最佳通用学习理论。
LS-SVM的基本思想[3]是:假设输入样本集Rn,所求问题为线性函数
而针对非线性问题,首先引入一个非线性变换将Rn映射到高维的Hilbert空间里,在这个高维空间里非线性问题即可转换为线性回归的方法来解决。
可以证明,最优化算法式(3)在映射到H空间后,只涉及的内积运算而不涉及单独运算,若可以定义某类函数,那么甚至不用知道的具体解析形式,这样可以大大简化运算过程。
其中,K(xi,xj)又称为核函数,常用的核函数有多项式核函数、高斯径向基核函数、指数径向基核函数、多层感知器核函数、B样条核函数,本文选择常用的高斯径向基核函数。
3 基于LS-SVM的大中修养护费用预测模型构建
3.1 特征指标体系建立
普通公路大中修养护费用受到许多因素的影响,根据研究对象的具体情况选择具有代表性的影响因素向量x,x∈Rn,其中每一个分量xi代表该普通公路大中修养护的某一属性。同时需要找出与影响因素相对应的大中修养护费用y,故生成原始样本集
3.2 LS-SVM费用预测模型构建及求解
对于给定的训练数据集S,建立大中修费用预测模型为:
3.3 利用MATLAB解决LS-SVM预测问题
通过上述分析可以看出,求解过程较为复杂,可以利用MATLAB的支持向量机工具箱进行求解。MATLAB已经成为国际上最流行的科学与工程计算的软件工具,现在的MATLAB 已经不仅仅是一个“矩阵实验室”了,它已经成为一种具有广泛应用前景的全新的计算机高级编程语言。它在国内外高校和各科研研究部门正扮演着十分重要的角色,在信号处理、科学运算、科学绘图与自动控制等诸多领域得到了广泛的关注与应用。
MATLAB的LS-SVM工具箱是围绕一个快速LS-SVM的训练和模拟算法而建立的。对非线性NARX时间序列应用系统可以扩散。一个非线性自回归能够建立基于非线性回归量的模型,这是通过对以前数据的输入(或输出)的度量,来估计下一次迭代输出的值。使一个数据集通过窗口和非线性自回归窗口转变为一个新的输入(以前测量的)和输出集(未来的输出),这两个窗口分别为时间序列事件和一般的外部输入非线性自回归事件。迭代预测(在递归方法中)下一个输出,该输出是基于先前的预测,及初始值都是由预测来工作。常用的调用函数包括:tunelssvm(寻优函数)、trainlssvm(训练函数)、simlssvm(测试函数)、predict(预测函数)。以tunelssvm寻优函数为例,说明其用法,在MATLAB中,调用tunelssvm函数的代码为:
利用MATLAB中的LS-SVM工具箱解决养护大中修费用预测问题的一般步骤如图1所示。
4 实例分析
在公路养护实践中,很多因素不同程度地影响着公路大中修养护的费用。本文以JS路为例,从公路病害破坏机理的角度,定性分析造成普通公路损坏的诸多原因,最后选取其中影响较大且容易定量化处理的因素。JS路是连接JL县到SQ县的一级公路,于2000年完工,全线均为沥青混凝土路面。该路段由JL县公路管理局负责日常养护与大中修养护,其中大中修养护实现了部分养护市场化管理,即通过公开招投标选择施工单位,公路管理局则以业主的身份参与养护管理,其大中修养护资金主要来源于上级部门拨付养护费用。JL县严格把关辖区内道路养护质量,为保证道路良好的使用性能,该路段自建成通车第三年进行了首次大修作业,其后每年均有不同程度的大中修。
首先,确定影响普通公路大中修养护费用预测的主要因素,包括:道路计算使用年限x1、道路年平均日交通量x2、道路年平均降雨量x3、公路技术状况指数x4。其中,道路计算使用年限的经验计算公式如下:
其中:第n年是专指实施有路面坑槽、裂缝专项维修工程或中、大修工程时的使用年度。
由于各数据的量纲不同,且数据之间的数值差别过大,为避免由此产生的误差,需要对数据做归一化处理。根据一般经验,本文选取极差化处理方式,即:
选取JS路近十年的相关数据,处理后的规范化数据见表1。
以前九年数据为训练样本,以第十年数据为测试样本。借助MATLAB求解,本文以MATLAB2010b为开发环境,编制代码解决公路大中修养护费用预测问题,其主要程序代码如下:
选择参数=108.04,C=1396.68,求得2013预测值为0.90。为验证本文所用预测方法,算例将本文模型与一般的线性预测结果进行对比,两种算法预测结果如表2所示。
从表2可以看出,相较于传统的多元线性回归预测方法,采用LS-SVM算法,普通公路大中修养护费用的预测精度得到了提高。
5 结论与展望
本文根据大中修养护费用预测影响因素多、数据样本小及非线性的特点,发挥最小二乘支持向量机在处理有限样本条件下非线性回归问题的优势,建立了基于最小二乘支持向量机的普通公路大中修养护费用预测新模型。所建模型具有一定的推广性,为大中修养护费用预测提供了一种新思路。
但预测结果显示,基于最小二乘支持向量机的预测结果与真实值仍有差距,其预测精度还有进一步提高的空间,本文在构建特征指标体系过程中只提取了对大中修养护费用影响相对较大的几个指标,但在实际应用过程中,可以根据实际养护工程的具体情况在本文所选择的指标基础上进一步修改、增加相应指标,增加相关指标某种程度上会提高估算的准确性。
另外,还可以进一步改进该算法,例如将最小二乘支持向量机与遗传算法、蚁群算法等结合起来,以试图提高预测精度。
教育期刊网 http://www.jyqkw.com
参考文献:
[1]曹洁梅.基于支持向量机的高速公路工程造价估算方法研究[D].长沙:长沙理工大学,2013.
[2]崔庆安.质量监控与优化理论、算法及应用[M].北京:机械工业出版社,2013:34-47.
[3]欧阳红祥,李欣,余茜.基于SVR-EVM的项目进度-成本评价及预测研究[J].项目管理技术,2013,11(12):63-67.