2023年12月30日发(作者:尼桑轩逸2021款报价及图片)
基于随机森林算法的内河船舶油耗预测模型
牟小辉;袁裕鹏;严新平;赵光普
【摘 要】准确的船舶油耗预测模型是船舶实现各项航行优化措施的基础.以长江干线某旅游船为研究对象,通过安装信息采集系统获得了大量的船舶实时营运数据.通过理论分析得出影响船舶油耗的主要因素为风速、风向、水深、水流速度和船舶航速;改进了随机森林建模时参数的设置方法,提出一种变量的重要性测度方法;对去噪处理后数据进行系统抽样并进行归一化处理,得到建模的样本数据;把样本数据按0.7∶0.3的比例随机分为训练样本和测试样本,对训练样本采用随机森林(RF)算法建立油耗预测模型;通过模型预测测试样本的油耗值,与实测数据对比,结果显示预测误差低于6.8%,优于BP神经网络与支持向量机(SVM)的预测结果;分析模型中各变量的重要性顺序为:航速>水流速度>水深>风速>风向,利用偏相关分析得到了单个因素与油耗间的定量关系.%An accurate model to predict fuel consumption
of ships is the basis for optimizing ship a cruise ship in
the Yangtze River as a case study, a large volume of data on ship
operations is collected by an information acquisition on
theoretical analysis, the main factors that influence fuel consumption of
the ship are identified, which are wind speed, wind direction, water depth,
water velocity, and ship speed.A method of setting parameters of random
forest model is improved and a way to measure the significance of
variables is data is obtained by systematic samples after
de-noise data is then randomly divided into training samples
and testing samples by a ratio of 0.7 to 0.3.A prediction model of fuel
consumption is developed by using random forest (RF) algorithm to
address the training ed with the measured data, the errors
are within 6.8%, which is better than the model established by utilizing BP
neural network or support vector machine (SVM) with same
of the importance of each variable is: ship speed > water velocity > water
depth > wind speed > wind y, the quantitative relationship
between a single factor and fuel consumption is analyzed by using partial
correlation analysis.
【期刊名称】《交通信息与安全》
【年(卷),期】2017(035)004
【总页数】6页(P100-105)
【关键词】交通安全;内河船舶;油耗预测模型;随机森林算法
【作 者】牟小辉;袁裕鹏;严新平;赵光普
【作者单位】武汉理工大学国家水运安全工程技术研究中心 武汉 430063;武汉理工大学能源与动力工程学院可靠性工程研究所 武汉 430063;武汉理工大学船舶动力工程技术交通行业重点实验室 武汉 430063;武汉理工大学国家水运安全工程技术研究中心 武汉 430063;武汉理工大学能源与动力工程学院可靠性工程研究所 武汉 430063;武汉理工大学船舶动力工程技术交通行业重点实验室 武汉 430063;武汉理工大学国家水运安全工程技术研究中心 武汉 430063;武汉理工大学能源与动力工程学院可靠性工程研究所 武汉 430063;武汉理工大学船舶动力工程技术交通行业重点实验室 武汉 430063;武汉理工大学国家水运安全工程技术研究中心 武汉
430063;武汉理工大学能源与动力工程学院可靠性工程研究所 武汉 430063;武汉理工大学船舶动力工程技术交通行业重点实验室 武汉 430063
【正文语种】中 文
【中图分类】U491
目前,我国内河航运能源单耗约比国外高50%左右,长江干线上的船舶CO2年平均总排量为526.74万t,可以看出,我国内河船舶面临着巨大的节能减排压力。随着全球航运业的持续低迷,燃油价格上涨,国内外航运企业、研究机构对船舶节能减排的方法研究不断深入[1-2]。最新研究成果表明[4],综合应用船舶航行过程中航行操纵技术节能措施节能效果可达10%~50%。航行操纵技术节能方式主要包括航速优化[5-7]、航线优化[8]、纵倾优化[9]和自动驾驶仪改进[10]等。然而,航速优化、航线优化等节能减排措施,都必须以船舶油耗预测模型为基础,因此,开展船舶油耗预测模型的研究,对推动船舶节能减排有重要意义。
长久以来,国内外研究人员对如何建立船舶油耗预测模型进行了深入的研究。张伟等[11]以内河某宽浅型船舶为研究对象,结合实船设计参数和船模实验数据,建立了船舶动态油耗预测模型,并基于该模型对对象船舶进行了航速优化。王在忠等[12]利用内河船舶经常使用的XCW6200ZC型中速柴油机的台架试验数据,采用多项式拟合的方法,建立了柴油机推进特性下的油耗率预测模型,能够较好的预测该类型柴油机的油耗率。叶睿等[13]针对船舶实测运行数据,采用人工神经网络算法建立了船舶油耗和航速的黑箱模型,经验证可较准确预测油耗。Leifsson等[14]利用前馈神经网络,建立了串联与并联的2种灰箱模型,仿真结果表明该方法可以有效预测油耗。
综上所述,当前船舶油耗预测模型的建模方法可分为2种:机理分析建模与数据统计分析建模。其中,机理分析建模需要完整的船舶设计参数(船体型线图、主机型号、螺旋桨设计参数、舵设计参数)和实验数据(船模实验、试航报告、螺旋桨敞水试验),分析过程复杂,建模难度相对较大,实用性较差;且船舶油耗受船龄、
航道通航环境等多因素的影响,机理建模无法顾及全面。数据统计分析建模仅需分析影响船舶油耗的相关因素,以实测数据为基础,结合数学方法探索数据之间的内在关系建立模型。由于不存在冗繁的机理分析过程,难度相对较小,实用性好;影响船舶油耗因素考虑的更为全面,且采用实时数据建模,模型的准确度相对较高;另外,信息技术、传感技术的发展,也为数据统计分析建模提供了数据支持。目前,采用较多的数学方法有神经网络、多项式拟合、支持向量机等,但模型的精确度随样本的选择变化较大,当所选建模样本不好时,往往不能满足实际需要。
本研究正是基于上述背景,将随机森林算法首次应用到船舶油耗预测建模中。选择内河某旅游船的实测营运数据为基础,分析影响船舶油耗的主要因素;应用随机森林算法对训练样本数据建立船舶油耗预测模型,并且通过测试数据对模型可靠性进行验证;利用该油耗模型量化各因素对油耗的影响程度。
随机森林算法的基础学习器为决策树,决策树是一种预测模型,可对交互性复杂的数据进行学习训练,探索数据内在规律,进而对新数据对象进行预测。决策树生长过程类似一棵倒置的树,从根节点开始,根据数据间的不同属性,将训练样本集不断分成不同的训练子集,决策树上的各个分支就是对数据不断分组的过程中逐渐生长出来的。当某组数据的继续分组不再有意义时,它所对应的分支便不再生长,是为叶节点;反之,则为中间节点。当所有数据组的继续分组不再有意义时,决策树的生长过程结束,形成一颗完整的决策树。随机森林算法用随机方式建立一片森林,森林中包含大量的决策树形成组合预测模型,预测时由这组模型同时提供各自的预测结果,然后通过取这些结果的众数或平均值作为最终的预测结果,原理如图1所示。
相较于其他数据建模方法,随机森林算法的优势在于随机,表现在2个方面:①训练样本是对原始样本的重抽样自举,具有随机性;②在每颗决策树的建立过程中,成为当前最佳分组变量的输入变量,是输入变量全体的一个随机候选变量子集的
“竞争获胜者”(根据分枝优度准则),具有随机性。因此,随机森林算法能够处理很高维度的数据,并且不用做特征选择;同时,由于两个随机过程(训练集和特征)的引入,使得每棵树的输入样本都不是全部样本,而且里面包含重复的样本,所以就算不剪枝,随机森林模型也不易产生过拟合。
2.1 数据需求分析
在船舶航行过程中,主机消耗燃油发出功率,经过轴系带动螺旋桨旋转产生推力,用以克服航行阻力,推动船舶以某一航速前进,即
Pe=R·V
因此,船舶油耗主要与航行阻力R和航速V有关。船舶阻力R由船舶风阻力Rwind和水线以下的水流阻力Rwater组成,在较大程度上受到船舶通航环境的影响[17]。对于内河营运船舶,船舶风阻力Rwind主要受风速Vwind和风向角α影响;航道水深Dwater对船舶阻力的影响,主要体现在当航道水深较浅时,会产生浅水效应,增加水线以下的流体阻力Rwater[18];水流速度Vwater则会影响船舶航速,船舶逆流航行时,船舶对地航速Vground为对水航速与水流速度之差,顺流航行时,Vground等于对水航速与水流速度之和。
综合以上分析,影响船舶油耗Q的因素有风速Vwind、风向α、水深Dwater、水流速度Vwater、航速Vground,即
2.2 数据采集
笔者以内河某旅游船为对象,安装信息采集系统,采集通航环境数据(航道水深、水流速度、风)和船舶能耗数据(主机油耗),同时还包括船舶的航行状态信息(主机转速、船舶位置、船舶航速)。相关信息采集传感器的布置情况及其采集的参数见表1。
需要说明的是,选择旅游船开展研究,主要有两方面原因,首先是该旅游船主机燃用的为轻质柴油,便于油耗数据的精确采集,而长江上的其他类型船舶大都燃用重
油,不利于开展采集工作;其次,旅游船不管是满载还是空载时,其吃水前后变化很小,可以避免因船舶吃水变化对水深数据精度的影响。经过安装调试,上述数据采集传感器能在船舶航行过程中正常采集数据,各类数据的采集频率均为1 s,并将实时数据存储到数据库中。
2.3 数据处理
为避免水流方向对模型的影响,本研究以2014年9月船舶由上海至重庆上水航行时,采集的数据进行分析,包括了长江干线全程的数据。在对原始数据分析前,首先利用Matlab软件去除原始数据中的奇异值和噪声数据;然后对去噪处理后的数据进行编号,并进行等距离抽样。经过上述处理,获得了850条通航环境(航道水深、水流速度、风速、风向)、船舶能耗(主机油耗)和船舶航速数据对。
由于是实船采集数据,因此船舶实际航行时不能直接采集到航道的水流速度与风速、风向。水流速度采用将船舶对水航速与对岸航速作差后再取绝对值的方法计算;实际风速、风向计算方面,在船舶航行时,风可分为真风、船风和视风,真风是指空气相对水面的水平运动;船风是由船舶本身的运动所产生的,是一种风向与航向相同、风速与船速相等的风;而视风则是真风与船风的矢量叠加,也就是在船上,用风速、风向设备所测得的风,其转换关系图见图2。
由上述矢量图可得真风、船风与视风的转换关系:
船舶能耗以单位公里消耗的燃油Q(kg/km)表示,其计算公式为
式中:q1、q2分别为船舶左右主机的瞬时油耗,m3/h;ρ为燃油的密度,对象船舶燃用的为0#柴油,取835 kg/m3; Vground为船舶对岸航速 km/h。
经过处理后的部分样本数据如表2所示,其中航速为GPS接受仪测得的船舶对岸航速。对数据进行归一化处理,将处理结果作为建模数据。
3.1 模型建立及预测能力分析
以船舶单位公里油耗值为因变量,风速、风向、水流速度、水深、航速为自变量。
以0.7∶0.3的比例将原始样本随机分为600条训练样本,剩余250条为测试样本,以训练样本建立船舶油耗的RF回归模型。利用建立的RF回归模型预测250条测试样本数据的船舶油耗,然后将预测值实测值进行对比,结果如图3所示。
由图3可见,RF回归模型预测的船舶油耗与实测数据近乎重合,有很高的逼近度。值得指出的是,测试样本是从原始样本里随机选出的,采用随机得到测试样本的实际油耗数据绘图,会使得数据点上下震荡,影响图形的美观,因此,绘图前对实际油耗数据进行了从小到大的排序。
计算RF回归模型预测结果的相对误差,如图4所示。
由图4可见,RF回归模型的预测精度相对较高,相对误差大都小于4%,最大相对误差仅为6.8%。对训练样本分别用BP神经网络和支持向量机建立油耗预测模型,再用测试样本检验模型的预测效果,与RF回归模型进行对比,结果如表3所示。
由表3可见,基于RF回归模型预测的最小相对误差仅为0.05%,最大相对误差为6.86%,远低于BP神经网络和SVM,可见该模型预测精度较高;另一方面,BP神经网络与SVM建模过程中都有很多参数需要调整,而RF回归建模过程更为简洁。
3.2 影响因素重要性分析
为分析风速、风向、水深、水流速度、航速的重要性,采用随机森林算法评估各因素对模型预测精度的平均影响,分析结果的柱形图如图5所示。由图5可知,航速对于船舶油耗的影响最为显著,风向的影响最小,各输入变量的重要性顺序为:航速>水流速度>水深>风速>风向。
为具体分析各输入变量对船舶单位公里油耗的影响,进行偏相关分析,除去其余变量的影响,只分析单一变量变化对船舶油耗的影响,分析结果如图6~8所示。
由图6 a)可知,风速小于6 m/s时,油耗随风速的变化并不明显,在较小的范围
内波动,当风速超过8 m/s时,油耗随风速的增加迅速增大。由图6 b)中可知,当风向为20°时,对油耗的影响最为显著,随着风向角的增加,对油耗的影响越来越小,当风向大于80°时,风向对油耗的影响已经很小。这是由于风向20°时为船舶正迎风,风速在船艏艉线上的分量最大,影响也最为显著,随着风向角的增大,风速在船艏艉线上的分量越来越小,影响也随之下降,当风向为80°时,影响已经微乎及微。
由图7 a)可知,当航道水深小于30 m时,油耗随水深的增加迅速降低,这是由于浅水阻力随着水深增加迅速降低;当水深在30~70 m时,油耗随水深的增加缓慢下降;当水深大于70 m时,水深对油耗几乎无影响。图7 b)中,船舶单位公里油耗随着水流速度的上升,急剧增大。这是由于船舶上水航行时,水流速度越大,船舶对岸航速越低,直接导致单位距离耗油量的增加。
由图8可知,随着航速的增加,油耗呈现单调递增的趋势。当航速在2~4 m/s时,油耗随航速的上升增幅相对较小,当航速大于4 m/s时,油耗随着航速上升急剧增大。这是由于主机功率与航速大约呈三次方关系,因此,航速的少量增加,主机功率都会迅速增大,进而导致油耗的迅速增加。
1) 随机森林算法能够基于船舶实测运行数据建立油耗预测模型,可以比较精确的预测船舶油耗,预测误差控制在6.8%以内,预测能力优于以同一样本建立的BP神经网络和支持向量机预测模型,可考虑作为船舶运行优化的基础。
2) 通过该油耗预测模型定量分析各因素对船舶油耗的影响,得出对油耗的影响程度顺序为:航速>水流速度>水深>风速>风向。并通过偏相关分析,得出单一因素对船舶油耗的具体影响,可为船舶操纵人员提供参考,制定更为合理的航行计划,服务于船舶节能减排。
3) 后续研究需要进一步分析影响船舶单位公里油耗的因素,讨论最优变量组合的选择方法,以期在合理的精度范围内以最少的输入变量数目构建船舶油耗预测模型。
▲通信作者:严新平(1959-),博士,教授,研究方向:船舶节能减排. E-mail:**************.cn
【相关文献】
[1] BIJLSMAL S J. Minimal time route computation for ships with pre-specified voyage
fuel consumption[J]. Journal of Navigation, 2008, 61(4): 723-733.
[2] SHAO Wei, ZHOU Peilin, KAIT Sew Thong. Development of a novel forward dynamic
programming method for weather routing[J]. Journal of Marine Science and Technology,
2012, 17(2): 239-251.
[3] LO Kevin. A critical review of China\'s rapidly developing renewable energy and energy
efficiency policies[J]. Renewable & Sustainable Energy Reviews, 2014(29): 508-516.
[4] 孟晓东, 袁章新. 营运船舶节能减排技术进展[J]. 上海船舶运输科学研究所学报, 2014, 37(1):35-38.
MENG Xiaodong, YUAN Zhangxin. Development of operational measures for ship fuel
saving and emissions reduction[J]. Journal of Shanghai Scientific Research Institute of
Shipping.2014, 37(1):35-38. (in Chinese)
[5] PSARAFTIS H N, KONTOVAS C A. Ship speed optimization: Concepts, models and
combined speed-routing scenarios[J]. Transportation Research Part C: Emerging
Technologies, 2014, 44(4):52-69.
[6] ZHAO J J, YANG S L, LI K. The optimization of navigation performance for high-speed
ship based on an improved parallel genetic algorithm[C]. Computational Intelligence and
Software Engineering Conference, Wuhan, China: IEEE, 2010.
[7] 陈前昆, 严新平, 尹奇志,等. 基于EEOI的内河船舶航速优化研究[J]. 交通信息与安全, 2014,
32(4):87-91.
CHEN Qiankun, YAN Xinping, YIN Qizhi, et al. Speed optimization for inland river ships
based on EEOI[J]. Journal of Transport Information and Safety,2014,32(4):87-91. (in
Chinese)
[8] DELITALA A M S, GALLINO S, VILLA L, et al. Weather routing in long-distance
mediterranean routes[J]. Theoretical and Applied Climatology, 2010, 102(1):125-137.
[9] 张 剑. 基于纵倾优化的船舶能效研究[D]. 大连海事大学, 2015.
ZHANG Jian. Study on ship energy efficiency based on trim optimization[D]. Dalian:Dalian Maritime University, 2015.(in Chinese)
[10] 甘世红, 吴燕翔, 李军军,等. 基于遗传算法的模糊控制型船舶自动驾驶仪研究[J]. 中国造船,
2011, 52(1):173-179.
GAN Shihong, WU Yanxiang, LI Junjun, et al. Investigation of fuzzy ship autopilot based
on the genetic algorithm[J]. Shipbuilding of China, 2011, 52(1):173-179.(in Chinese)
[11] 张 伟, 王 红, 张澍宁,等. 内河船舶主机动态油耗模型的研究与建立[J]. 交通标准化,
2013(22):95-97.
ZHANG Wei, WANG Hong, ZHANG Shuning. Study and establishment of inland ship main
engine dynamic fuel consumption model[J]. Transportation Standardization, 2013(22):95-97.(in Chinese)
[12] 王在忠, 张跃文, 孙培廷. 内河船用中速柴油机油耗率模型的建立[J]. 中国航海, 2015, 38(2):34-37.
WANG Zaizhong, ZHANG Yuewen, SUN Peiting. Fuel consumption model for inland
marine medium speed diesel engine[J]. Navigation of China, 2015, 38(2):34-37.(in Chinese)
[13] 叶 睿, 许劲松. 基于人工神经网络的船舶油耗模型[J]. 船舶工程, 2016(3):85-88.
YE Rui, XU Jinsong. Vessel fuel consumption model based on neural network[J]. Ship
Engineering, 2016(3):85-88.(in Chinese)
[14] LEIFSSON L P, S?VARSDTTIR H, Sigursson S P, et al. Grey-box modeling of an ocean
vessel for operational optimization[J]. Simulation Modelling Practice & Theory, 2008,
16(8):923-932.
[15] 方匡南, 吴见彬, 朱建平, 等. 随机森林方法研究综述[J]. 统计与信息论坛, 2011, 26(3):32-38.
FANG Kuangnan, WU jianbin, ZHU jianping, XIE bangchang. A review of technologies on
random forest[J]. Statistic & Information Forum, 2011, 26(3):32-38.(in Chinese)
[16] Marine Environment Protection Committee. Prevention of air pollution from ships
(Second IMO GHG Study 2009)[R]. London: Marine Environment Protection Committee,2009.
[17] 招定友. 船舶浅水效应的研究[J]. 天津航海, 2009(2):4-6.
ZHAO Dingyou. The resaerch on the shallow water effect of ships[J]. Tianjin of Navigation,
2009(2):4-6. (in Chinese)
[18] 李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报, 2013, 50(4):1190-1197.
LI Xinhai. Using “random forest” for classification and regression[J]. Chinese Journal of
Applied Entomology, 2013, 50(4):1190-1197.
更多推荐
船舶,油耗,数据,模型,预测
发布评论