单位文秘网 2021-09-01 09:04:59 点击: 次
信息非常重要。
针对工程机械设备耗损性部件电动机,获取到数据集包含训练集和测试集两部分。训练集中涵盖电动机全寿命物联网采样数据,即从安装后一直到更换之间的对应数据,形式为多维时间序列[8]。字段“部件工作时长”的最大值,即为该部件实例的实际寿命。测试集中包含部件一段时间内的电动机物联网采样数据,基于该段数据,预测电动机此后的剩余寿命。数据集中样本EDA后特征数据字段如表1所示。
数据标准化(归一化)处理,将消除指标之间的量纲影响,解决数据指标之间的可比性,使各指标处于同一数量级,适合进行综合对比评价[9]。采用Min-Max Normalization如公式(1),对数据进行归一化构造量化[0,1]区间,特征缩放后梯度下降过程会更加笔直,收敛可以得到更快的提升,得到数据归一化处理结果如表2所示。
3 工程机械核心部件寿命预测模型构造(Construction of life prediction model for core components of construction machinery)
3.1 K-Means聚类
使用K-Means聚类无须进行模型的训练,无监督学习效率高,处理大数据集,算法保持可伸缩性和高效性当簇接近高斯分布时,效果较好[10]。本文利用优秀的特征进行聚类,使用最小距离分类器MDC进行测试获得最佳K均值聚类k值为5,结果得分如表所示。
3.2 Stacking模型融合
Stacking堆叠(元组合)是指组合多个预测模型信息生成新模型的一种模型组合技术。堆叠模型(也称为二级模型),可以组合每个基本模型优秀的能力,忽略其他模型缺点,组合起来将优于单个模型[11]。因此,当基本模型模拟效果不同各有优缺点时,选择模型堆叠是最有效地。本研究选择了八个单模型进行预测,有Lasso回归、ElasticNet弹性网络、核岭回归Kernel Ridge Regression、决策树DecisionTree、随机森林RandomForest、GBDT、XGBoost、LightGBM。
各个模型预测效果精度得分如表4和图1所示,可以观察到决策树、XGBoost和LightGBM模型效果较好平均精度得分可以达到0.03左右,三种模型入选第二层学习器,为了防止过拟合现象发生,将随机森林模型也加入第二层学习器中。
使用Stacking(堆叠)模型对多个单一模型进行组合。以初级训练集八种模型训练出初级训练器,生成一个新数据集训练刺激第二层学习器,结合四个LR顶层模型进行次级训练[12],多模型融合过程如图2所示。
n=8個初级学习器,对初级学习器Mn,利用测试集数据D进行训练,将训练完成的Mn预测训练集D和测试集T的标签列,得到结果为Pn和Tn[13]。随后将n个学习模型结果合并,得到次级学习器的训练集和测试集。利用训练次级学习器,并预测得到最终的预测结果。
3.3 模型融合交叉验证
交叉验证指的是通过估计模型的泛化误差,选择模型的方法。优点在于不做任何假定前提,具有应用的普遍性,操作简便,是一种行之有效地模型选择方法[14]。通过将数据集均分成K个子集,并依次将其中的K-1个子集作为训练集,剩下的1个子集用作测试集。在K折交叉验证的过程中,每个子集均会被验证一次。本研究使用四折交叉验证方法构造,稳健性强,交叉验证过程如图3所示,对每一折进行预测,采用两层循环,第一层循环控制基模型的数目,第二层循环控制交叉验证四次,则对每一个基模型会训练四次,最后求均方根拼接得到预测结果。
4 模型预测结果(Model prediction results)
使用Stacking模型融合方法对所有测试集进行预测,使用时间为四天以内的电动机生命周期在8000—12000天,预测寿命和实际寿命相对均方根误差在0.1以内。使用时间为30天以内的电动机生命周期在2000—6000天,预测寿命和实际寿命相对均方根误差在0.4以内。使用1600天以内的电动机生命周期在4000天以内,相对预测寿命和实际寿命相对均方根误差在0.75以内。由此可见,基于Stacking算法的工程机械核心部件寿命预测模型预测效果良好。
5 结论(Conclusion)
本文将大数据分析机器学习的方法运用到工程机械自动化领域,提出了一种基于Stacking模型融合的工程机械核心部件寿命预测算法。从原始电动机传感数据入手,经过数据准备和预处理,K-means聚类生成训练样本,选择Lasso回归、ElasticNet弹性网络、核岭回归Kernel Ridge Regression、决策树DecisionTree、随机森林RandomForest、GBDT、XGBoost、LightGBM。八种子模型作为Stacking模型融合的基分类器,随机森林、GBDT、XGBoost和LightGBM作为Stacking模型融合的次级分类器进行识别,最终证明本算法具有良好的寿命预测效果,均方根误差小,精度高。有助于改变机械自动化领域传统被动的维修模式,转向预测维修自动化方面,从而降低核心部件使用风险,提高设备使用效能。
参考文献(References)
[1] Sbarufatti,M. Corbetta,A.Manes,et al.Monte-Carlo sampling based on a committee of artificial neural networks for posterior state estimation and residual lifetime prediction[J].International Journal of Fatigue,2016:35-38.
[2] Xiang Wan,Dong Wang,Peter W.Tse,et al.A critical study of different dimensionality reduction methods for gear crack degradation assessment under different operating conditions[J]. Measurement,2016(02):22-24.
[3] 杜党波,司小胜,胡昌华,等.基于随机退化建模的共载系统寿命预测方法[J].仪器仪表学报,2018(08):61-62.
[4] 牛乾.机械旋转部件的性能退化及其寿命预测方法研究[D].浙江大学,2018:6-8.
[5] 封杨,黄筱调,陈捷,等.基于小样本试验的大型回转支承剩余寿命预测[J].中南大学学报(自然科学版),2015(09):12-13.
[6] 尤明懿.基于状态监测数据的产品寿命预测与预测维护规划方法研究[D].上海交通大学,2012:43-46.
[7] ChunLin Zhang,Bing Li,BinQiang Chen,et al.Weak fault signature extraction of rotating machinery using flexible analytic wavelet transform[J].Mechanical Systems and Signal Processing,2015(06):89-90.
[8] 周志华.机器学习[M].北京:清华大学出版社,2016:67-69.
[9] Audi Ahmad,Pierrot-Deseilligny Marc,Meynard Christophe,et al. Implementation of an IMU Aided Image Stacking Algorithm in a Digital Camera for Unmanned Aerial Vehicles.[J].Sensors (Basel, Switzerland),2017(7):11-13.
[10] Truong Giang Nguyen,Muller Jean-Michaël,Rupnik Ewelina,et al.Second Iteration of Photogrammetric Processing to Refine Image Orientation with Improved Tie-Points[J].Sensors (Basel, Switzerland),2018(7):21-22.
[11] YiJun Chen,Man-Leung Wong,Haibing Li.Applying Ant Colony Optimization to configuring stacking ensembles for data mining[J].Expert Systems With Applications,2014(6):46-47.
[12] 沈长青.旋转机械设备关键部件故障诊断与预测方法研究[D].中国科学技术大学,2014:67-68.
[13] 肖婷,汤宝平,秦毅,等.基于流形学习和最小二乘支持向量机的滚动轴承退化趋势预测[J].振动与冲击,2015(09):11-13.
[14] 孙闯,何正嘉,张周锁,等.基于状态信息的航空发动机运行可靠性评估[J].机械工程学报,2013(06):90-92.
作者简介:
梁 超(1993-),女,硕士生.研究领域:工业互联网,软件应用,机器学习.
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-239-91009-1.html
下一篇:宇宙的主人
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用