分享
基于特征选择和数据增强的电池荷电状态预测_朱月凡.pdf
下载文档

ID:2251894

大小:1.89MB

页数:10页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 特征 选择 数据 增强 电池 状态 预测 朱月凡
基于特征选择和数据增强的电池荷电状态预测朱月凡1,蒋国平1,高辉1,李炜卓2,归耀城21(南京邮电大学自动化学院、人工智能学院,南京210023)2(南京邮电大学现代邮政学院,南京210003)通信作者:高辉,E-mail:摘要:现有基于神经网络的电池荷电状态(stateofcharge,SOC)预测研究大多把重点放在模型结构和相关参数的优化上,却忽略了训练数据的重要作用.针对该问题,文中提出了一种基于特征选择和数据增强的电池 SOC 预测方法.首先,方法根据原始电池充放电数据进行特征工程,并使用排列重要性(permutationimportance,PI)方法选出对模型预测最有帮助的 7 个特征;其次,通过加入高斯噪声来扩大训练数据样本总量,达到数据增强的目的.实验使用双向长短时记忆网络(bidirectionallongshort-termmemory,Bi-LSTM)作为预测模型,使用 Panasonic18650PF 数据集作为训练数据.使用标准 Bi-LSTM 进行预测时,平均绝对误差(meanabsoluteerror,MAE)和最大误差(maxerror,MaxE)分别为 0.65%和 3.92%,而在进行特征选择和数据增强后,模型预测的 MAE 和 MaxE 分别为 0.47%和2.62%,表明 PI 特征工程与高斯数据增强方法可以进一步提升电池荷电状态预测模型的精度.关键词:电池荷电状态预测;双向长短时记忆网络;特征选择;数据增强;高斯噪声引用格式:朱月凡,蒋国平,高辉,李炜卓,归耀城.基于特征选择和数据增强的电池荷电状态预测.计算机系统应用,2023,32(2):4554.http:/www.c-s- State of Charge Prediction Based on Feature Selection and Data AugmentationZHUYue-Fan1,JIANGGuo-Ping1,GAOHui1,LIWei-Zhuo2,GUIYao-Cheng21(CollegeofAutomation&CollegeofArtificialIntelligence,NanjingUniversityofPostsandTelecommunications,Nanjing210023,China)2(SchoolofModernPosts,NanjingUniversityofPostsandTelecommunications,Nanjing210003,China)Abstract:Theexistingresearchonbatterystateofcharge(SOC)predictionbasedonneuralnetworksmostlyfocusesontheoptimizationofmodelstructureandrelatedparameters,ignoringtheimportantroleoftrainingdata.AbatterySOCpredictionmethodbasedonfeatureselectionanddataaugmentationisproposedtoovercomethisproblem.Specifically,featureengineeringiscarriedoutaccordingtotheoriginalbatterychargeanddischargedata,andsevenfeaturesthataremosthelpfultomodelpredictionareselectedbythepermutationimportance(PI)method;then,Gaussiannoiseisaddedtoexpandthetotalnumberoftrainingdatasamplesandtherebyachievethepurposeofdataaugmentation.Intheexperiment,abidirectionallongshort-termmemory(Bi-LSTM)networkisusedasthepredictionmodel,andthePanasonic18650PFdatasetisadoptedasthetrainingdata.WhenthestandardBi-LSTMmodelisemployedforprediction,themeanabsoluteerror(MAE)andthemaximumerror(MaxE)are0.65%and3.92%respectively.Afterfeatureselectionanddataaugmentation,theMAEandMaxEofmodelpredictionare0.47%and2.62%respectively,indicatingthattheaccuracyofthebatterySOCpredictionmodelcanbefurtherimprovedbyPIfeatureengineeringandtheGaussiandataaugmentationmethod.Key words:state-of-chargeprediction;bidirectionallongshort-termmemory(Bi-LSTM)network;featureselection;dataaugmentation;Gaussiannoise计算机系统应用ISSN1003-3254,CODENCSAOBNE-mail:ComputerSystems&Applications,2023,32(2):4554doi:10.15888/ki.csa.008943http:/www.c-s-中国科学院软件研究所版权所有.Tel:+86-10-62661041基金项目:国家自然科学基金(52077107)收稿时间:2022-06-28;修改时间:2022-07-25;采用时间:2022-08-15;csa 在线出版时间:2022-12-06CNKI 网络首发时间:2022-12-07SpecialIssue专论综述45精确的 SOC 预测作为电池管理系统中极其重要的一环,可以保障电池免受过充过放带来的损害.然而,锂离子电池是一个非常复杂的非线性系统,它的荷电状态无法直接测量,只有通过可直接测量的电池端电压、充放电电流和电池表面温度来对其进行估计.此外,电池的健康状态、自放电行为都会对 SOC 预测带来不利影响.因此,如何准确预测锂离子电池的荷电状态是一个值得研究问题.SOC 是电池中所存储能量的相对度量,定义为特定时间点可从电芯提取的电荷量与总容量之比1.目前用来预测 SOC 的方法主要有 4 种:安时计数法,开路电压法,基于模型的方法和基于数据驱动的方法.安时计数法是使用最广泛的 SOC 预测方法,它的原理很简单,用电流的积分代表电量,这种方法的缺陷也很明显:如果电流测量不准,计算误差会随着时间不断增加,需要不断的校准2;开路电压法的原理是电池 SOC 与电池开路电压有着单调的对应关系3,但是开路电压的测量需要先将电池静置 2h 以上,因此该方法不适合实时预测 SOC4.基于模型的方法是指建立电池的状态空间模型,常见的有卡尔曼滤波器及其变体5,6,粒子滤波器7,H 无穷滤波器8.基于模型的方法可以获得较好的预测效果,但是这些模型需要大量的计算来进行参数辨识,而且在不同的环境下,模型也要改变9,10.神经网络可以通过智能算法自动学习网络参数并从中获取电池输入数据和 SOC 之间的关系.近年来进行 SOC 估计的神经网络结构主要有径向基函数神经网络(radialbasisfunctionneuralnetwork,RBFNN)11,反向传播神经网络(back-propagationneuralnetwork,BPNN)12等.为了提升神经网络的预测精度,需要进行大量实验去寻找最优参数,采用布谷鸟搜索,粒子群优化等算法可以快速寻找到神经网络相关参数的最优值13.为了解决传统神经网络中存在的梯度消失、过拟合等问题,基于深度学习的 SOC 预测方法引起了学者们的广泛关注.常用于电池 SOC 估计的深度学习模型有卷积神经网络(convolutionalneuralnetwork,CNN)和循环神经网络(recurrentneuralnetwork,RNN)14,15,其中,RNN 的发展,尤其是对门控循环单元(gatedre-currentunits,GRU)和长短期记忆网络(longshort-termmemory,LSTM)的研究,为解决时间序列预测问题提供了新的方向1619.Chemali 等人使用 LSTM 训练了一个单一的网络模型,该模型可以准确预测不同环境温度下的 SOC,在固定的环境温度下,模型的 MAE 为 0.573%,在环境温度从 10 上升到 25 的数据集上,MAE 为 1.606%,证明了该深度学习模型是 SOC 预测的强力工具20.倪水平等人提出了一种基于一维卷积神经网络与长短期记忆网络结合的电池荷电状态预测方法,该方法首先通过一层一维卷积层从样本数据中提取出高级数据特征,之后再使用一层 LSTM 来预测 SOC 结果21.Bian等人在 LSTM 的基础上引入了双向循环结构和多层隐藏层,构建了 SBLSTM 模型,该模型可以完全利用电池的时间信息来预测 SOC22.数据和特征决定了机器学习的上限,而模型和算法只是逼近了这个上限而已.然而,现有的基于深度学习的 SOC 预测研究大多把研究重心放在模型的选择以及模型参数的优化上,却忽视了数据本身的作用.对深度学习来说,海量的适配数据通常较难获得,因此文中通过其他途径来优化数据,继而提高预测的性能.最常见的优化数据方法有特征选择和数据增强.特征选择的目的是找到和预测目标关联性最强的特征,这样可以极大的提升模型的预测效果23.数据增强也叫数据扩增,意思是在不实质性增加数据的情况下,让有限的数据产生等价于更多数据的价值.因此,本文在选定了双向长短时记忆网络(Bi-LSTM)作为预测模型的基础上,又采用了两种数据优化的方法:使用 PI 特征选择算法来选择特征,使用加入高斯噪声的方法来增强原始数据.实验结果表明,本文提出的 PI 特征工程和高斯数据增强方法可以进一步提升电池荷电状态预测模型的精度.本文的剩余部分组织如下:第 1 节介绍本文使用到的模型和方法:Bi-LSTM 模型、PI 算法、高斯数据增强.第 2 节介绍了电池数据的获取以及实验步骤.第 3 节是实验结果与分析.第 4 节作为总结.1所用模型与方法介绍 1.1 Bi-LSTM 模型1.1.1LSTM 结构传统的前馈神经网络缺乏使用历史信息的能力,历史信息在时间序列的数据中是非常重要的,电池的充放电数据就是很典型的时间序列数据.因此,建立一个可以有效利用历史信息的神经网络模型来预测电池的荷电状态是很有必要的.循环神经网络RNN 满足这计 算 机 系 统 应 用http:/www.c-s-2023年第32卷第2期46专论综述SpecialIssue一要求,但是普通的 RNN 由于反向传播时的梯度消失问题,无法捕捉长期的依赖信息.为了解决该问题,Hochreiter 等通过添加存储单元结构,提出了 LSTM 循环神经网络24.LSTM 循环神经网络的结构如图 1所示.LSTMh0Xc0h1gyLSTMh1Xc1h2gyLSTMXhTgy.图 1LSTM 循环神经网络LSTM 的输入是一条序列 S=X,X,X,长度为 T,序列中每一个元素是一个样本点 X=x1,x2,xn,n 是样本的维度即特征个数.在电池荷电状态预测中,每个样本数据包含电流、电压、温度等 n 个特征,T 个连续的样本构成一条序列,序列中最后一个元素对应的SOC值就是该条序列的标签.h 和 c 是隐藏层状态,每个 X 对应一个输出 y,y 的计算

此文档下载收益归作者所有

下载文档
收起
展开