电池组数据特征提取方法研究

(整期优先)网络出版时间:2023-05-23
/ 2

电池组数据特征提取方法研究

宋文强

天津商业大学 信息工程学院  天津 300134

摘要:特征提取是对原始数据关键特征的表达,能凸显原始数据的主要信息,避免和非主要信息产生“等价”变换,而弱化了主要信息价值。对于时间序列的电池组数据,设计基于注意力机制的时间序列特征提取算法,从而快速地对采集的数据进行有效降维与压缩。

关键词:电池数据 特征提取 降维

1引言

电池特征提取主要有三种方式: (1)根据经验和基本统计方法[1]。该法可根据经验和基本统计法直接给出特征。(2)根据关联分析方法[2]。利用经验获取特征后,利用关联算法确定特征和目标值之间的关系程度,然后进行筛选。(3)利用深度学习的特征自动提取功能[3]。基于深度学习算法对原始数据直接进行运算,弱化特征选择过程。现有的特征选择方法应用到实际环境,存在以下不足: ① 特征丢失—由于电池在实际应用中,并不是进行完整的充放电,导致充放电曲线并不完整。② 特征缺陷—当电池实现成组应用以后,除了电池本身的特征,还衍生出许多相关特征。③ 特征识别困难—产生强干扰,造成特征识别困难。针对上述问题,本文采用注意力机制法对电池特征进行提取。

2 电池群组数据特征

时间序列数据本身就属于高维数据,而对于电池系统,其数据不仅仅具有一个属性,所以电池组数据就变成了超高维数据。这种超高维数据的特征提取实质上就是对数据的维度进行降低,在数据降维的过程中从电池组数据的众多特征中将重要的、关键的特征提取出来,分离掉冗余特征,也就是筛选出重要数据与信息,从而可以节省内存空间,降低计算资源,提高运行速度。

电池数据具有循环周期性,该特性是指在充满电和完全放电的一个完整周期内数据具有往复的特性。但因其维度超高且降维难度较大,所以实际上很难得到完整的循环周期性数据,因此,引入伪循环周期的概念,所谓伪循环周期是指完成一次充电与放电的全过程,即将正常的数据进行分段并分配到预设的每个伪循环周期之中。这些数据分配到伪循环周期之前要先进行数据压缩,目前主要的压缩方法有两种,一种是无损压缩,另一种是降维处理。无损压缩是将原始数据原样不动地投到每一个伪循环周期之中,但这种方法无法实现数据的降维,而是将数据保持为原始维数投放入数据集中。降维处理就是将根据电池数据的每个属性的特征采用时间序列提取特征法来降维数据空间。

3  注意力机制方法基本原理

在人工神经网络里,所谓注意力机制实质上就是仿真神经元选择性地使突触的权重发生变化的实现过程。在卷积神经网络CNN中,这种机制可依赖掩膜而完成。首先,CNN从输入量中提取特征,并完成输入量到特征空间上的映射进而得到相关特征图,此时根据相关的特征图注意力机制进行学习产生形状特定的掩膜,同时基于点乘形式将掩膜与特征图相联系获取特征图。依据掩膜元素值域的不同,CNN的注意力机制被划分为硬注意力与软注意力两种机制。所谓硬注意力机制就是随机挑选的形式,动态性较软注意力机制更强。该机制由认知型心理学的过滤器的基本原理而启发得到的。该基本原理就是直接性地采样数据信息而并不计及全部数据信息,在由注意力机制产生的掩膜里的每个个体元素的值域都是{0,1},其中0与1分别代表对信息的接收与舍弃。由于硬注意力机制具有不可导特性,不兼容于多数神经网络的训练模式,所以在实际应用中软注意力机制采用较多。软注意力机制具备确定性与区域性的特点,与硬注意力机制不同,软注意力机制是由认知心理学的衰减器的基本原理启发而得到的。该基本原理就是将与所部署的任务不相关的信息按照衰减形式变化权重。在由软注意力机制产生的掩膜里的每个个体元素取值于[0,1],根据所取数值不同来体现信息的重要等级。与硬注意力机制的又一不同点在于软机制可以进行参数化设置且可导,与网络模型兼容很好,因此,该类机制在实际中被广泛应用。

所谓空间注意力机制就是将软注意力机制呈现于空间之中,对于同一图像的不同位置点所投入的注意度不一致。这种机制的目标是在将重点区域的信息与特征的传达模式进行提升,也就是基于相关空间转化模块把图像原本的空间信息转化到其他空间,同时将核心内容留存下来。所谓通道注意力机制就是指将软注意力机制应用在通道之中,也就是对原始图像的不同通道的注重度不一样。CNN中的感受野受到一定限制,网络中的各个卷积核所获取的特征全部为单个的局部特性。对于不一样的卷积核,所提取的特征也有着不一样的取向,所以卷积核所获取的图像特征间会出现较大的不同,而通道注意力机制能够较好地凭借着所获取的全局与局部特征间的不同性。

4  基于注意力机制的数据特征提取

4.1 提取方法基本介绍

     基于上述注意力机制的基本原理,引导出形状注意力机制的特征提取方法,这种方法概括来说就是在数据采集中基于输入数据波形的形状特征来进行搜索,并同时完成高维数据的压缩与降维环节,以得到数据时间序列的基本特征。该方法应用于电池数据系统可在一定幅度上节约了主机的运算时间与空间。

    在形状注意力机制中,数据波形的形状可归纳为等时距形状化与非等时距形状化两大类。等时距形状化就是指在标准坐标轴上的时间序列映射的波形具有波动的形态,这个波动的形态又可被分为速度加快式降落、速度平稳式降落、速度减慢式降落,无变化、速度减慢式升高、速度平稳式升高、速度加快式升高。若利用固定式的窗口对数据进行降维处理则会使误差变大,形状注意力机制是利用系统输入数据波形的形状转折点进行高维数据的降维处理以提高降维精度为目的,其算法的核心思想就是将初始数据进行替换,替换的工具就是寻找一条与初始输入数据变化相似的曲线。

4.2 算法基本流程

根据该算法基本理论,设计算法的基本流程如下:

Step 1 进行初始化设置,其中包括时间周期长度t、时间周期长度中的最大数据数量n、斜率的变化限定值ξ。

Step 2 数据采集,从第0时刻开始计时进行数据采集。

Step 3 确定转折点数目,设置第0时刻数据转折点的数目为零,并以此为初始时刻开始根据中间点斜率进行转折点数据的确定。

Step 4 判断是否特征提取成功。当时间到达tc时刻时,判断此时刻数据转折点数目m与时间周期长度中的最大数据数量n间的大小关系。当m小于等于n,则可证明提取特征完成;当m大于n时,则需要对斜率限定值重新进行设定直至特征提取成功。

Step 5 重新设置初始时刻,进行下一段时刻的搜索。

4.3 结果分析

整体实验分为以下几步:第一,从电池数据集中提取出电压数据;第二,采用形状注意力机制算法对原始数据进行特征提取,从而获得形状化的数据;第三,利用化动窗口均值算法进行结果计算。整个算法中还有一个关键问题,就是波形边界距离的确定。这个数值往往和所选电池的内阻、放电电流这两个参数有关系,且其电压之变化会与电阻与电流的乘积有关。

根据算法流程先对参数进行设置,并把数据送到训练模型之中获取降维结果。图1给出了数据波形变化情况与数据降维后的波形示意图,其中蓝色曲线代表原始数据波形,红色曲线代表降维数据波形。从图中可见,所提算法可以较好地跟踪于数据波形形状的变化情况,同时算法可以很好地识别出速度平稳降落、保持平稳状态、瞬间变化的所有变化情况。

  

(a) 原始数据波形                   (b)降维后的数据波形

图1  原始数据及其特征提取算法的降维结果

参考文献:

[1] M. Assefi, A. Hooshmand, H. Hosseini, et al. Battery Degradation Temporal Modeling Using LSTM Networks[A]. 2018 17th IEEE International Conference on Machine Learning and Applications (ICMLA)[C]. IEEE, 2018: 853–858.

[2] A. Widodo, M.-C. Shim, W. Caesarendra, et al. Intelligent prognostics for battery health monitoring based on sample entropy[J]. Expert Systems with Applications, 2011, 38(9): 11763–11769.

[3] Z. Liu, J. Zhao, H. Wang, et al. A New Lithium-Ion Battery SOH Estimation Method Based on an Indirect Enhanced Health Indicator and Support Vector Regression in PHMs[J]. Energies, 2020, 13(4).