一种大规模储能电站异常电池识别方法、设备及存储介质转让专利

申请号 : CN202211467451.7

文献号 : CN115511013B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 史林军鲁千姿燕志伟吴峰林克曼李杨

申请人 : 河海大学

摘要 :

本发明涉及储能系统分析与控制技术领域,尤其涉及一种大规模储能电站异常电池识别方法、设备及存储介质,方法包括如下步骤:收集大规模储能电站的电池数据,对其中存在的噪声数据进行识别和删除,利用牛顿插值法对缺失数据进行补齐处理;利用时间卷积注意力机制网络提取异常电池深层特征,并引入典型工况序列,用于存放降维后的所有充电段特征数据;基于电池充电段特征,将删除机制和深度聚类算法相结合,利用改进深度聚类的离群点检测算法识别大规模储能电站中的异常电池。本发明中,提高了数据的准确度和精确性;通过将删除机制与深度聚类的离群点检测方法进行结合,解决了低波动性、非等维空间条件下,电池不一致性和故障状态评估的难题。

权利要求 :

1.一种大规模储能电站异常电池识别方法,其特征在于,包括如下步骤:收集大规模储能电站的电池数据,对其中存在的噪声数据进行识别和删除,利用牛顿插值法对缺失数据进行补齐处理;

利用时间卷积注意力机制网络提取异常电池深层特征,并引入典型工况序列,用于存放降维后的所有充电段特征数据;

基于电池充电段特征,将删除机制和深度聚类算法相结合,利用改进深度聚类的离群点检测算法识别大规模储能电站中的异常电池;

所述改进深度聚类利用减法聚类对待分析模组内的所有电池单体进行簇划分,标号为;

所述改进深度聚类进行聚类时,包括如下步骤:针对对所有数据点进行密度计算,第i个数据点的密度表达式如下:;

其中 是欧式距离,表示第i个数据点与第k个数据点之间的静态距离,为曲线间的弯曲距离,其表达式为 ,其中, 是常数, 表示某数据点受其他数据点影响的范围, 越大,表示受影响的范围越大,聚类中心即为密度最大的数据点,用 表示;

计算其他数据的聚类中心,以去除上一个点求得的中心为前提计算其余点的密度,计算公式如下:;

其中 为第 个数据点的聚类中心, 为第 个数据点的聚类中心密度,参数的表达式为 ,其中 为设定参数, ;

利用公式进行约束,判断减法聚类是否结束,未结束则返回继续聚类,结束则进入下一步骤,判断公式如下:;

其中 为常数, 的取值为 ,所有数据点的聚类中心求解完成后,对所有数据点进行类别划分,进而电池单元进行判别与归类;

所述离群点检测算法包括:

将电池电压序列构成的数据空间记为 ,聚类形成的簇划分为 , 为簇内所有

电池单体之间的均距, 两个簇中心的距离,计算公式如下:;

其中,簇内的电池单体电压曲线越接近, 越小;簇与簇之间距离越远,分离度越高, 越大;

利用戴维森堡丁指数来衡量簇内紧凑程度和簇与簇之间的分离程度,具体公式如下:;

设定阈值DBI0,将所得的各DBIa数据与其进行对比,若DBIa

对所确定的离群点进行一一删除,再计算离群集合中的所有元素一一被删除后的数据空间的二次聚类质量,识别检测对聚类质量影响最大的元素,二次聚类质量数值最小的即判定为异常电池单元。

2.根据权利要求1所述的大规模储能电站异常电池识别方法,其特征在于,所述对其中存在的噪声数据进行识别和删除包括:若电池数据中某个属性在若干时间段内超出设定阈值,则删除该时间段的该属性数据;

其中,所述设定阈值根据电池种类及电池的属性种类进行设置。

3.根据权利要求1所述的大规模储能电站异常电池识别方法,其特征在于,所述利用牛顿插值法对缺失数据进行补齐处理包括:识别时间序列矩阵E中所有的缺失数据,所述时间序列矩阵E为:;

其中,电池数据电流记作I、电压记作V、温度记作T和时间观测点记作t;

通过牛顿插值函数补齐缺失数据处的缺失值,所述牛顿插值函数为:;

其中, 为 阶差商,定义如下:。

4.根据权利要求3所述的大规模储能电站异常电池识别方法,其特征在于,对缺失数据进行补齐处理后,还包括:对数据进行归一化处理,所述归一化处理为最大最小规范化,即:;

式中: 为原映射区间 的一个取值, 为 的最大值,最小值为,新映射区间的最大值为 ,最小值为 , 为经过归一化处理后的数值。

5.根据权利要求1所述的大规模储能电站异常电池识别方法,其特征在于,所述利用时间卷积注意力机制网络提取异常电池深层特征,包括如下步骤 :确定待采样数据空间,确定选定特征两个特殊值 和 ,预设 个充电循环、斜率阈值 ;

注意力机制一次查询,设置 ,确定峰值 对应的采样时间点;

注意力机制二次查询,设置 ,

得到对应的 、 ,通过与 联合确定充电开始时刻 ;

形成该数据空间中所有的充电时间序列,将分散充电时间序列进行合并形成新的纯充电时间序列 ;

根据重新合并的充电时间序列,构成充电数据空间 ;

使用 TCN时间卷积网络对数据空间 进行特征提取得到典型工况特征空间。

6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1‑5中任一项所述的方法。

7.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1‑5中任一项所述的方法。

说明书 :

一种大规模储能电站异常电池识别方法、设备及存储介质

技术领域

[0001] 本发明涉及储能系统分析与控制技术领域,尤其涉及一种大规模储能电站异常电池识别方法、设备及存储介质。

背景技术

[0002] 新能源发电技术是近年来的火热话题,为促进新能源的消纳,缓解新能源并网带来的随机性和波动性,减少电网的总体能源消耗量,储能技术也随之蓬勃发展。现阶段储能的主要存在形式有电化学能、磁场能、电场能和机械能等。电化学储能技术是目前各国研究发展的主要方向,主要是因其能量转换率、能量密度、设备响应速度和机动性均表现优异,为构建新型电力系统,服务实现碳达峰、碳中和,电化学储能技术起到了不可替代的作用。
[0003] 电化学储能技术的使用不仅可以促进节能减排,显著缓解环境压力,更可以保障电力系统的安全稳定运行。但随着电化学储能技术逐渐渗透在电力系统各个环节,电化学储能电站安装和投运使用的过程中,电池的质量的好坏和老化的速度无法控制,随着投运使用的时间不断加长,储能电站的安全性也越来越差,发生事故的概率性也有一定程度的增加。这使得电力系统对储能电池的一致性要求越来越高,但是由于电力储能用锂电池在制造艺术上的参差和其性能上不可避免的差异,必然存在或大或小的不一致,使得电池组的性能出现大幅衰减。因此,锂电池的状态估计对于提高其使用效率、运行性能及寿命具有十分重要的意义。
[0004] 电池系统状态往往由多个因素决定,这些因素和高维时间序列叠加形成超高维数据空间,电池状态的关键特征和冗余特征糅杂。安全性一直是电池应用的关键所在,频发的安全事故大幅限制了电池应用的范围和电池产业发展的速度。锂离子电池的故障诊断是电池储能系统安全可靠运行、维护保养的必要手段,目前已有许多研究针对不同电池故障提出了诊断方法。
[0005] 但是区别于实验室的电池数据,大规模储能系统存在数据量大、维度高、信息量复杂等特点,而且其测试周期是电池的自然衰减周期,时间尺度很长。已有研究提出的基于统计学和基于数据变换的方法均不适用于分析大规模储能电站的数据,因此亟待解决上述问题。
[0006] 公开于该背景技术部分的信息仅仅旨在加深对本发明的总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

发明内容

[0007] 本发明提供了一种大规模储能电站异常电池识别方法、设备及存储介质,从而有效解决背景技术中的问题。
[0008] 为了达到上述目的,本发明所采用的技术方案是:一种大规模储能电站异常电池识别方法、设备及存储介质,包括如下步骤:
[0009] 收集大规模储能电站的电池数据,对其中存在的噪声数据进行识别和删除,利用牛顿插值法对缺失数据进行补齐处理;
[0010] 利用时间卷积注意力机制网络提取异常电池深层特征,并引入典型工况序列,用于存放降维后的所有充电段特征数据;
[0011] 基于电池充电段特征,将删除机制和深度聚类算法相结合,利用改进深度聚类的离群点检测算法识别大规模储能电站中的异常电池。
[0012] 进一步地,所述对其中存在的噪声数据进行识别和删除包括:
[0013] 若电池数据中某个属性在若干时间段内超出设定阈值,则删除该时间段的该属性数据;
[0014] 其中,所述设定阈值根据电池种类及电池的属性种类进行设置。
[0015] 进一步地,所述利用牛顿插值法对缺失数据进行补齐处理包括:
[0016] 识别时间序列矩阵E中所有的缺失数据,所述时间序列矩阵E为:
[0017] ;
[0018] 其中,电池数据电流记作I、电压记作V、温度记作T和时间观测点记作t;
[0019] 通过牛顿插值函数补齐缺失数据处的缺失值,所述牛顿插值函数为:
[0020] ;
[0021] 其中, 为 阶差商,定义如下:
[0022]  。
[0023] 进一步地,对缺失数据进行补齐处理后,还包括:
[0024] 对数据进行归一化处理,所述归一化处理为最大最小规范化,即:
[0025] ;
[0026] 式中: 为原映射区间 的一个取值, 为 的最大值,最小值为,新映射区间的最大值为 ,最小值为 , 为经过归一化
处理后的数值。
[0027] 进一步地,所述利用时间卷积注意力机制网络提取异常电池深层特征,包括如下步骤 :
[0028] 确定待采样数据空间,确定选定特征两个特殊值 和 ,预设 个充电循环、斜率阈值 ;
[0029] 注意力机制一次查询,设置 ,确定峰值 对应的采样时间点;
[0030] 注意力机制二次查询,设置 ,得到对应的 、 ,通过与 联合确定充电开始时刻

[0031] 形成该数据空间中所有的充电时间序列,将分散充电时间序列进行合并形成新的纯充
电时间序列 ;
[0032] 根据重新合并的充电时间序列,构成充电数据空间 ;
[0033] 使用 TCN时间卷积网络对数据空间 进行特征提取得到典型工况特征空间 。
[0034] 进一步地,所述改进深度聚类利用减法聚类对待分析模组内的所有电池单体进行簇划分,标号为 。
[0035] 进一步地,所述改进深度聚类进行聚类时,包括如下步骤:
[0036] 针对对所有数据点进行密度计算,第i个数据点的密度表达式如下:
[0037] ;
[0038] 其中 是欧式距离,表示第i个数据点与第k个数据点之间的静态距离, 为曲线间的弯曲距离,其表达式为 ,其中, 是常数, 表示某数
据点受其他数据点影响的范围, 越大,表示受影响的范围越大,聚类中心即为密度最大的数据点,用 表示;
[0039] 计算其他数据的聚类中心,以去除上一个点求得的中心为前提计算其余点的密度,计算公式如下:
[0040] ;
[0041] 其中 为第 个数据点的聚类中心, 为第 个数据点的聚类中心密度,参数的表达式为 ,其中 为设定参数,  ;
[0042] 利用公式进行约束,判断减法聚类是否结束,未结束则返回继续聚类,结束则进入下一步骤,判断公式如下:
[0043] ;
[0044] 其中 为常数, 的取值为 ,所有数据点的聚类中心求解完成后,对所有数据点进行类别划分,进而电池单元进行判别与归类。
[0045] 进一步地,所述离群点检测算法包括:
[0046] 将电池电压序列构成的数据空间记为 ,聚类形成的簇划分为 , 为簇内所有电池单体之间
的均距, 两个簇中心的距离,计算公式如下:
[0047] ;
[0048] ;
[0049] 其中,簇内的电池单体电压曲线越接近, 越小。簇与簇之间距离越远,分离度越高, 越大;
[0050] 利用戴维森堡丁指数来衡量簇内紧凑程度和簇与簇之间的分离程度,具体公式如下:
[0051] ;
[0052] 设定阈值DBI0,将所得的各DBIa数据与其进行对比,若DBIa
[0053] 对所确定的离群点进行一一删除,再计算离群集合中的所有元素一一被删除后的数据空间的二次聚类质量,识别检测对聚类质量影响最大的元素,二次聚类质量数值最小的即判定为异常电池单元。
[0054] 本发明还包括一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述的方法。
[0055] 本发明还包括一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的方法。
[0056] 本发明的有益效果为:本发明与已有技术相比,具有如下效果:
[0057] 1、本发明引入典型工况序列概念,针对海量高维数据空间,存放经过特征降维压缩后的数据空间,该方法大大减少数据存储空间,加快计算速度。
[0058] 2、本发明引入注意力机制和时间卷积网络,该方法通过注意力机制可以识别充放电序列,并且对相应数据进行特征提取,该方法具有较高的数据识别精确度、并且减少了特征数据的损失,体现了时间卷积注意力机制网络的优越性。
[0059] 3、本发明利用牛顿拉夫逊法对大规模电池运行数据进行数据清洗,主要包括对噪声数据的识别删除、对缺失数据的插值补齐,该方法提高了数据的准确度和精确度。
[0060] 4、本发明提出一种删除机制,将其和基于深度聚类的离群点检测方法结合,选用基于距离和密度两种离群点检测方法,该方法解决了低波动性、非等维空间条件下,电池不一致性和故障状态评估的难题。

附图说明

[0061] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0062] 图1为实施例1中方法的流程图;
[0063] 图2为实施例2中方法的流程图;
[0064] 图3为实施例2中基于TCAN的典型工况提取算法流程图;
[0065] 图4为实施例2中基于删除机制的善妒聚类离群点检测算法流程图;
[0066] 图5为某储能电站电池充放电曲线图;
[0067] 图6为储能电站某一天电压曲线经归一化后的数据;
[0068] 图7为提取的各簇电池充电序列数据;
[0069] 图8为各簇电池模组电压特征提取结果;
[0070] 图9为电站内18簇电池模组DBI指数曲线图;
[0071] 图10为计算机设备的示意图。

具体实施方式

[0072] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
[0073] 实施例1:
[0074] 如图1所示:一种大规模储能电站异常电池识别方法,包括如下步骤:
[0075] 收集大规模储能电站的电池数据,对其中存在的噪声数据进行识别和删除,利用牛顿插值法对缺失数据进行补齐处理;
[0076] 利用时间卷积注意力机制网络提取异常电池深层特征,并引入典型工况序列,用于存放降维后的所有充电段特征数据;
[0077] 基于电池充电段特征,将删除机制和深度聚类算法相结合,利用改进深度聚类的离群点检测算法识别大规模储能电站中的异常电池。
[0078] 本发明中,针对大规模储能电站中海量的高维数据空间,存放经特征降维压缩后的数据空间,从而大大减少数据存储空间,加快计算速度;通过注意力机制可以识别充放电序列,并且对相应数据进行特征提取,具有较高的数据识别精确性,减少了特征数据的损失;通过对存在的噪声数据进行识别和删除,对缺失数据进行插值补齐,提高了数据的准确度和精确性;通过将删除机制与深度聚类的离群点检测方法进行结合,解决了低波动性、非等维空间条件下,电池不一致性和故障状态评估的难题。
[0079] 在本实施例中,对其中存在的噪声数据进行识别和删除包括:
[0080] 若电池数据中某个属性在若干时间段内超出设定阈值,则删除该时间段的该属性数据;
[0081] 其中,设定阈值根据电池种类及电池的属性种类进行设置。
[0082] 当电池某属性超出了设定阈值时,则说明该时间段内的该属性数据为噪声,将该噪声删除后,可以提高数据的准确性。
[0083] 其中,利用牛顿插值法对缺失数据进行补齐处理包括:
[0084] 识别时间序列矩阵E中所有的缺失数据,时间序列矩阵E为:
[0085] ;
[0086] 其中,电池数据电流记作I、电压记作V、温度记作T和时间观测点记作t;
[0087] 通过牛顿插值函数补齐缺失数据处的缺失值,牛顿插值函数为:
[0088] ;
[0089] 其中, 为 阶差商,定义如下:
[0090]  。
[0091] 在本实施例中,对缺失数据进行补齐处理后,还包括:
[0092] 对数据进行归一化处理,归一化处理为最大最小规范化,即:
[0093] ;
[0094] 式中: 为原映射区间 的一个取值, 为 的最大值,最小值为 ,新映射区间的最大值为 ,最小值为 , 为经过归一
化处理后的数值。
[0095] 通过对数据进行最大最小规范化的归一化处理,可以将数据进行一致,为后续的评估判断提供便利。
[0096] 在本实施例中,利用时间卷积注意力机制网络提取异常电池深层特征,包括如下步骤 :
[0097] 确定待采样数据空间,确定选定特征两个特殊值 和 ,预设 个充电循环、斜率阈值 ;
[0098] 注意力机制一次查询,设置 ,确定峰值 对应的采样时间点;
[0099] 注意力机制二次查询,设置 ,得到对应的 、 ,通过与 联合确定充电开始时刻

[0100] 形成该数据空间中所有的充电时间序列,将分散充电时间序列进行合并形成新
的纯充电时间序列 ;
[0101] 根据重新合并的充电时间序列,构成充电数据空间 ;
[0102] 使用 TCN时间卷积网络对数据空间 进行特征提取得到典型工况特征空间 。
[0103] 其中,改进深度聚类利用减法聚类对待分析模组内的所有电池单体进行簇划分,标号为 。
[0104] 作为上述实施例的优选,改进深度聚类进行聚类时,包括如下步骤:
[0105] 针对对所有数据点进行密度计算,第i个数据点的密度表达式如下:
[0106] ;
[0107] 其中 是欧式距离,表示第i个数据点与第k个数据点之间的静态距离,为曲线间的弯曲距离,其表达式为 ,其中, 是常数, 表示某数据
点受其他数据点影响的范围, 越大,表示受影响的范围越大,聚类中心即为密度最大的数据点,用 表示;
[0108] 计算其他数据的聚类中心,以去除上一个点求得的中心为前提计算其余点的密度,计算公式如下:
[0109] ;
[0110] 其中 为第 个数据点的聚类中心, 为第 个数据点的聚类中心密度,参数的表达式为 ,其中 为设定参数,  ;
[0111] 利用公式进行约束,判断减法聚类是否结束,未结束则返回继续聚类,结束则进入下一步骤,判断公式如下:
[0112] ;
[0113] 其中 为常数, 的取值为 ,所有数据点的聚类中心求解完成后,对所有数据点进行类别划分,进而电池单元进行判别与归类。
[0114] 在本实施例中,离群点检测算法包括:
[0115] 将电池电压序列构成的数据空间记为 ,聚类形成的簇划分为 , 为簇内所有电池单体之间
的均距, 两个簇中心的距离,计算公式如下:
[0116] ;
[0117] ;
[0118] 其中,簇内的电池单体电压曲线越接近, 越小。簇与簇之间距离越远,分离度越高, 越大;
[0119] 利用戴维森堡丁指数来衡量簇内紧凑程度和簇与簇之间的分离程度,具体公式如下:
[0120] ;
[0121] 设定阈值DBI0,将所得的各DBIa数据与其进行对比,若DBIa
[0122] 对所确定的离群点进行一一删除,再计算离群集合中的所有元素一一被删除后的数据空间的二次聚类质量,识别检测对聚类质量影响最大的元素,二次聚类质量数值最小的即判定为异常电池单元。
[0123] 基于电池充电段特征,将删除机制和深度聚类算法相结合,利用改进深度聚类的离群点检测算法识别大规模储能电站中的异常电池。引入本方法将老化程度严重或者存在严重质量问题的电池筛选出来,主要是通过比较属性方向上相似度的变化趋势,由于电池具有循环工作特性,以及在电池组中大部分属性都具有强关联性,因此主要是通过在相似的属性中寻找异常变化。
[0124] 实施例2:
[0125] 如图2至图4所示,在本实施例中,包括如下步骤:
[0126] 步骤1:图5为某站电池充放电曲线图,针对该大规模储能电站电池数据,对其海量数据进行数据清洗,即对存在噪声数据进行识别和删除,具体步骤如下:
[0127] 1.1 删除存在大量错误的数据的电池簇数据值元组;
[0128] 1.2 识别时间序列矩阵 中所有的缺失数据,其中,电池系统采集的数据电流记作、电压记作、温度记作和时间观测点记作,并通过牛顿插值法补齐该处缺失值。牛顿插值函数如下:
[0129]
[0130] 其中 为 阶差商,定义如下:
[0131]  ;
[0132] 1.3根据规则识别并且删除噪声值。规则由人为设定,根据电池种类不同设定不同的阈值,具体方法为若某个属性在时间 处违反规则,则删除此处的噪声数据,作为上一步中的缺失值处理:
[0133] 1.4归一化处理的方式为最大最小规范化,即:
[0134]
[0135] 式中: 为 的一个取值, 为 的最大值,最小值为 ,新映射区间的最大值为 ,最小值为 。
[0136] 图6即是大规模储能电站某一天归一化处理后的电压曲线,从图中可以了解到每一天有两个充电区间,两个放电区间。
[0137] 步骤2:利用时间卷积注意力机制网络提取异常电池深层特征,并引入典型工况序列概念,用以存放降维后的所有充电段特征数据,图3为基于时间卷积注意力机制网络TCAN的典型工况提取算法流程图,具体步骤如下:
[0138] 2.1确定待采样数据空间 ,确定选定特征两个特殊值 和 ,预设 个充电循环、斜率阈值 ;
[0139] 2.2注意力机制一次查询,设置 ,确定峰值 对应的采样时间点;
[0140] 2.3注意力机制二次查询,设置,得到对应的 、
,通过与 联合确定充电开始时刻 ;
[0141] 2.4形成该数据空间 中所有的充电时间序列,将分散充电时间序列进行
合并形成新的纯充电时间序列 ;
[0142] 2.5根据重新合并的充电时间序列,构成充电数据空间 ;
[0143] 根据本例使用的某市储能电站电池管理系统提供的数据发现,并非每一天、每个电池簇的充电段数据都是等长的,因此充电段数据提取之后,将为充电数据维度扩展统一的300维度的充电电压序列,如图7所示,可以方便后续特征提取形成典型工况序列。
[0144] 2.6使用 TCN时间卷积网络对数据空间 进行特征提取得到典型工况特征空间 。提取了各时段的充电电压序列之后需要考虑如何将这些数据压缩进每一个典型工况序列中,本发明使用一维TCN时间卷积网络对充电电压序列进行特征提取,设置输出维度为25,神经元失活率为0.5,学习率为0.005,空洞步长 ,残差块个数取6,卷积核大小为
5,迭代次数为200次,各簇模组的特征提取结果见下图8所示。
[0145] 步骤3:基于电池充电段特征,将删除机制和深度聚类算法相结合,利用改进深度聚类的离群点检测算法识别大规模储能电站中的异常电池。引入本方法将老化程度严重或者存在严重质量问题的电池筛选出来,主要是通过比较属性方向上相似度的变化趋势,由于电池具有循环工作特性,以及在电池组中大部分属性都具有强关联性,因此主要是通过在相似的属性中寻找异常变化。步骤3具体包括的利用减法聚类对待分析模组内的所有电池单体进行簇划分,标号为 以及基于离群点检测故障两个子步骤,具体如下:
[0146] 3.1基于删除机制下深度聚类算法进行聚类的步骤如下:
[0147] 3.11 针对所有数据点进行密度计算,第i个数据点的密度表达式如下:
[0148]
[0149] 其中 是欧式距离,表示第i个数据点与第k个数据点之间的静态距离, 为曲线间的弯曲距离,其表达式为 ,其中, 是常数,取值过程通常为人
为设置。  表示某数据点受其他数据点影响的范围,  越大,表示受影响的范围越大。
聚类中心即为密度最大的数据点,用 表示。
[0150] 3.12 计算其他数据的聚类中心,以去除上一个点求得的中心为前提计算其余点的密度,计算公式如下:
[0151]
[0152] 其中 为第 个数据点的聚类中心, 为第 个数据点的聚类中心密度。参数的表达式为 ,其中 为设定参数,一般情况下,

[0153] 3.13 利用公式进行约束,判断减法聚类是否结束,未结束则返回继续聚类,结束则进入下一步骤,判断公式如下:
[0154]
[0155] 其中 为常数, 的取值为 。所有数据点的聚类中心求解完成后,对所有数据点进行类别划分,进而电池单元进行判别与归类。
[0156] 3.2 对基于离群点检测故障的具体步骤如下:
[0157] 3.21 将电池电压序列构成的数据空间记为 ,聚类形成的簇划分为 , 为簇内所有电池单体之间的均距,
两个簇中心的距离,计算公式如下:
[0158]
[0159]
[0160] 其中,簇内的电池单体电压曲线越接近, 越小。簇与簇之间距离越远,分离度越高, 越大。
[0161] 3.22 利用戴维森堡丁指数(Davies Bouldin Index,DBI)来衡量簇内紧凑程度和簇与簇之间的分离程度,具体公式如下:
[0162]
[0163] 本例选取某市大规模储能电站的18簇电池模组进行一致性评估,采样数据跨度九个月,每个月选取两个时间点,表1为该储能电站18簇电池模组聚类质量计算结果。
[0164] 表1储能电站18簇电池模组聚类质量计算结果
[0165]
[0166] 图9为储能电站内18簇电池模组DBI指数曲线图。可直观地观察到9月30日之前电池模组表现出较好的一致性,而到了第10个采样时刻,也就是九月底,电池模组之间的不一致性发生了显著的变化,开始存在质量变差的电池模组,或是电池模组的老化开始逐渐显现出来,并且不一致的程度越演越重,直至1月10日左右,甚至可以将所有电池簇聚为三类。
[0167] 3.23 设定阈值DBI0,将步骤3.22所得的各DBIa数据与其进行对比,若DBIa
[0168] 设定聚类质量阈值 ,其原因是,投入使用的储能电站在使用之前为了保障其使用的周期、寿命以及稳定性,电池组都是经过试验的,无论是模组与模组之间,还是模组中的电池单元与电池单元之间均表现出良好的一致性,此时聚类质量应为1。可以发现图8中14和15对应的采样时间,12月20日和1月10日的聚类质量 ,说
明出现了故障电池。
[0169] 3.24 对步骤3.23所确定的离群点进行一一删除,再计算离群集合中的所有元素一一被删除后的数据空间的二次聚类质量,识别检测对聚类质量影响最大的元素。二次聚类质量数值最小的即判定为异常电池单元。
[0170] 对12月20日的电池模组状态进行分析,根据12月20日的电压特征曲线聚类,可以发现模组4、模组5、模组9、模组10、模组17、模组18聚为一簇,为离群簇,根据上述的分析,故障电池在离群簇中,表2 为12月20日逐一删除离群模组的聚类质量计算结果。
[0171] 表2  12月20日逐一删除离群模组的聚类质量计算结果
[0172]
[0173] 表2是对于12月20日逐一删除离群模组的聚类质量计算结果,可得知,模组4、5、9、10、18的二次聚类质量均未达到阈值2,说明故障模组还未排除,而当删除离群簇中的模组
17时,二次聚类质量 ,说明17号电池模组为故障电池模组。又由1月10日的聚
类结果可知,第17号电池模组为单独的离群单元,从而印证了模组17为故障模组,表明本发明采用的算法对于实际情况具有可行性。
[0174] 请参见图10示出的本申请实施例提供的计算机设备的结构示意图。本申请实施例提供的一种计算机设备400,包括:处理器410和存储器420,存储器420存储有处理器410可执行的计算机程序,计算机程序被处理器410执行时执行如上的方法。
[0175] 本申请实施例还提供了一种存储介质430,该存储介质430上存储有计算机程序,该计算机程序被处理器410运行时执行如上的方法。
[0176] 其中,存储介质430可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read‑Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red‑Only Memory,简称PROM),只读存储器(Read‑Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
[0177] 在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0178] 在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0179] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0180] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0181] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0182] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0183] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0184] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。