一种基于大数据的电池多故障智能分类识别方法转让专利

申请号 : CN202210683063.6

文献号 : CN114781551B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 魏中宝胡鉴何洪文

申请人 : 北京理工大学

摘要 :

本发明公开了一种基于大数据的电池多故障智能分类识别方法,包括以下步骤:S1.采集不同故障条件下电池的海量运行数据并上传大数据平台;S2.提取大数据平台中的原始数据并进行预处理;S3.建立并训练基于智能无监督学习算法的数据高阶特征提取模型;S4.建立并训练基于智能有监督学习算法的高阶特征多分类器;S5.实时采集电池运行数据,利用无监督学习算法提取实时数据的高阶特征,然后利用有监督学习算法进行特征分类,从而实现多种故障的实时诊断和分类。本发明结合基于无监督学习的特征提取方法和基于有监督学习的多分类器实现多种故障的诊断和分类,通过利用无监督学习算法可以提高多分类器的准确性和训练效率。

权利要求 :

1.一种基于大数据的电池多故障智能分类识别方法,其特征在于:包括以下步骤:S1.采集多种故障条件下电池海量运行数据,进行分类并上传云端大数据平台;

所述步骤S1中的多种故障条件包括常见的电池故障或安全隐患,即过充、过放、过热、均衡性异常、传感器故障;

S2.对云端大数据平台的电池运行数据进行预处理,通过随机采样和白化获取用于训练特征提取模型的原始数据集;

S3.基于无监督学习算法建立特征提取模型,建立原始数据与高阶特征之间的映射关系,构建基于无监督学习的模型参数优化问题,利用S2中获取的训练数据集训练特征提取模型,求解模型参数的最优解;基于训练完成的模型获取数据集的整体特征用于训练特征分类模型的特征数据集;

所述步骤S3包含以下子步骤:

S301.建立基于无监督学习的特征提取模型,训练无监督学习算法,优化权值在某种电池故障条件下,首先采集该条件下的海量电池运行数据,并通过随机采样将数据分成多个数据集,基于无监督学习算法建立特征提取模型,建立原始数据与高阶特征之间的映射关系,以提取出独特的、优质的高阶特征作为无监督学习目标,利用多个数据样本训练特征提取模型,采用粒子群优化、梯度下降法优化算法获得特征提取模型权值的最优解;

S302.提取海量数据的局部样本特征

通过等距采样将海量运行数据分为若干个样本作为特征提取模型的输入,利用训练完成的特征提取模型提取所有样本的高阶特征作为局部样本特征;

S303.提取海量数据整体特征

计算所有局部样本特征的平均值作为海量数据的整体特征,均值处理方法能够减小由噪声引起的随机特征;

S4.基于有监督学习算法建立特征多分类器,建立特征与故障种类间的映射关系,构建基于有监督学习的模型参数优化问题,利用S3提取的特征数据集及其故障标签训练特征多分类器;

所述步骤S4中的基于有监督学习的多分类器训练过程为:

(1)基于有监督学习算法建立特征多分类器,建立特征与故障种类间的映射关系;

(2)以最小化分类错误分类概率为有监督学习目标,构建优化问题;

(3)利用提取的海量数据整体特征及其故障标签训练多分类器,采用优化算法求解优化问题,获得多分类器权值的最优解;

S5.实时采集电池运行数据,结合训练完成的特征提取模型和特征多分类器,利用特征提取模型提取实时数据的高阶特征,然后利用特征多分类器计算多种故障的出现概率,从而实现多种故障的实时诊断和分类。

2.根据权利要求1所述的基于大数据的电池多故障智能分类识别方法,其特征在于:所述步骤S2中电池运行数据包括电压、电流、温度。

3.根据权利要求1所述的基于大数据的电池多故障智能分类识别方法,其特征在于:所述步骤S2中的数据预处理方法包括数据清洗、填充、归一化、白化。

4.根据权利要求1所述的基于大数据的电池多故障智能分类识别方法,其特征在于:所述步骤S3中的智能无监督学习算法包括稀疏滤波、主成分分析、k均值聚类。

5.根据权利要求1所述的基于大数据的电池多故障智能分类识别方法,其特征在于:所述步骤S4中的智能有监督学习算法包括SoftMax逻辑回归、支持向量机、相关向量机、k近邻分类器。

说明书 :

一种基于大数据的电池多故障智能分类识别方法

技术领域

[0001] 本发明涉及电池故障检测,特别是涉及一种基于大数据的电池多故障智能分类识别方法。

背景技术

[0002] 锂离子电池具有比能量、比功率高、循环寿命长等优点,但是其安全性仍有待提高,电池故障实时检测和风险预警能够有效提高电池的安全性。现有的基于电池模型的故障诊断方法已经研究得较为全面,但由于基于模型的方法极度依赖于电池模型的精度,而实际应用中电池模型的精度与复杂度互相冲突,因此这类方法在实际应用上存在挑战。基于规则的电池故障诊断方法能够快速地检测电池的过压、欠压故障,但其稳定性较差,难以用于存在强噪声的环境中。随着电池大数据的发展,如何有效利用大数据和人工智能算法进行电池故障检测和风险预警成为提高电池安全性的关键,基于电压大数据统计特性与预设阈值的诊断方法能够检测电池故障,但合理阈值的设定难度较大,而且通常需要用大量的实验和丰富的经验。

发明内容

[0003] 本发明的目的在于克服现有技术的不足,提出一种基于大数据的电池多故障智能分类识别方法。基于电池运行大数据,结合基于无监督学习的特征提取模型和基于有监督学习的多分类器进行电池多故障的诊断和分类。本发明提出的方法通过无监督学习算法提取原始数据的高阶特征,降低数据的复杂度,从而提高多分类器的准确性和训练效率。
[0004] 本发明的目的是通过以下技术方案来实现的:一种基于大数据的电池多故障智能分类识别方法,包括以下步骤:
[0005] S1.采集多种故障条件下电池海量运行数据,进行分类并上传云端大数据平台;
[0006] 所述步骤S1中的多种故障条件包括常见的电池故障或安全隐患,即过充、过放、过热、均衡性异常、传感器故障。
[0007] S2.对云端大数据平台的电池运行数据进行清洗、填充、归一化等预处理,通过随机采样和白化获取用于训练特征提取模型的原始数据集;
[0008] 所述步骤S2中电池运行数据包括电压、电流、温度。
[0009] 所述步骤S2中的数据预处理方法包括数据清洗、填充、归一化、白化。
[0010] S3.基于无监督学习算法建立特征提取模型,建立原始数据与高阶特征之间的映射关系,构建基于无监督学习的模型参数优化问题,利用S2中获取的训练数据集训练特征提取模型,求解模型参数的最优解。基于训练完成的模型获取数据集的整体特征用于训练特征分类模型的特征数据集;
[0011] 所述步骤S3中的智能无监督学习算法包括稀疏滤波、主成分分析、k均值聚类。
[0012] 所述步骤S3包含以下子步骤:
[0013] S301.建立基于无监督学习的特征提取模型,训练无监督学习算法,优化权值[0014] 在某种特定的电池故障条件下,首先采集该条件下的海量电池运行数据,并通过随机采样将数据分成多个数据集,基于无监督学习算法建立特征提取模型,建立原始数据与高阶特征之间的映射关系,以提取出独特的、优质的高阶特征作为无监督学习目标,利用多个数据样本训练特征提取模型,采用粒子群优化、梯度下降法等优化算法获得征提取模型权值的最优解;
[0015] S302.提取海量数据的局部样本特征
[0016] 通过等距采样将海量运行数据分为若干个样本作为特征提取模型的输入,利用训练完成的特征提取模型提取所有样本的高阶特征作为局部样本特征;
[0017] S303.提取海量数据整体特征
[0018] 计算所有局部样本特征的平均值作为海量数据的整体特征作为,均值处理方法能够减小由噪声引起的随机特征。
[0019] S4.基于有监督学习算法建立特征多分类器,建立特征与故障种类间的映射关系,构建基于有监督学习的模型参数优化问题,利用S3提取的特征数据集及其故障标签训练特征多分类器;
[0020] 所述步骤S4中的智能有监督学习算法包括SoftMax逻辑回归、支持向量机、相关向量机、k近邻分类器。
[0021] 所述步骤S4中的基于有监督学习的多分类器训练过程为:
[0022] (1)基于有监督学习算法建立特征多分类器,建立特征与故障种类间的映射关系;
[0023] (2)以最小化分类错误分类概率为有监督学习目标,构建优化问题;
[0024] (3)利用提取的海量数据整体特征及其故障标签训练多分类器,采用优化算法求解优化问题,获得多分类器权值的最优解。
[0025] S5.实时采集电池运行数据,结合训练完成的特征提取模型和特征多分类器,利用特征提取模型提取实时数据的高阶特征,然后利用有特征多分类器计算多种故障的出现概率,从而实现多种故障的实时诊断和分类。
[0026] 本发明能够有效利用多维传感器的具有不同量纲的测量信号,并且进行综合诊断;通过无监督学习算法自动获取各种故障隐含在多维运行数据中的高阶特征,训练完成后无需人为干涉,使用更加简便。
[0027] 本发明的有益效果是:本发明提出一种基于大数据的电池多故障智能分类识别方法,建立了基于无监督学习的特征提取模型和基于有监督学习的多分类器,利用电池运行大数据训练模型,进而根据实时数据实现电池多故障分类识别。所述方法能够检测常见的电池故障,相较于已有方法,本方法基于电池运行数据驱动,无需建立电池模型,克服实际应用时难以保证模型精度的问题,因此提高了实用性;能够综合利用电压、电流、温度等多维数据,提高了对数据的有效利用率;通过无监督学习算法自动获取各种故障隐含在多维运行数据中的高阶特征,无需人为干涉,实际应用更简便。

附图说明

[0028] 图1为本发明的方法流程图;
[0029] 图2为本发明的数据清洗流程图;
[0030] 图3为本发明的特征提取模型的训练流程图;
[0031] 图4为本发明的特征多分类器训练流程图。

具体实施方式

[0032] 下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
[0033] 如图1所示,一种基于大数据的电池多故障智能分类识别方法,包括以下步骤:
[0034] S1.采集多种故障条件下电池的海量运行数据,并上传云端大数据平台;
[0035] 多种故障条件包括过充、过放、过热、均衡性异常、传感器故障。
[0036] 海量运行数据包括端电压、负载电流、表面温度数据。
[0037] S2.如图2所示,对电池运行数据进行预处理。
[0038] 数据预处理方式包括数据清洗、填充、归一化、白化。
[0039] 数据清洗指删除海量运行数据中信噪比和利用价值较低的数据,如小电流充放电工况数据。
[0040] 数据填充指对海量运行数据中的缺失值进行填充,如以传感器最大或最小测量值替代超过传感器量程的缺失值。
[0041] 数据归一化将有量纲数据转化为无量纲数据,解决电压、电流、温度等不同量纲的数据间的可比性,具体的,本实施例采用z‑score归一化方法:
[0042]
[0043] 其中,x原始数据,x*代表归一化处理后的数据,μ和 分别代表原始数据的均值和方差。
[0044] 将数据随机采样为若干数据集用于训练基于无监督学习算法的特征提取模型。图3为本发明的特征提取模型的训练流程图。
[0045] 对数据集进行白化处理以降低各数据集间的相关性,提高训练的收敛速度。
[0046] 具体的,将数据随机采样为n个数据集,每个数据集包含m个数据点,所有训练数据集可以表示为n行m列的矩阵S,矩阵S每一行代表一个数据集。原始数据集的协方差矩阵的特征值分解可以表示为:
[0047]
[0048] 其中,cov(·)代表求协方差矩阵函数,E是由协方差矩阵的特征向量组成的正交矩阵,D是由协方差矩阵的特征值组成的对角矩阵,T代表矩阵转置。
[0049] 白化过程可以表示为:
[0050]
[0051] 其中,Swhite代表白化处理后的全部训练数据集。
[0052] S3具体包括以下子步骤:
[0053] S301..基于无监督学习算法建立特征提取模型,建立原始数据与高阶特征之间的映射关系,以提取出独特的、优质的高阶特征作为无监督学习目标,利用S2中白化处理后的数据集训练特征提取模型,图4为本发明的特征多分类器训练流程图。
[0054] 并采用粒子群优化、梯度下降法等优化算法获得征提取模型权值的最优解。
[0055] 无监督学习算法包括稀疏滤波、主成分分析、k均值聚类等,具体的,本实施例采用稀疏滤波建立特征提取模型。
[0056] 稀疏滤波提取高阶特征的标准为:1)种群稀疏、2)存在稀疏、3)高分散性。
[0057] 稀疏滤波的输入为原始数据集,输出为高阶特征,将高阶特征与原始数据间的映射关系建立为:
[0058]i
[0059] 其中,i代表第i个数据集,l代表第l个特征,x 代表第i个数据集的原始数据, 代表第i个数据集的第l个特征,Wl代表第l个特征对应的权重。为满足稀疏滤波特征提取标准,需构造如下优化问题以求权重矩阵W的最优解:
[0060]
[0061] 其中||·||1和||·||2分别代表矩阵1范数、2范数。
[0062] 利用粒子群优化算法求解上述优化问题,获得权重矩阵W的最优解,完成特征提取模型训练。
[0063] S302.提取海量数据的局部样本特征,通过等距采样将海量运行数据分为若干个数据集,利用训练完成的特征提取模型提取所有样本的高阶特征作为局部样本特征。
[0064] S303.提取海量数据整体特征,计算所有局部样本特征的平均值作为海量数据的整体特征。
[0065] S4具体包括以下子步骤:
[0066] S401.基于有监督学习算法建立特征多分类器,建立特征与故障种类间的映射关系,以最小化分类错误分类概率为有监督学习目标,利用S303提取的海量数据整体特征及其故障标签训练多分类器,采用粒子群优化、梯度下降法等优化算法获得多分类器权值的最优解。
[0067] S402. 有监督学习算法包括SoftMax逻辑回归、支持向量机、相关向量机等。具体的,本实施例采用SoftMax逻辑回归建立特征多分类器。
[0068] S403. SoftMax逻辑回归的输入为S303提取的海量数据整体特征x,输出为故障类型y= 1, 2, 3, …  , k(k代表故障种类总数)。对于数据集x,SoftMax逻辑回归通过估计x属于每一故障种类的概率,即p(y =α|x),其中α = 1, 2, 3, … , k。数学表达为:
[0069]
[0070] 其中,hθ代表整体特征与故障概率的映射函数,θ为映射函数的参数,即SoftMax多分类器的权值。通过构造如下优化问题求SoftMax多分类器权值的最优解:
[0071]
[0072] S5.结合S301建立并且训练的无监督学习特征提取模型和S403建立并且训练的有监督学习多分类器,利用实时采集的电池运行数据作为输入,输出故障类别的概率,实现多故障分类识别。
[0073] 综上,本发明提出一种基于大数据的电池多故障智能分类识别方法,建立了基于无监督学习的特征提取模型和基于有监督学习的多分类器,利用电池运行大数据训练模型,进而根据实时数据实现电池多故障分类识别。所述方法能够检测常见的电池故障,相较于已有方法,本方法基于电池大数据驱动,无需建立电池模型,克服实际应用时难以保证模型精度的问题,因此提高了实用性;并且无需认为设置阈值和规则,实际应用更简便。
[0074] 以上所述是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应该看作是对其他实施例的排除,而可用于其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。