一种配电设备环境状态数据智能采集处理方法转让专利

申请号 : CN202311567783.7

文献号 : CN117271987B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王珏昕王泽一石浩陈若飞王志鹏杨雪周建

申请人 : 国网吉林省电力有限公司长春供电公司

摘要 :

本发明涉及数据处理技术领域,具体涉及一种配电设备环境状态数据智能采集处理方法。本发明对环境状态时序数据均分获得时序数据段;在每个时序数据段与后一个时序数据段之间,通过数据波动的频率特征和数值特征获得初始相似数据段;在每个时序数据段与初始相似数据段之间,根据数据变化程度的相似性得到最终相似数据段;通过最终相似数据段的连续分布情况,获得环境状态时序数据中的划分区间;环境状态时序数据进行STL分解中,根据划分区间调整局部加权回归算法对应拟合窗口的大小,获得环境状态分量数据进行存储。本发明通过数据特征调整拟合窗口,使得存储的数据保存完整损失度(56)对比文件Qingzhen Zhang etal.“A method formeasuring similarity of time series basedon series decomposition and dynamic timewarping”《.Springer》.2022,第6448-6463页.

权利要求 :

1.一种配电设备环境状态数据智能采集处理方法,其特征在于,所述方法包括:获得配电设备运行中的环境状态时序数据;将环境状态时序数据均匀划分为至少两个时序数据段;

在每个时序数据段与后一个时序数据段之间,根据数据波动的频率特征和数值特征的相似程度,获得每个时序数据段的初始相似数据段;根据每个时序数据段与初始相似数据段之间的数据变化程度的相似性,获得每个时序数据段的最终相似数据段;根据所有时序数据段对应的最终相似数据段的连续分布情况,获得环境状态时序数据中的划分区间;

根据环境状态时序数据中的划分区间,调整环境状态时序数据在进行STL分解中的局部加权回归算法对应拟合窗口的大小,获得环境状态分量数据进行存储;

所述获得每个时序数据段的初始相似数据段,包括:

对于任意一个时序数据段,获得该时序数据段中的波动次数;将该时序数据段的波动次数与对应的时间长度的比值进行归一化处理,获得该时序数据段的频率特征;

计算该时序数据段中所有数据对应的数据值的平均值并进行归一化处理,获得该时序数据段的数值特征;

将该时序数据段的频率特征与数值特征加权求和,获得该时序数据段的相似评估指标;

当该时序数据段与后一个时序数据段对应的相似评估指标之间的差异小于或等于预设相似阈值时,将后一个时序数据段作为该时序数据段的初始相似数据段;预设相似阈值为正数;

所述获得每个时序数据段的最终相似数据段,包括:

对于任意一个存在初始相似数据段的时序数据段,将该时序数据段中所有数据的数据值的平均值,作为平均数据值;计算该时序数据段中每个数据的数据值与平均数据值之间的差异,获得数值偏差度;将该时序数据段中所有数值偏差度的累加值,作为该时序数据段的环境变化特征值;

在该时序数据段与初始相似数据段之间,将频率特征的差异和数值特征的差异的和值进行反比例归一化,获得相似权重;

将该时序数据段与初始相似数据段之间的环境变化特征值的差异进行负相关映射并归一化处理,获得变化相似性;

将该时序数据段与初始相似数据段之间的相似权重与变化相似性的乘积,作为该时序数据段的环境变化相似指标;当该时序数据段的环境变化相似指标大于或等于预设变化相似阈值时,将该时序数据段的初始相似数据段作为该时序数据段的最终相似数据段;预设变化相似阈值为正数;

所述获得环境状态时序数据中的划分区间,包括:

按照时序顺序遍历时序数据段,当时序数据段不存在最终相似数据段时,将对应的时序数据段作为一个划分区间;

当时序数据段存在最终相似数据段时,将对应的时序数据段和最终相似数据段作为一个初始区间,当初始区间中最后一个时序数据段满足更新条件时,更新初始区间;直至初始区间中最后一个时序数据段不满足更新条件,停止更新,将此时的初始区间作为一个划分区间;

当不存在未遍历的时序数据段时停止,获得环境状态时序数据中的所有划分区间;

所述当初始区间中最后一个时序数据段满足更新条件时,更新初始区间,包括:所述更新条件为:时序数据段存在最终相似数据段;

当初始区间中最后一个时序数据段存在最终相似数据段时,将最后一个时序数据段的最终相似数据段合并到初始区间中,获得更新后的初始区间。

2.根据权利要求1所述一种配电设备环境状态数据智能采集处理方法,其特征在于,所述根据环境状态时序数据中的划分区间,调整环境状态时序数据在进行STL分解中的局部加权回归算法对应拟合窗口的大小,获得环境状态分量数据进行存储,包括:对于环境状态时序数据中的任意一个划分区间,将该划分区间对应的时间长度作为该划分区间的区间大小,将区间大小与预设调整权重的乘积,作为该划分区间对应时序信息上的调整窗口大小;预设权重为归一化的值;

在对环境状态时序数据进行STL分解中,采用局部加权回归算法进行平滑估计时,将时间信息对应的调整窗口大小作为拟合窗口的大小,获得趋势项分量、季节项分量和残差分量进行存储。

3.根据权利要求1所述一种配电设备环境状态数据智能采集处理方法,其特征在于,所述获得配电设备运行中的环境状态时序数据,包括:按照预设采样频率获得配电设备运行中的环境状态数据;以时间为横轴,以环境状态数据的数据值为纵轴,构建特征时序空间;

将所有环境状态数据映射到特征时序空间中,获得环境状态时序数据。

4.根据权利要求1所述一种配电设备环境状态数据智能采集处理方法,其特征在于,所述波动次数的获取方法包括:将所有环境状态时序数据进行曲线拟合,获得波动曲线;对于任意一个时序数据段,统计在该时序数据段对应的波动曲线上的极大值数量和极小值数量;

将极大值数量与极小值数量中的最小值作为该时序数据段的波动次数;若极大值数量与极小值数量相等,则将极小值数量作为该时序数据段的波动次数。

5.根据权利要求4所述一种配电设备环境状态数据智能采集处理方法,其特征在于,所述曲线拟合采用最小二乘法。

6.根据权利要求2所述一种配电设备环境状态数据智能采集处理方法,其特征在于,所述预设调整权重设置为0.8。

说明书 :

一种配电设备环境状态数据智能采集处理方法

技术领域

[0001] 本发明涉及数据处理技术领域,具体涉及一种配电设备环境状态数据智能采集处理方法。

背景技术

[0002] 采集配电设备环境状态数据对于确保配电设备的可靠性,安全性和高效性非常重要,通过采集环境状态数据,可以实时监测配电设备所处环境的多种参数条件,进而可以检测异常情况或潜在故障的预测,提供相应的预警和诊断能力。而由于环境数据的种类繁多且需要监测的时间长,因此合理地对采集数据处理存储成为了较为关注的问题之一。
[0003] 由于环境状态数据在时序上具有较强的周期特征,因此为了便于数据分析会选择时序分解进行处理,根据分解得到的数据分量进行存储,但在通过STL分解过程中,由于环境数据的波动变化不同,在采用相同拟合窗口的局部加权回归算法进行平滑估计后,数据分量的数据特征会产生偏差,拟合效果较差,导致数据损失程度较高,存储的采集数据的质量较差,采集处理方法可信度低。

发明内容

[0004] 为了解决现有技术中数据损失程度较高,存储的采集数据的质量较差,采集处理方法可信度低的技术问题,本发明的目的在于提供一种配电设备环境状态数据智能采集处理方法,所采用的技术方案具体如下:
[0005] 本发明提供了一种配电设备环境状态数据智能采集处理方法,所述方法包括:
[0006] 获得配电设备运行中的环境状态时序数据;将环境状态时序数据均匀划分为至少两个时序数据段;
[0007] 在每个时序数据段与后一个时序数据段之间,根据数据波动的频率特征和数值特征的相似程度,获得每个时序数据段的初始相似数据段;根据每个时序数据段与初始相似数据段之间的数据变化程度的相似性,获得每个时序数据段的最终相似数据段;根据所有时序数据段对应的最终相似数据段的连续分布情况,获得环境状态时序数据中的划分区间;
[0008] 根据环境状态时序数据中的划分区间,调整环境状态时序数据在进行STL分解中的局部加权回归算法对应拟合窗口的大小,获得环境状态分量数据进行存储。
[0009] 进一步地,所述获得每个时序数据段的初始相似数据段,包括:
[0010] 对于任意一个时序数据段,获得该时序数据段中的波动次数;将该时序数据段的波动次数与对应的时间长度的比值进行归一化处理,获得该时序数据段的频率特征;
[0011] 计算该时序数据段中所有数据对应的数据值的平均值并进行归一化处理,获得该时序数据段的数值特征;
[0012] 将该时序数据段的频率特征与数值特征加权求和,获得该时序数据段的相似评估指标;
[0013] 当该时序数据段与后一个时序数据段对应的相似评估指标之间的差异小于或等于预设相似阈值时,将后一个时序数据段作为该时序数据段的初始相似数据段;预设相似阈值为正数。
[0014] 进一步地,所述获得每个时序数据段的最终相似数据段,包括:
[0015] 对于任意一个存在初始相似数据段的时序数据段,将该时序数据段中所有数据的数据值的平均值,作为平均数据值;计算该时序数据段中每个数据的数据值与平均数据值之间的差异,获得数值偏差度;将该时序数据段中所有数值偏差度的累加值,作为该时序数据段的环境变化特征值;
[0016] 在该时序数据段与初始相似数据段之间,将频率特征的差异和数值特征的差异的和值进行反比例归一化,获得相似权重;
[0017] 将该时序数据段与初始相似数据段之间的环境变化特征值的差异进行负相关映射并归一化处理,获得变化相似性;
[0018] 将该时序数据段与初始相似数据段之间的相似权重与变化相似性的乘积,作为该时序数据段的环境变化相似指标;当该时序数据段的环境变化相似指标大于或等于预设变化相似阈值时,将该时序数据段的初始相似数据段作为该时序数据段的最终相似数据段;预设变化相似阈值为正数。
[0019] 进一步地,所述获得环境状态时序数据中的划分区间,包括:
[0020] 按照时序顺序遍历时序数据段,当时序数据段不存在最终相似数据段时,将对应的时序数据段作为一个划分区间;
[0021] 当时序数据段存在最终相似数据段时,将对应的时序数据段和最终相似数据段作为一个初始区间,当初始区间中最后一个时序数据段满足更新条件时,更新初始区间;直至初始区间中最后一个时序数据段不满足更新条件,停止更新,将此时的初始区间作为一个划分区间;
[0022] 当不存在未遍历的时序数据段时停止,获得环境状态时序数据中的所有划分区间。
[0023] 进一步地,所述当初始区间中最后一个时序数据段满足更新条件时,更新初始区间,包括:
[0024] 所述更新条件为:时序数据段存在最终相似数据段;
[0025] 当初始区间中最后一个时序数据段存在最终相似数据段时,将最后一个时序数据段的最终相似数据段合并到初始区间中,获得更新后的初始区间。
[0026] 进一步地,所述根据环境状态时序数据中的划分区间,调整环境状态时序数据在进行STL分解中的局部加权回归算法对应拟合窗口的大小,获得环境状态分量数据进行存储,包括:
[0027] 对于环境状态时序数据中的任意一个划分区间,将该划分区间对应的时间长度作为该划分区间的区间大小,将区间大小与预设调整权重的乘积,作为该划分区间对应时序信息上的调整窗口大小;预设权重为归一化的值;
[0028] 在对环境状态时序数据进行STL分解中,采用局部加权回归算法进行平滑估计时,将时间信息对应的调整窗口大小作为拟合窗口的大小,获得趋势项分量、季节项分量和残差分量进行存储。
[0029] 进一步地,所述获得配电设备运行中的环境状态时序数据,包括:
[0030] 按照预设采样频率获得配电设备运行中的环境状态数据;以时间为横轴,以环境状态数据的数据值为纵轴,构建特征时序空间;
[0031] 将所有环境状态数据映射到特征时序空间中,获得环境状态时序数据。
[0032] 进一步地,所述波动次数的获取方法包括:
[0033] 将所有环境状态时序数据进行曲线拟合,获得波动曲线;对于任意一个时序数据段,统计在该时序数据段对应的波动曲线上的极大值数量和极小值数量;
[0034] 将极大值数量与极小值数量中的最小值作为该时序数据段的波动次数;若极大值数量与极小值数量相等,则将极小值数量作为该时序数据段的波动次数。
[0035] 进一步地,所述曲线拟合采用最小二乘法。
[0036] 进一步地,所述预设调整权重设置为0.8。
[0037] 本发明具有如下有益效果:
[0038] 本发明考虑到环境状态随时间变化具有不同的数据变化特征,对环境状态时序数据进行分段分析,获得时序数据段,在每个时序数据段与后一个时序数据段之间分析数据变化的相似性,通过数据波动的频率特征和数值特征表征每个时序数据段的数据变化特征,对相似数据变化的时序数据段进行初步判断,进一步对每个时序数据段与初始相似数据段之间分析,考虑到数据变化程度也具有一定影响将初始相似数据进一步筛选,得到每个时序数据段的最终相似数据段。最终相似数据段可以表征数据变化特征的连续性,因此通过最终相似数据段的连续分布情况,对所有时序数据段重新进行划分,获得环境状态时序数据中的划分区间,并最终根据划分区间调整STL分解中的局部加权回归算法对应拟合窗口的大小,使得最终对环境状态时序数据在进行STL分解获得环境状态分量数据进行存储,本发明通过数据特征调整拟合窗口,使得存储的数据保存完整损失度低,存储的采集数据质量更优,得到数据特征表征更准确,使采集处理方法可信度高。

附图说明

[0039] 为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0040] 图1为本发明一个实施例所提供的一种配电设备环境状态数据智能采集处理方法流程图。

具体实施方式

[0041] 为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种配电设备环境状态数据智能采集处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0042] 除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0043] 下面结合附图具体的说明本发明所提供的一种配电设备环境状态数据智能采集处理方法的具体方案。
[0044] 请参阅图1,其示出了本发明一个实施例提供的一种配电设备环境状态数据智能采集处理方法流程图,该方法包括:
[0045] S1:获得配电设备运行中的环境状态时序数据;将环境状态时序数据均匀划分为至少两个时序数据段。
[0046] 在配电设备运行过程中可能受到温度、湿度和粉尘等多重环境因素的影响,使得配电设备中的电流产生振动,并导致配电设备在不同时间段用电量大小不同,影响设备的使用寿命。因此通过环境状态数据结合配电设备的振动特征,能够帮助优化配电设备的能耗,制定维护计划和采取对应的保养措施,提高设备的可用性并延长设备的寿命。因此需要对配电设备的环境状态数据进行采集,对于环境状态数据的数据量是海量的,且通常在采集时会对数据进行合理的压缩存储,在本发明实施例中,为了保留数据特征且减少压缩空间,采用STL分解进行分解压缩存储。
[0047] 首先获得配电设备运行中的环境状态时序数据,优选地,按照预设采样频率获得配电设备运行中的环境状态数据,在本发明实施例中,预设采样频率设置为3秒/次,为了更好的通过环境状态对配电设备运行情况进行分析,采样的总时长设置为一天,即环境状态数据为配电设备运行一天的数据,具体数值实施者可根据具体实施环境进行调整。
[0048] 由于环境状态数据会随着时间变化产生一定的周期变化,在本发明一个实施例中,以时间为横轴,以环境状态数据的数据值为纵轴,构建特征时序空间,将所有环境状态数据映射到特征时序空间中,获得环境状态时序数据,为了能够反映环境状态时序数据的变化特征,一般使用STL(Seasonal‑Trend decomposition procedures based on Loess)分解法对环境状态时序数据进行分解,STL分解法是一种可以把时间序列分解为趋势项、季节项和残差项的方法,STL分解法包含一系列局部加权回归平滑器,计算速度比较快,可以应对非常大的时间序列数据。
[0049] 在STL分解过程中,需要采用通过局部加权回归(Locally weighted regression,Loess)算法进行平滑估计,而Loess算法中的拟合窗口的大小选择不同,Loess算法的拟合效果也不同。当选择较大的Loess拟合窗口,使局部加权回归模型更关注邻近点的权重,从而减小离散点和异常点的影响,得到更平滑的分量数据,但窗口过大会导致局部的数据短期波动信息丢失,导致分解结果产生较大的偏差。当选择较小的Loess拟合窗口,可以更准确的表现出时序数据的短期波动特征,但对异常离群值非常敏感且无法较为客观的反映整体数据的变化特征。因此为了环境状态时序数据的数据特征能够更完整的存储,根据环境状态时序数据的数据变化特征进行拟合窗口的自适应调整。需要说明的是,STL分解过程和局部加权回归算法为本领域技术人员熟知的技术手段,在此不做赘述。
[0050] 由于环境状态时序数据在不同的时间段上的数据波动变化不同,需要不同的拟合窗口,因此将环境状态时序数据均匀划分为至少两个时序数据段,通过时序数据段之间的相似差异情况进行分析。在本发明实施例中,将时间长度为一小时的环境状态时序数据作为一个时序数据段,时序数据段对应的时间长度是小于环境状态时序数据的,通过两个以上的时序数据段分析数据变化的一致性特征。
[0051] S2:在每个时序数据段与后一个时序数据段之间,根据数据波动的频率特征和数值特征的相似程度,获得每个时序数据段的初始相似数据段;根据每个时序数据段与初始相似数据段之间的数据变化程度的相似性,获得每个时序数据段的最终相似数据段;根据所有时序数据段对应的最终相似数据段的连续分布情况,获得环境状态时序数据中的划分区间。
[0052] 在时间序列上,分析数据波动变化的相似性特征,对具有相同变化特征的数据采用相同且适合的拟合窗口大小进行拟合。首先考虑到数据波动向后的延续性,在每个时序数据段与后一个时序数据段之间进行分析,通过数据波动的频率特征和数值特征表征每个时序数据段的数据变化情况,通过这两个特征的相似程度,得到每个时序数据段的初始相似数据。
[0053] 优选地,对于任意一个时序数据段,获得该时序数据段中的波动次数,波动次数能够反映数据的波动变化速率,当波动次数越多,说明数据变化越迅速,在本发明实施例中,将所有环境状态时序数据采用最小二乘法进行曲线拟合,获得波动曲线,通过波动曲线可以更清晰地反映数据的波动变化极值情况,以便后续根据极值得到更准确的波动次数。
[0054] 对于任意一个时序数据段,统计在该时序数据段对应的波动曲线上的极大值数量和极小值数量,将极大值数量与极小值数量中的最小值作为该时序数据段的波动次数,若极大值数量与极小值数量相等,则将极小值数量作为该时序数据段的波动次数。通过极值的数量反映数据发生波动的次数,在本发明其他实施例中,也可通过波动曲线与数据值的平均值的相交情况得到波动次数,在此不做限制。将该时序数据段的波动次数与对应的时间长度的比值进行归一化处理,获得该时序数据段的频率特征。
[0055] 计算该时序数据段中所有数据对应的数据值的平均值并进行归一化处理,获得该时序数据段的数值特征,数值特征反映了该时序数据段中所有数据值的整体变化大小。结合频率特征和数值特征,将该时序数据段的频率特征与数值特征加权求和,获得该时序数据段的相似评估指标,在本发明实施例中,相似评估指标的具体表达式为:
[0056]
[0057] 式中, 表示为第 个时序数据段的相似评估指标, 表示为第 个时序数据段的波动次数,表示为时序数据段的时间长度, 表示为第 个时序数据段中数据的总数量,表示为第 个数据的数据值, 和 表示为预设加权权重,在本发明实施例中, 设置为0.6, 设置为0.4,具体数值实施者根据具体实施情况进行调整。 表示为归一化函数,需要说明的是,归一化为本领域技术人员熟知的技术手段,归一化函数的选择可以为线性归一化或标准归一化等,具体的归一化方法在此不做限定。
[0058] 其中, 表示为第 个时序数据段的频率特征,  表示为第 个时序数据段的数值特征,结合数据的波动频率和数据的数据值波动获得相似评估指标,通过相似评估指标表征时序数据段中数据的变化特征。
[0059] 进一步通过相似评估指标对时序数据段的变化相似进行初步判断,当该时序数据段与后一个时序数据段对应的相似评估指标之间的差异小于或等于预设相似阈值时,说明后一个时序数据段与该时序数据段的数据变化特征较为相似,数据变化还未发生改变,将后一个时序数据段作为该时序数据段的初始相似数据段,在本发明实施例中,预设相似阈值为正数,预设相似阈值设置为0.2,具体数值实施者可根据具体实施情况进行调整。
[0060] 在完成初步判断后,由于在分析数据变化情况时仅用了数据值的平均值情况,使得存在部分相邻的时序数据段数据平均值较为相似,但是波动程度并不相同,因此通过波动程度进一步对相似数据段进行筛选。根据每个时序数据段与初始相似数据段之间的数据变化程度的相似性,获得每个时序数据段的最终相似数据段。
[0061] 优选地,对于任意一个存在初始相似数据段的时序数据段,将该时序数据段中所有数据的数据值的平均值,作为平均数据值,计算该时序数据段中每个数据的数据值与平均数据值之间的差异,获得数值偏差度,通过数值偏差度可以反映每个数据与平均数据值的偏差情况,将该时序数据段中所有数值偏差度的累加值,作为该时序数据段的环境变化特征值,通过环境变化特征值,能够反映该时序数据段中数据的变化程度情况,当环境变化特征值越大,说明数据的波动程度越强,数据值的变化程度越大。在本发明实施例中,环境变化特征值的表达式为:
[0062]
[0063] 式中, 表示为第 个时序数据段的环境变化特征值, 表示为第 个时序数据段中数据的总数量, 表示为第 个数据的数据值, 表示为第 个数据的数据值, 表示为绝对值提取函数, 表示为以自然常数为底的指数函数。
[0064] 在该时序数据段与初始相似数据段之间,将频率特征的差异和数值特征的差异的和值进行反比例归一化,获得相似权重,当特征之间的差异越小,则需要关注环境变化特征值之间的差异越多。将该时序数据段与初始相似数据段之间的环境变化特征值的差异进行负相关映射并归一化处理,获得变化相似性,通过变化相似性反映两个时序数据段中的数据变化程度之间的差异情况。在本发明实施例中,差异的计算方法均为差值绝对值。
[0065] 将该时序数据段与初始相似数据段之间的相似权重与变化相似性的乘积,作为该时序数据段的环境变化相似指标,通过环境变化相似指标通过数据变化程度的差异进一步对相似性进行判断。
[0066] 当该时序数据段的环境变化相似指标大于或等于预设变化相似阈值时,说明该时序数据段与对应的初始相似数据段在数据变化程度上也是相似的,将该时序数据段的初始相似数据段作为该时序数据段的最终相似数据段。在本发明实施例中,预设变化相似阈值为正数,预设变化相似阈值设置为0.8,具体数值实施者可根据具体实施情况进行调整。
[0067] 通过每个时序数据段的最终相似数据段,可以表征每个时序数据段中数据变化的相似情况,对于存在相似的时序数据段可以选择相同的拟合窗口大小,且相似的时序数据段可能是连续分布的,因此进一步根据所有时序数据段对应的最终相似数据段的连续分布情况,获得环境状态时序数据中的划分区间。
[0068] 优选地,按照时序顺序遍历时序数据段,即从第一个时序数据段开始进行划分区间的选择,当时序数据段不存在最终相似数据段时,说明此时的数据变化可能较为复杂,数据拟合也需要较小的拟合窗口进行分析,将对应的时序数据段作为一个划分区间。
[0069] 当时序数据段存在最终相似数据段时,说明时序数据段中的数据变化是连续的,将对应的时序数据段和最终相似数据段作为一个初始区间,初始区间中的数据变化均为相似的,当初始区间中最后一个时序数据段满足更新条件时,更新初始区间,通过最后一个时序数据段中的数据变化是否为连续的情况,对初始区间不断扩展,在本发明一个实施例中,更新条件为:时序数据段存在最终相似数据段,即初始区间向后的数据变化具有连续相似性,扩展过程为,当初始区间中最后一个时序数据段存在最终相似数据段时,将最后一个时序数据段的最终相似数据段合并到初始区间中,获得更新后的初始区间。
[0070] 直至初始区间中最后一个时序数据段不满足更新条件,初始区间中的数据变化不具有连续相似的时序数据段了,停止更新,将此时的初始区间作为一个划分区间。当不存在未遍历的时序数据段时停止,即所有的时序数据段均进行了划分区间的分配,获得环境状态时序数据中的所有划分区间。
[0071] 至此,将环境状态时序数据划分为多个划分区间,每个划分区间对应一种数据变化特征,通过划分区间可以对拟合窗口进行调整。
[0072] S3:根据环境状态时序数据中的划分区间,调整环境状态时序数据在进行STL分解中的局部加权回归算法对应拟合窗口的大小,获得环境状态分量数据进行存储。
[0073] 对于环境状态时序数据中的任意一个划分区间,所有划分区间的分析方法均相同,将该划分区间对应的时间长度作为该划分区间的区间大小,将区间大小与预设调整权重的乘积,作为该划分区间对应时序信息上的调整窗口大小,通过划分区间的大小,将具有相同变化特征的较长的划分区间给予更大的拟合窗口,减小对偏离点和异常点的关注,在本发明实施例中,预设权重为归一化的值,预设权重设置为1,具体数值实施者可根据具体实施情况进行调整。
[0074] 在对环境状态时序数据进行STL分解中,采用局部加权回归算法进行平滑估计时,将时间信息对应的调整窗口大小作为拟合窗口的大小,获得趋势项分量、季节项分量和残差分量进行存储。在本发明实施例中,对趋势项分量、季节项分量和残差分量的压缩存储可采用不同的方案,对于趋势项,可以使用多项式拟合、曲线拟合或简化模型等方法表示来减少存储空间。对于季节项,可以使用LZW编码策略来压缩数据,对具有明显周期性的季节分量可以提高压缩存储效率。而对于此时的残差项,可采用算数编码等方法进行数据压缩存储,也可以选择去除残差项来进行数据压缩存储。
[0075] 最终实现对环境状态数据的采集存储。
[0076] 综上,本发明考虑到环境状态随时间变化具有不同的数据变化特征,对环境状态时序数据进行分段分析,获得时序数据段,在每个时序数据段与后一个时序数据段之间分析数据变化的相似性,通过数据波动的频率特征和数值特征表征每个时序数据段的数据变化特征,对相似数据变化的时序数据段进行初步判断,进一步对每个时序数据段与初始相似数据段之间分析,考虑到数据变化程度也具有一定影响将初始相似数据进一步筛选,得到每个时序数据段的最终相似数据段。最终相似数据段可以表征数据变化特征的连续性,因此通过最终相似数据段的连续分布情况,对所有时序数据段重新进行划分,获得环境状态时序数据中的划分区间,并最终根据划分区间调整STL分解中的局部加权回归算法对应拟合窗口的大小,使得最终对环境状态时序数据在进行STL分解获得环境状态分量数据进行存储,本发明通过数据特征调整拟合窗口,使得存储的数据保存完整损失度低,存储的采集数据质量更优,且采集处理方法可信度高,得到数据特征表征更准确。
[0077] 需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0078] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。