一种用于建筑能耗混合模型的输入变量获取方法和系统转让专利

申请号 : CN202210815273.6

文献号 : CN114880959B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周克楠陈斐然招婉媚朱迪何德卫戚建平梁永权郭子科

申请人 : 广东电网有限责任公司佛山供电局

摘要 :

本发明提供了一种用于建筑能耗混合模型的输入变量获取方法和系统,其中本发明的方法包括将初始变量划分为负荷相关变量和机电相关变量;对初始变量进行抽样并进行能耗模拟,分析初始变量对输出变量的影响,然后分别针对两种相关变量进行关键变量的提取;并当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。本发明综合考虑了建筑负荷和机电系统的相关变量,使得输入变量的特征更为丰富,同时可以在缺少历史数据的情况下仍可以进行关键变量的提取与关键变量缺失值的推测。

权利要求 :

1.一种用于建筑能耗混合模型的输入变量获取方法,其特征在于,包括:将初始变量划分为负荷相关变量和机电相关变量并进行抽样;

根据所述初始变量的抽样值进行能耗模拟,分析所述初始变量对输出变量的影响,针对所述负荷相关变量和所述机电相关变量,分别采用敏感性分析方法和嵌入法从所述初始变量中进行关键变量的提取;

当初始数据集缺少历史能耗数据时,对实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的所述关联规则,从所述初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据,所述实际建筑数据集为根据自身历史能耗数据补全关键变量后的数据集。

2.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,针对所述负荷相关变量,采用敏感性分析方法从所述初始变量中进行关键变量的提取,具体包括:确定初始变量及其取值范围;

在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;

根据所述初始变量值的集合生成能耗模拟工具的输入,利用所述能耗模拟工具进行模拟计算,得到能耗值;

将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取所述关键变量时,需对应所述Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取所述关键变量时,对应所述拉丁超立方方法抽样得到的初始变量集合。

3.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,针对所述机电相关变量,采用嵌入法从所述初始变量中进行关键变量的提取,具体包括:确定初始变量及其取值范围;

在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;

利用能耗模拟工具建立输入变量和输出变量之间的对应关系;

采用XGBoost算法对所述机电相关变量中的关键变量进行提取。

4.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:根据连续型关键变量的取值范围进行等距离的离散化;

对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;

针对连续型关键变量,若所述缺失关键变量和所述已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;

针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。

5.根据权利要求1所述的用于建筑能耗混合模型的输入变量获取方法,其特征在于,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;

确定待推测的关键变量及其取值范围;

初始化待推测关键变量补全输入参数,并利用所述能耗模拟值预测模型模拟得到逐时的能耗模拟值;

根据历史能耗的颗粒度进行模拟数据颗粒度的转换;

计算实际数据和所述模拟数据之间的误差,将所述误差作为遗传算法的目标函数进行迭代计算,直至所述目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。

6.一种用于建筑能耗混合模型的输入变量获取系统,其特征在于,包括:抽样单元,用于将初始变量划分为负荷相关变量和机电相关变量并进行抽样;

关键变量确定单元,用于根据所述初始变量的抽样值进行能耗模拟,分析所述初始变量对输出变量的影响,针对所述负荷相关变量和所述机电相关变量,分别采用敏感性分析方法和嵌入法从所述初始变量中进行关键变量的提取;

关键变量获取单元,用于当初始数据集缺少历史能耗数据时,对实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的所述关联规则,从所述初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据,所述实际建筑数据集为根据自身历史能耗数据补全关键变量后的数据集。

7.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量确定单元中,针对所述负荷相关变量,采用敏感性分析方法从所述初始变量中进行关键变量的提取,具体包括:确定初始变量及其取值范围;

在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;

根据所述初始变量值的集合生成能耗模拟工具的输入,利用所述能耗模拟工具进行模拟计算,得到能耗值;

将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取所述关键变量时,需对应所述Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取所述关键变量时,对应所述拉丁超立方方法抽样得到的初始变量集合。

8.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量确定单元中,针对所述机电相关变量,采用嵌入法从所述初始变量中进行关键变量的提取,具体包括:确定初始变量及其取值范围;

在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;

利用能耗模拟工具建立输入变量和输出变量之间的对应关系;

采用XGBoost算法对所述机电相关变量中的关键变量进行提取。

9.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量获取单元中,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:根据连续型关键变量的取值范围进行等距离的离散化;

对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;

针对连续型关键变量,若所述缺失关键变量和所述已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;

针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。

10.根据权利要求6所述的用于建筑能耗混合模型的输入变量获取系统,其特征在于,在所述关键变量获取单元中,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;

确定待推测的关键变量及其取值范围;

初始化待推测关键变量补全输入参数,并利用所述能耗模拟值预测模型模拟得到逐时的能耗模拟值;

根据历史能耗的颗粒度进行模拟数据颗粒度的转换;

计算实际数据和所述模拟数据之间的误差,将所述误差作为遗传算法的目标函数进行迭代计算,直至所述目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。

说明书 :

一种用于建筑能耗混合模型的输入变量获取方法和系统

技术领域

[0001] 本发明属于建筑能耗预测技术领域,具体涉及一种用于建筑能耗混合模型的输入变量获取方法和系统。

背景技术

[0002] 能耗模型中较少的输入变量无法全面的反映对能耗的影响,过多的输入变量又会导致模型计算时间过长且将增加过拟合的风险。从理论上来讲,所有能耗模型需要输入的变量都与能耗有着或多或少的影响,但输入变量的增加往往会导致数据驱动模型所需的计算量急剧增长,所有的相关变量均作为数据驱动模型的输入势必会造成“维度灾难”。各输入变量对能耗的影响并不是相同的,将对能耗有显著影响的变量作为输入可使模型在可接受的计算量内实现较为准确的能耗预测。
[0003] 现有采用过滤法、标准回归系数法和偏回归系数法进行输入变量提取方法往往对线性模型有着很好的作用,但对能耗模型这种非线性模型而言效果并不太理想,同时目前现有的输入变量提取方法往往要依赖大量的历史相关数据,缺少历史相关数据时往往无法得到对应结果或者结果误差较大。

发明内容

[0004] 有鉴于此,本发明旨在解决现有的输入变量提取方法对能耗模型的提取不理想且在缺少历史相关数据时无法得到对应结果或者结果误差较大的问题。
[0005] 为了解决上述技术问题,本发明提供以下技术方案:
[0006] 第一方面,本发明提供了一种用于建筑能耗混合模型的输入变量获取方法,包括:
[0007] 将初始变量划分为负荷相关变量和机电相关变量并进行抽样;
[0008] 根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取;
[0009] 当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
[0010] 进一步地,针对负荷相关变量,采用敏感性分析方法从初始变量中进行关键变量的提取,具体包括:
[0011] 确定初始变量及其取值范围;
[0012] 在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
[0013] 根据初始变量值的集合生成能耗模拟工具的输入,利用能耗模拟工具进行模拟计算,得到能耗值;
[0014] 将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方方法抽样得到的初始变量集合。
[0015] 进一步地,针对机电相关变量,采用嵌入法从初始变量中进行关键变量的提取,具体包括:
[0016] 确定初始变量及其取值范围;
[0017] 在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
[0018] 利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
[0019] 采用XGBoost算法对机电相关变量中的关键变量进行提取。
[0020] 进一步地,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
[0021] 根据连续型关键变量的取值范围进行等距离的离散化;
[0022] 对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
[0023] 针对连续型关键变量,若缺失关键变量和已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
[0024] 针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
[0025] 进一步地,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
[0026] 利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
[0027] 确定待推测的关键变量及其取值范围;
[0028] 初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型模拟得到逐时的能耗模拟值;
[0029] 根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
[0030] 计算实际数据和模拟数据之间的误差,将误差作为遗传算法的目标函数进行迭代计算,直至目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
[0031] 第二方面,本发明提供了一种用于建筑能耗混合模型的输入变量获取系统,包括:
[0032] 抽样单元,用于将初始变量划分为负荷相关变量和机电相关变量并进行抽样;
[0033] 关键变量确定单元,用于根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取;
[0034] 关键变量获取单元,用于当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
[0035] 进一步地,在关键变量确定单元中,针对负荷相关变量,采用敏感性分析方法从初始变量中进行关键变量的提取,具体包括:
[0036] 确定初始变量及其取值范围;
[0037] 在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
[0038] 根据初始变量值的集合生成能耗模拟工具的输入,利用能耗模拟工具进行模拟计算,得到能耗值;
[0039] 将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方方法抽样得到的初始变量集合。
[0040] 进一步地,在关键变量确定单元中,针对机电相关变量,采用嵌入法从初始变量中进行关键变量的提取,具体包括:
[0041] 确定初始变量及其取值范围;
[0042] 在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
[0043] 利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
[0044] 采用XGBoost算法对机电相关变量中的关键变量进行提取。
[0045] 进一步地,在关键变量获取单元中,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
[0046] 根据连续型关键变量的取值范围进行等距离的离散化;
[0047] 对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
[0048] 针对连续型关键变量,若缺失关键变量和已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
[0049] 针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
[0050] 进一步地,在关键变量获取单元中,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
[0051] 利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
[0052] 确定待推测的关键变量及其取值范围;
[0053] 初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型模拟得到逐时的能耗模拟值;
[0054] 根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
[0055] 计算实际数据和模拟数据之间的误差,将误差作为遗传算法的目标函数进行迭代计算,直至目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
[0056] 综上,本发明提供了一种用于建筑能耗混合模型的输入变量获取方法和系统,其中本发明的方法包括将初始变量划分为负荷相关变量和机电相关变量;对初始变量进行抽样并进行能耗模拟,分析初始变量对输出变量的影响,然后分别针对负荷相关和机电相关变量进行关键变量的提取;并当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。本发明综合考虑了建筑负荷和机电系统的相关变量,使得输入变量的特征更为丰富,同时可以在缺少历史数据的情况下仍可以进行关键变量的提取与关键变量缺失值的推测。

附图说明

[0057] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0058] 图1为本发明实施例提供的一种用于建筑能耗混合模型的输入变量获取方法的流程示意图;
[0059] 图2为本发明实施例提供的关键变量提取的流程示意图;
[0060] 图3为本发明实施例提供的基于遗传算法的关键变量推测的流程示意图。

具体实施方式

[0061] 为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0062] 能耗模型中较少的输入变量无法全面的反映对能耗的影响,过多的输入变量又会导致模型计算时间过长且将增加过拟合的风险。从理论上来讲,所有能耗模型需要输入的变量都与能耗有着或多或少的影响,但输入变量的增加往往会导致数据驱动模型所需的计算量急剧增长,所有的相关变量均作为数据驱动模型的输入势必会造成“维度灾难”。各输入变量对能耗的影响并不是相同的,将对能耗有显著影响的变量作为输入可使模型在可接受的计算量内实现较为准确的能耗预测。
[0063] 现有关键变量提取方法有过滤法和敏感性分析法。其中过滤法(filter)利用方差、卡方检验、皮尔森相关系数等方法去除掉包含信息较少或相关性较高的特征。敏感性分析方法包括 Morris 法,标准回归系数法(SRC)和偏回归系数法(PCC)等。
[0064] 对于现有提取方法用过滤法(filter)、标准回归系数法(SRC)和偏回归系数法(PCC)进行输入变量提取往往对线性模型有着很好的作用,但对能耗模型这种非线性模型而言效果并不太理想;现有能耗模型提取的特征仍不够丰富,鲜少涉及建筑物理相关参数;目前现有的输入变量提取方法往往要依赖大量的历史相关数据,缺少历史相关数据时往往无法得到对应结果或者结果误差较大。
[0065] 基于此,本发明提供了一种用于建筑能耗混合模型的输入变量获取方法和系统。
[0066] 以下对本发明的一种用于建筑能耗混合模型的输入变量获取方法的实施例进行详细的介绍。
[0067] 请参阅图1,本实施例提供一种用于建筑能耗混合模型的输入变量获取方法,包括:
[0068] S100:将初始变量划分为负荷相关变量和机电相关变量并进行抽样。
[0069] S200:根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取。
[0070] 如图2所示,图2是关键变量的提取流程。由于初始变量过多将会导致所需算例过多,且负荷相关变量和机电相关变量对能耗的影响不完全相同,故将初始变量分为建筑负荷相关变量和机电相关变量两类。其次,根据初始变量的抽样值,利用 python 语言和其eppy库程序化地生成能耗模拟工具EnergyPlus所需的IDF文件,并调用EnergyPlus进行能耗模拟,得到制冷能耗和制热能耗。然后,分析初始变量对输出变量的影响。对于建筑负荷相关变量,采用敏感性分析方法从初始变量中提取出建筑负荷相关的关键变量,对于机电系统相关变量,由于这部分变量对能耗的影响并不仅限于峰值,对于这部分变量采用嵌入法进行关键变量的提取。以下对两部分相关变量的关键变量提取进行分别介绍。
[0071] (1)负荷部分关键变量
[0072] 1)确定初始变量及其取值范围;
[0073] 2)在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
[0074] 3)根据初始变量集合批量生成EnergyPlus的输入——IDF文件,再调用EnergyPlus进行模拟计算,得到对应的“因变量”——能耗值;
[0075] 4)将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用Morris、标准秩回归系数法(SRRC)和偏秩回归系数法(PRCC)方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方抽样得到的初始变量集合。
[0076] (2)机电系统部分关键变量
[0077] 1)进行确定初始变量及其取值范围;
[0078] 2)进行初始变量的抽样:利用拉丁超立方抽样法对连续型变量进行抽样、对离散型变量进行排列组合;
[0079] 3)批量生成算例:同样利用python语言和其eppy库进行模型的批量建立,采用EnergyPlus作为模拟引擎建立输入变量与输出的对应关系。将负荷部分变量固定为规范或手册中的推荐值,将初始变量根据采样值设置到模型中;
[0080] 4)提取关键变量:采用XGBoost算法对于机电系统部分的关键变量进行提取。
[0081] S300:当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
[0082] 在本实施例中,具体涉及两种场景下关键变量缺失值的推测。
[0083] 第一种场景为存在历史能耗数据时的关键变量缺失值推测,已知的历史数据可能是逐时、逐日或者逐月值。在这种场景下将采用遗传算法进行缺失值的推测,将误差最小的模拟数据对应的关键变量值作为最佳关键变量推测值。
[0084] 第二种场景为无历史能耗数据的关键变量缺失值推测,在这种场景下无法构建输入与输出之间的关系,将利用关联规则挖掘关键变量之间的联系,从而进行关键变量缺失值的推测。以下为两种场景的具体推测过程。
[0085] (1)有历史能耗的关键变量推测‑基于遗传算法
[0086] 1)利用快速模拟工具(白箱模型)生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型:
[0087] a)用上述所提到的关键变量提取方法提取关键变量,将其作为灰箱模型的输入变量。
[0088] b)用上述提及的快速建模工具进行建模并得到能耗模拟结果作为灰箱模型的输出。
[0089] c)利用XGBoost 算法进行建模,得到能耗模拟值预测模型。
[0090] 2)确定待推测的关键变量及其取值范围。
[0091] 3)初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型快速得到逐时的能耗模拟值。
[0092] 4)根据历史能耗的颗粒度进行模拟数据颗粒度的转换,由于能耗模拟值预测模型的输出颗粒度为最细的逐时值,在进行颗粒度转换(颗粒度由细变粗)时仅需在指定时间内进行数据的加和。
[0093] 5)计算实际数据和模拟数据之间的误差CV_RMSE,将其作为遗传算法的目标函数。经过多次迭代,目标函数CV_RMSE会逐渐减小直至收敛,将收敛时的关键变量推测值视为最优的关键变量值,并将其作为最终的关键变量推测值。
[0094] 图3为基于遗传算法的关键变量推测流程。
[0095] (2)无历史能耗的关键变量推测‑‑基于关联规则
[0096] 采用根据历史能耗的数据补全关键变量后的数据集(实际建筑数据集),基于该数据集进行实际建筑中关键变量的关联规则挖掘,在应用时,无需历史能耗数据,直接利用该关联规则,通过已知的关键变量,进行缺失的关键变量值的推测。具体实现步骤如下:
[0097] 1)将连续变量离散化,由于基于 Apriori 的关联规则挖掘算法仅适用于离散型变量,故首先进行连续变量的离散化,根据连续型关键变量的取值范围进行等距离的离散化。
[0098] 2)基于上述的实际建筑数据集,进行各变量间关联规则的挖掘,设置最小支持度为0.4,最大的k值为4,进行2项、3项和4项频繁项集的挖掘。
[0099] 3)若缺失关键变量和已知关键变量之前存在关联关系,则根据关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限。
[0100] 4)进行推测的离散关键变量值的还原,取与该值最近的两个离散值作为该被推测值的上下限,并在该上下限区间内采用拉丁超立方抽样,得到被推测值的分布。若不存在关联关系则假设其在取值范围内均匀分布,并在该区间内进行拉丁超立方抽样,得到被推测值的分布。
[0101] 本实施例介绍的利用Apriori关联规则挖掘算法,基于已知关键变量进行缺失关键变量值的推测为不确定推测,得到的结果为在推测变量值所在的区间内的抽样结果。
[0102] 本实施例提供的一种用于建筑能耗混合模型的输入变量获取方法,包括将初始变量划分为负荷相关变量和机电相关变量;对初始变量进行抽样值进行能耗模拟,分析初始变量对输出变量的影响,然后分别针对负荷相关和机电相关变量进行关键变量的提取;并当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。本发明综合考虑了建筑负荷和机电系统的相关变量,使得输入变量的特征更为丰富,同时可以在缺少历史数据的情况下仍可以进行关键变量的提取与关键变量缺失值的推测。
[0103] 以上是对本发明的一种用于建筑能耗混合模型的输入变量获取方法的实施例进行的详细介绍,以下将对本发明的一种用于建筑能耗混合模型的输入变量获取系统的实施例进行详细的介绍。
[0104] 本实施例提供了一种用于建筑能耗混合模型的输入变量获取系统,包括抽样单元、关键变量确定单元和关键变量获取单元。
[0105] 在本实施例中,抽样单元用于将初始变量划分为负荷相关变量和机电相关变量并进行抽样。
[0106] 在本实施例中,关键变量确定单元用于根据初始变量的抽样值进行能耗模拟,分析初始变量对输出变量的影响,针对负荷相关变量和机电相关变量,分别采用敏感性分析方法和嵌入法从初始变量中进行关键变量的提取。
[0107] 具体的,在关键变量确定单元中,针对负荷相关变量,采用敏感性分析方法从初始变量中进行关键变量的提取,具体包括:
[0108] 确定初始变量及其取值范围;
[0109] 在取值范围内,用Morris方法和拉丁超立方方法分别对初始变量进行抽样,生成一系列初始变量值的集合;
[0110] 根据初始变量值的集合生成能耗模拟工具的输入,利用能耗模拟工具进行模拟计算,得到能耗值;
[0111] 将抽样得到的初始变量集合作为输入,能耗模拟值作为输出,分别用 Morris、标准秩回归系数法和偏秩回归系数法方法提取关键变量,其中用Morris方法提取关键变量时,需对应Morris方法抽样得到的初始变量集合作为输入,在使用其他方法提取关键变量时,对应拉丁超立方方法抽样得到的初始变量集合。
[0112] 在关键变量确定单元中,针对机电相关变量,采用嵌入法从初始变量中进行关键变量的提取,具体包括:
[0113] 确定初始变量及其取值范围;
[0114] 在取值范围内,利用拉丁超立方抽样法对初始连续型变量进行抽样、对初始离散型变量进行排列组合;
[0115] 利用能耗模拟工具建立输入变量和输出变量之间的对应关系;
[0116] 采用XGBoost算法对机电相关变量中的关键变量进行提取。
[0117] 在本实施例中,关键变量获取单元用于当初始数据集缺少历史能耗数据时,对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。
[0118] 具体的,在关键变量获取单元中,当初始数据集缺少历史能耗数据时,对缺失关键变量进行推测,具体包括:
[0119] 根据连续型关键变量的取值范围进行等距离的离散化;
[0120] 对根据历史能耗数据补全关键变量后的实际建筑数据集进行关键变量的关联规则挖掘;
[0121] 针对连续型关键变量,若缺失关键变量和已知关键变量之前存在关联关系,则根据已经存在的关联规则表进行缺失值的推测,若已知关键变量大于3项,则根据将已知变量进行2项及3项的排列组合,进行多次推测,然后取多次推测的最大值和最小值作为关键变量推测值的上下限;
[0122] 针对离散型关键变量,取与缺失的离散型关键变量值最近的两个离散值作为被推测值的上下限,并在上下限区间内采用拉丁超立方抽样,得到被推测值的分布。
[0123] 另外,在关键变量获取单元中,当初始数据集有历史能耗数据时,对缺失关键变量进行推测,还包括:
[0124] 利用能耗模拟工具生成的模拟数据将能耗模型灰箱化得到用于关键变量缺失值推测的能耗模拟值预测模型;
[0125] 确定待推测的关键变量及其取值范围;
[0126] 初始化待推测关键变量补全输入参数,并利用能耗模拟值预测模型模拟得到逐时的能耗模拟值;
[0127] 根据历史能耗的颗粒度进行模拟数据颗粒度的转换;
[0128] 计算实际数据和模拟数据之间的误差,将误差作为遗传算法的目标函数进行迭代计算,直至目标函数收敛,将收敛时的关键变量推测值作为最终的关键变量推测值。
[0129] 需要说明的是,本实施例提供的输入变量获取系统用于实现前述实施例提供的输入变量获取方法,各单元的具体设置均以完整实现该方法为准,在此不再赘述。
[0130] 以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。