一种适应园区电碳信息转换的保密容量保障系统及方法转让专利

申请号 : CN202210261820.0

文献号 : CN114501355B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 周振宇廖海君王雅倩卢文冰

申请人 : 华北电力大学

摘要 :

本发明公开了一种适应园区电碳信息转换的保密容量保障系统及方法,系统包括:端层、边层、业务层。所述端层通过在电气设备上部署多模态物联终端,实现数据采集。边层包括一个多模态边缘计算网关,网关通过多模态通信介质与电气设备进行交互,并通过专网将数据上传至业务层。业务层通过大数据分析和机器学习方法,实现数据深度解析,支撑低碳业务运行。方法包括:通过联合优化信道选择与功率分配策略,能够在设备侧队列稳定性约束下最大化保密容量、设备能耗和排队时延的加权差值,解决低碳业务与多模态通信资源适配与多模态接入冲突问题,保障低碳业务的多属性QoS需求。

权利要求 :

1.一种适应园区电碳信息转换的保密容量保障方法,其特征在于:所述保密容量保障方法是在保密容量保障系统的基础上实现的;

保密容量保障系统包括:端层、边层、业务层;

所述端层通过在电气设备上部署多模态物联终端,实现电压、电流、有功/无功、CO2、CH4、O3、水、气、热的数据采集;

边层包括一个多模态边缘计算网关,网关通过AC/DC PLC、WLAN、微功率无线通信的多模态通信介质与电气设备进行交互,并通过电信运营商的5G或电网公司的专网将数据上传至业务层;

业务层通过大数据分析和机器学习方法,实现数据深度解析,并以图表、数据报告的方式进行电力现货市场、碳足迹监测、柔性负荷调控、数据采集的可视化展示;

保密容量保障方法包括:针对系统通信性能和保密容量保障的模型构建;

所述针对系统通信性能和保密容量保障的模型构建包括:网络模型构建、设备侧数据队列构建和安全传输模型构建;

网络模型用于通过联合优化信道选择和功率分配,实现数据保密传输;然后基于边端协同消除设备间的接入冲突;

安全传输模型用保密容量来定义系统的安全性能,保密容量参数化了在不向攻击者泄露信息的情况下,能够可靠传递到网关的可达传输速率;

所述网络模型构建为:

适应园区电碳信息转换的保密容量保障系统包含I个设备和一个边缘计算网关,定义设备集合为U={u1,...,ui,...,uI};一共有J个多模态信道,包括J1个AC/DC PLC信道、J2个WLAN信道、J3个微功率无线信道,且满足J1+J2+J3=J;定义信道集合为C={c1,…,cj,…,cJ},其中cj,j=1,…,J1为AC/DC PLC信道,cj,j=J1+1,…,J1+J2为WLAN信道,cj,j=J1+J2+

1,…,J为微功率无线信道;将整个优化时间划分为T个时隙,用集合T={1,...,t,...,T}表示,其中每个时隙长度为τ;在每个时隙中,各电气设备采集一定的数据量Ai(t);

所述设备侧数据队列构建为:

ui采集的数据存储在本地缓冲区中,本地缓冲区建模为设备端数据队列Hi(t);队列积压被更新为Hi(t+1)=max{Hi(t)+Ai(t)‑Ui(t),0}     (1)其中,Ui(t)是第t个时隙的吞吐量;

所述安全传输模型构建为:

定义信道选择变量为xi,j(t)∈{0,1},其中xi,j(t)=1表示在第t个时隙ui选择cj,否则xi,j(t)=0;定义功率分配变量ρi(t)为数据传输功率与ui最大传输功率的比值,即AN传输功率 由(1‑ρi(t))Pi,j,max决定,将ρi(t)离散化为M级,即ρi(t)∈ρ={1/M,…,m/M,…,1};

在第t个时隙,ui选择的信道cj的信道容量和吞吐量分别表示为其中,Bj是cj的带宽; 为ui在cj上的信噪比(signal to interference plus noise ratio,SINR),表示为其中, 分别为信道增益、噪声功率与可再生能源投切带来的电磁噪声功率; 表示ui到网关之间的路径损失; 表示攻击者到网关之间的路径损失;Ni表示ui的天线数量; 为攻击者的干扰噪声功率;

ui在cj上的保密容量为

其中, 是攻击者的信道容量,表示为

其中, 是为攻击者在cj上的SINR,表示为

其中, 表示ui和攻击者之间的路径损耗。

2.根据权利要求1所述的一种适应园区电碳信息转换的保密容量保障方法,其特征在于:所述针对系统通信性能和保密容量保障的模型构建还包括:设备侧能耗模型构建和设备侧排队时延模型构建;

所述设备侧能耗模型为:

ui传输数据到网关的能耗表示为

因此,ui的总能耗计算为

所述设备侧排队时延模型为:

ui的排队时延定义为平均队列长度与平均数据到达率的比值,表示为其中, 是到第t个时隙的平均数据到达率,即

3.根据权利要求2所述的一种适应园区电碳信息转换的保密容量保障方法,其特征在于,还包括:针对信道选择与功率分配联合优化的电碳信息转换保密容量保障问题建模;

所述针对信道选择与功率分配联合优化的电碳信息转换保密容量保障问题建模包括:信道选择与功率分配的联合优化问题定义和优化问题转化;

信道选择与功率分配的联合优化问题定义为:

C E T

其中,Vi、Vi和Vi是保密容量、能耗和时延的非负权值;约束条件C1表示信道选择约束,在每个时隙每个设备只能选择一个信道;约束条件C2表示队列稳定性约束;

优化问题转化为:

基于Lyapunov优化将P1转化为一系列短期优化子问题;定义H(t)为第t个时隙的数据队列集合,定义一个漂移减奖励以实现在队列稳定性约束下,实现P1优化目标的最大化,表示为DMRV(H(t))=VΔL(H(t))‑E[η(t)|H(t)]   (13)其中,V是权衡队列稳定性和奖励最大化的权重;ΔL(H(t))是参数化队列波动的Lyapunov漂移,即Lyapunov函数L(H(t))在两个相邻时隙之间的条件期望差;L(H(t))定义为队列积压的二次和;η(t)为短期优化目标,表示为推导DMRV(H(t))的上界为

其中C(t)与η(t)不相关;

因此,将优化问题P1转化为在逐个时隙在约束C1下最小化DMRV(H(t))上界,即P2定义信道选择和功率分配变量的集合为Xi(t)={xi,1(t),…,xi,j(t),…,xi,J(t),ρi(t)};得ui解决的第i个子问题,表示为

4.根据权利要求3所述的一种适应园区电碳信息转换的保密容量保障方法,其特征在2

于:通过ACE (Adaptive learning‑based seCure Edge‑End collaboration for electric carbon information conversion)算法来求解P3;

P3被建模为一个马尔可夫决策过程(Markov decision process,MDP),其要素介绍如下:状态:状态空间Si(t)定义为设备侧队列积压、经验任务到达率、第(t‑1)个时隙的信道选择、功率分配策略和保密容量的函数,即动作:动作空间定义为优化问题P3的优化变量Xi(t);

奖励:将奖励定义为P3的优化目标,即Γ(Xi(t));

2

所述ACE的算法步骤如下:

1)设备侧动作绘制:每个ui∈U根据状态空间Si(t)和演员神经网络θi,绘制策略π(Si(t),Si(t)|θi),即其中,xi(t)是动作空间集合;然后,每个ui∈U绘制动作xi(t);此外,设备侧状态动作值Q(Si(t),xi(t)|ωi)是用评论家神经网络ωi得到的;

2)边侧协同:每个ui∈U传递xi(t)和Q(Si(t),xi(t)|ωi)到网关;如果多个设备选择一个相同的信道cj,网关将cj调度到具有最大Q(Si(t),xi(t)|ωi)的设备并拒绝其他的;其余的设备重复“设备‑网关”交互,直到每个信道被不超过一个设备选择或所有信道已被调度;

接下来,每个ui∈U执行xi(t)并计算奖励Γ(Xi(t));

3)设备侧学习率调整:采用(ψω,δω)和(ψl,δl)两种学习参数集合;基于WoLF机制,ui∈U在赢的时候学习得快,输的时候学习得慢,即满足δl>δω且ψl>ψω;因此,学习率表示为其中,当Ωi成立时,I{Ωi}=1;当策略的期望状态‑行为值π(Si(t),xi(t)|θi)大于时,Ωi表示ui∈U取胜,表示为其中, 为平均混合策略,更新为

其中, 表示折损因子;随后,每个ui∈U转移到下一状态Si(t+1),基于公式(1)更新Hi(t+1),获取Q(Si(t+1),xi(t+1)|ωi);

4)设备侧网络更新:定义时序差分(time difference,TD)误差为φi,表示为φi(t)=Γ(Xi(t))+γQ(Si(t+1),ωi)‑Q(Si(t),ωi)   (22)然后,基于梯度上升法,将θi和ωi更新为

说明书 :

一种适应园区电碳信息转换的保密容量保障系统及方法

技术领域

[0001] 本发明涉及园区电碳信息转换技术领域,特别涉及一种适应园区电碳信息转换的保密容量保障系统及方法。

背景技术

[0002] 智慧园区是融合屋顶光伏、分布式储能、可控负荷为一体的智能化产业园区,通过与电网的双向能量交互,可实现智慧园区能源业务低碳运行。为了支撑新能源消纳、实时能量管理、和电碳计算,海量分布式电力物联网(power internet of things,PIoT)设备部署于园区各处采集电压、电流、有功/无功、CO2、CH4、O3、水、气、热等信息。考虑到电力物联网设备接入和数据传输要求,以及智慧园区复杂网络拓扑,有必要构建融合交/直流(current/direct current,AC/DC)电力线通信(power line communication,PLC)、微功率无线通信、无线局域网(wireless local area network,WLAN)等多种通信媒介的多模态电力物联网,从而为园区提供全覆盖通信架构支撑。
[0003] 随着园区分布式光伏发电渗率升高,以及“隔墙售电”政策的深入实施,支撑园区低碳业务运行的电碳数据转换需求激增,同时,柔性负荷调控、全量数据采集等低碳业务不断发展,智慧园区内电碳信息的传输量暴增,无疑为园区电碳数据转换带来了信息安全问题。目前,广泛使用的基于区块链的智能合约技术虽从一定程度上提升了分布式能源并网的安全性,但是由于未考虑到园区不同通信媒介的频谱资源和信道特性之间的异构性,以及园区强电磁干扰问题,导致园区电碳数据转换易受到窃听攻击。例如分布式可再生能源投切对AC/DC PLC通信产生严重电磁干扰(electromagnetic interference,EMI),而微功率无线与WLAN通信易受窃听攻击。
[0004] 因此,如何从物理层角度保障电碳信息传输安全成为本发明研究的焦点。此外,柔性负荷调控等低碳业务运行以及电碳数据的实时传输与处理提出了时延、能耗、安全容量等多属性QoS需求。边端协同通过融合边侧智能的决策能力与端侧泛在数据感知能力提供了一种解决方案。利用边缘计算网关提供的数据处理结果和性能反馈,根据差异化的业务需求和通信介质的动态特性优化设备侧信道选择,实现多媒介异质资源的高效利用。此外,边端协同可以与先进的安全机制相结合来抵御攻击。例如基于合适的功率分配策略,通过分配传输功率给人工噪声(artificial noise,AN)来抑制窃听者的数据接收,提高保密容量以消除窃听攻击。然而,低碳智慧园区边端协同多模态通信安全还需要解决如下技术挑战。
[0005] 第一,通信与安全性能的协同提高受到设备有限资源限制。例如,为基于AN的防窃听分配更多的传输功率将不可避免地降低通信吞吐量和时延性能。因此,需要将有限的功率资源智能地分割成AN传输和数据传输,以平衡QoS和保密容量。
[0006] 第二,由于智慧园区基础设施分布范围广、资产属性复杂、地理特征差异大,获取智慧园区整体网络的全局状态信息(global state information,GSI)是不现实的。传统的基于GSI的资源管理方法会导致理论优化性能与实际应用存在较大偏差,无法支持碳足迹监测、负荷调控、电力现货市场等低碳业务的可靠运行。
[0007] 第三,海量物联设备竞争同一个信道时会产生接入冲突,造成时延升高、资源利用率降低。传统的分布式信道选择方案由于缺乏统一协同与优化,无法感知其他设备的接入行为,因此接入冲突无法消除。然而,集中式信道选择优化却存在维数灾难问题。
[0008] 因此,迫切需要设计一种适应园区电碳信息转换的保密容量保障系统及方法,通过联合优化信道选择与功率分配策略,能够在设备侧队列稳定性约束下最大化保密容量、设备能耗和排队时延的加权差值,解决低碳业务与多模态通信资源适配与多模态接入冲突问题,保障低碳业务的多属性QoS需求。

发明内容

[0009] 本发明针对现有技术的缺陷,提供了一种适应园区电碳信息转换的保密容量保障系统及方法。
[0010] 为了实现以上发明目的,本发明采取的技术方案如下:
[0011] 一种适应园区电碳信息转换的保密容量保障系统,其特征在于,包括:端层、边层、业务层;
[0012] 所述端层通过在电气设备上部署多模态物联终端,实现电压、电流、有功/无功、CO2、CH4、O3、水、气、热的数据采集;
[0013] 边层包括一个多模态边缘计算网关,网关通过AC/DC PLC、WLAN、微功率无线通信的多模态通信介质与电气设备进行交互,并通过电信运营商的5G或电网公司的专网将数据上传至业务层;
[0014] 业务层通过大数据分析和机器学习方法,实现数据深度解析,并以图表、数据报告的方式进行电力现货市场、碳足迹监测、柔性负荷调控、数据采集的可视化展示。
[0015] 本发明还公开了一种适应园区电碳信息转换的保密容量保障方法,包括:针对系统通信性能和保密容量保障的模型构建;
[0016] 所述针对系统通信性能和保密容量保障的模型构建包括:网络模型构建、设备侧数据队列模型构建和安全传输模型构建;
[0017] 所述网络模型构建为:
[0018] 适应园区电碳信息转换的保密容量保障系统包含I个设备和一个边缘计算网关,定义设备集合为U={u1,...,ui,...,uI};一共有J个多模态信道,包括J1个AC/DC PLC信道、J2个WLAN信道、J3个微功率无线信道,且满足J1+J2+J3=J;定义信道集合为C={c1,…,cj,…,cJ},其中cj,j=1,…,J1为AC/DC PLC信道,cj,j=J1+1,…,J1+J2为WLAN信道,cj,j=J1+J2+1,…,J为微功率无线信道;将整个优化时间划分为T个时隙,用集合T={1,...,t,...,T}表示,其中每个时隙长度为τ;在每个时隙中,各电气设备采集一定的数据量Ai(t),通过联合优化信道选择和功率分配,实现数据保密传输;然后基于边端协同消除设备间的接入冲突;
[0019] 所述设备侧数据队列模型构建为:
[0020] ui采集的数据存储在本地缓冲区中,本地缓冲区建模为设备端数据队列Hi(t);队列积压被更新为
[0021] Hi(t+1)=max{Hi(t)+Ai(t)‑Ui(t),0}  (1)
[0022] 其中,Ui(t)是第t个时隙的吞吐量;
[0023] 所述安全传输模型构建为:
[0024] 定义信道选择变量为xi,j(t)∈{0,1},其中xi,j(t)=1表示在第t个时隙ui选择cj,否则xi,j(t)=0;定义功率分配变量ρi(t)为数据传输功率与ui最大传输功率的比值,即AN传输功率 由(1‑ρi(t))Pi,j,max决定,将ρi(t)离散化为M级,即ρi(t)∈ρ={1/M,…,m/M,…,1};
[0025] 在第t个时隙,ui选择的信道cj的信道容量和吞吐量分别表示为
[0026]
[0027]
[0028] 其中,Bj是cj的带宽; 为ui在cj上的信噪比(signal to interference plus noise ratio,SINR),表示为
[0029]
[0030] 其中, 分别为信道增益、噪声功率与可再生能源投切带来的电磁噪声功率; 表示ui到网关之间的路径损失; 表示攻击者到网关之间的路径损失;Ni表示ui的天线数量; 为攻击者的干扰噪声功率;
[0031] 用保密容量来定义系统的安全性能,保密容量参数化了在不向攻击者泄露信息的情况下,能够可靠传递到网关的可达传输速率;ui在cj上的保密容量为
[0032]
[0033] 其中, 是攻击者的信道容量,表示为
[0034]
[0035] 其中, 是为攻击者在cj上的SINR,表示为
[0036]
[0037] 其中, 表示ui和攻击者之间的路径损耗。
[0038] 进一步地,所述针对系统通信性能和保密容量保障的模型构建还包括:设备侧能耗模型构建和设备侧排队时延模型构建;
[0039] 所述设备侧能耗模型为:
[0040] ui传输数据到网关的能耗表示为
[0041]
[0042] 因此,ui的总能耗计算为
[0043]
[0044] 所述设备侧排队时延模型为:
[0045] ui的排队时延定义为平均队列长度与平均数据到达率的比值,表示为
[0046]
[0047] 其中, 是到第t个时隙的平均数据到达率,即
[0048]
[0049] 进一步地,针对信道选择与功率分配联合优化的电碳信息转换保密容量保障问题建模;
[0050] 所述针对信道选择与功率分配联合优化的电碳信息转换保密容量保障问题建模包括:信道选择与功率分配的联合优化问题定义和优化问题转化;
[0051] 信道选择与功率分配的联合优化问题定义为:
[0052]
[0053] 其中,ViC、ViE和ViT是保密容量、能耗和时延的非负权值;约束条件C1表示信道选择约束,在每个时隙每个设备只能选择一个信道;约束条件C2表示队列稳定性约束;
[0054] 优化问题转化为:
[0055] 基于Lyapunov优化将P1转化为一系列短期优化子问题;定义H(t)为第t个时隙的数据队列集合,定义一个漂移减奖励以实现在队列稳定性约束下,实现P1优化目标的最大化,表示为
[0056] DMRV(H(t))=VΔL(H(t))‑E[η(t)|H(t)](13)
[0057] 其中,V是权衡队列稳定性和奖励最大化的权重;ΔL(H(t))是参数化队列波动的Lyapunov漂移,即Lyapunov函数L(H(t))在两个相邻时隙之间的条件期望差;L(H(t))定义为队列积压的二次和;η(t)为短期优化目标,表示为
[0058]
[0059] 推导DMRV(H(t))的上界为
[0060]
[0061] 其中C(t)与η(t)不相关;
[0062] 因此,将优化问题P1转化为在逐个时隙在约束C1下最小化DMRV(H(t))上界,即P2[0063]
[0064] 定义信道选择和功率分配变量的集合为Xi(t)={xi,1(t),…,xi,j(t),…,xi,J(t),ρi(t)};得ui解决的第i个子问题,表示为
[0065]
[0066] 但由于缺乏集中协同,当多个设备同时选择同一信道时,由于各设备各自优化,会导致接入冲突。
[0067] 进一步地,通过ACE2(Adaptive  learning‑based  seCure  Edge‑End collaboration for electric carbon information conversion)算法来求解P3;
[0068] P3被建模为一个马尔可夫决策过程(Markov decision process,MDP),其基本要素介绍如下:
[0069] 状态:状态空间Si(t)定义为设备侧队列积压、经验任务到达率、第(t‑1)个时隙的信道选择、功率分配策略和保密容量的函数,即
[0070] 动作:动作空间定义为优化问题P3的优化变量Xi(t);
[0071] 奖励:将奖励定义为P3的优化目标,即Γ(Xi(t));
[0072] 所述ACE2的算法步骤如下:
[0073] 1)设备侧动作绘制:每个ui∈U根据状态空间Si(t)和演员神经网络θi,绘制策略π(Si(t),Si(t)|θi),即
[0074]
[0075] 其中,xi(t)是动作空间集合;然后,每个ui∈U绘制动作xi(t);此外,设备侧状态动作值Q(Si(t),xi(t)|ωi)是用评论家神经网络ωi得到的;
[0076] 2)边侧协同:每个ui∈U传递xi(t)和Q(Si(t),xi(t)|ωi)到网关;如果多个设备选择一个相同的信道cj,网关将cj调度到具有最大Q(Si(t),xi(t)|ωi)的设备并拒绝其他的;其余的设备重复“设备‑网关”交互,直到每个信道被不超过一个设备选择或所有信道已被调度;接下来,每个ui∈U执行xi(t)并计算奖励Γ(Xi(t));
[0077] 3)设备侧学习率调整:采用(ψω,δω)和(ψl,δl)两种学习参数集合;基于WoLF机制,ui∈U应该在赢的时候学习得更快,输的时候学习得更慢,即满足δl>δω且ψl>ψω;因此,学习率表示为
[0078]
[0079] 其中,当Ωi成立时,I{Ωi}=1;当策略的期望状态‑行为值π(Si(t),xi(t)|θi)大于时,Ωi表示ui∈U取胜,表示为
[0080]
[0081] 其中, 为平均混合策略,更新为
[0082]
[0083] 其中, 表示折损因子;随后,每个ui∈U转移到下一状态Si(t+1),基于(1)更新Qi(t+1),获取Q(Si(t+1),xi(t+1)|ωi);
[0084] 4)设备侧网络更新:定义时序差分(time difference,TD)误差为φi,表示为[0085] φi(t)=Γ(Xi(t))+γQ(Si(t+1),ωi)‑Q(Si(t),ωi)(22)
[0086] 然后,基于梯度上升法,将θi和ωi更新为
[0087]
[0088]
[0089] 与现有技术相比,本发明的优点在于:
[0090] 通过联合优化信道选择与功率分配策略,能够在设备侧队列稳定性约束下最大化保密容量、设备能耗和排队时延的加权差值,解决低碳业务与多模态通信资源适配与多模态接入冲突问题,保障低碳业务的多属性QoS需求。
[0091] ACE2进行了功率分配优化,当数据传输被窃听时,ACE2增加AN的传输功率,提高数据传输的安全性。本发明提高了保密容量。通过切换到非窃听信道,对多模态信道选择的额外考虑提高了保密容量。

附图说明

[0092] 图1是本发明实施例适应园区电碳信息转换的保密容量保障系统的结构示意图;
[0093] 图2是本发明实施例ACE2算法结构示意图;
[0094] 图3是本发明实施例ACE2算法流程图;
[0095] 图4是本发明实施例保密容量随时隙变化示意图;
[0096] 图5是本发明实施例不同业务类型下的排队时延和保密容量示意图。

具体实施方式

[0097] 为使本发明的目的、技术方案及优点更加清楚明白,以下根据附图并列举实施例,对本发明做进一步详细说明。
[0098] 如图1所示,适应园区电碳信息转换的保密容量保障系统从下至上可分为端层、边层、业务层。其中,端层通过在分布式光伏、可控负荷、充电桩等电气设备上部署多模态物联终端,实现电压、电流、有功/无功、CO2、CH4、O3、水、气、热等数据的采集,支持电碳信息转换等智慧园区低碳运行业务。边层包含一个多模态边缘计算网关,网关通过AC/DC PLC、WLAN、微功率无线通信等多模态通信介质与设备进行交互,并通过电信运营商的5G或电网公司的专网将数据上传至业务层。业务层通过大数据分析和机器学习等方法,实现数据深度解析,并以图表、数据报告等方式进行电力现货市场、碳足迹监测、柔性负荷调控、数据采集等智慧园区低碳运行业务可视化展示。多模通信介质的异质性主要表现在信道质量、能耗和保密性等方面。一方面,分布式可再生能源投切导致AC/DC PLC信道存在严重的电磁干扰。另一方面,WLAN传输速率最高,微功率无线通信能耗最小。此外,与AC/DC PLC相比,WLAN和微功率无线信道更易受窃听攻击,即攻击者通过主动发送噪声干扰设备与网关之间的数据传输,实现主动窃听攻击。适应园区电碳信息转换的保密容量保障系统采用最优信道分配和功率分配策略,通过为设备分配最适配信道,保障低碳业务差异化QoS性能,并通过为设备分配AN传输功率,在合法信道的零空间中传输AN,避免主动窃听攻击,实现窃听防护。示例如图1所示。u1选择EMI较强的AC/DC PLC信道c1,利用所有传输功率进行数据传输。u5和u6都首先选择c5。然后,在边端协同的情况下,u6选择c6,分割一部分功率用于基于AN的防窃听。u7采用微功率无线信道c7节能。
[0099] 适应园区电碳信息转换的保密容量保障方法
[0100] 适应园区电碳信息转换的保密容量保障方法包括针对园区电碳信息转换的多模态通信网络模型与保密容量模型构建、对园区多模态通信面临的电碳信息转换保密容量保障问题进行建模、基于自适应学习的电碳信息转换安全边端协同算法(Adaptive learning‑based seCure Edge‑End collaboration for electric carbon information 2
conversion,ACE)设计。其中,园区电碳信息转换保密容量保障问题建模为通过优化园区电碳信息转换的多模态通信中的信道选择与功率分配,从而在设备侧队列稳定性约束下,
2
联合实现网络保密容量最大化、设备能耗和排队时延最小化。所提出的ACE算法承载于适应园区电碳信息转换的保密容量保障系统边层的多模态边缘计算网关与多模态物联终端中,通过执行该算法动态优化多模态信道选择和功率分配,能够实现园区电碳信息转换的保密容量保障,实现园区低碳业务差异化QoS性能保障。
[0101] (1)针对系统通信性能和保密容量保障的模型构建
[0102] 1)网络模型
[0103] 适应园区电碳信息转换的保密容量保障系统包含I个设备和一个边缘计算网关,定义设备集合为U={u1,...,ui,...,uI}。一共有J个多模态信道,包括J1个AC/DC PLC信道、J2个WLAN信道、J3个微功率无线信道,且满足J1+J2+J3=J。定义信道集合为C={c1,…,cj,…,cJ},其中cj,j=1,…,J1为AC/DC PLC信道,cj,j=J1+1,…,J1+J2为WLAN信道,cj,j=TJ1+J2+1,…,J为微功率无线信道。本发明将整个优化时间划分为 个时隙,用集合T={1,...,t,...,T}表示,其中每个时隙长度为τ。在每个时隙中,各设备采集一定的数据量Ai(t),通过联合优化信道选择和功率分配,实现任务卸载。然后基于边端协同消除设备间的接入冲突。
[0104] 2)设备侧数据队列模型
[0105] ui采集的数据存储在本地缓冲区中,本地缓冲区建模为设备端数据队列Hi(t)。队列积压被更新为
[0106] Hi(t+1)=max{Hi(t)+Ai(t)‑Ui(t),0} (1)
[0107] 其中,Ui(t)是第t个时隙的吞吐量。
[0108] 3)安全传输模型
[0109] 定义信道选择变量为xi,j(t)∈{0,1},其中xi,j(t)=1表示在第t个时隙ui选择cj,否则xi,j(t)=0。定义功率分配变量ρi(t)为数据传输功率与ui最大传输功率的比值,即AN传输功率 由(1‑ρi(t))Pi,j,max决定,将ρi(t)离散化为M级,即ρi(t)∈ρ={1/M,…,m/M,…,1}。
[0110] 在第t个时隙,ui选择的信道cj的信道容量和吞吐量分别表示为
[0111]
[0112]
[0113] 其中,Bj是cj的带宽; 为ui在cj上的信噪比(signal to interference plus noise ratio,SINR),表示为
[0114]
[0115] 其中, 分别为信道增益、噪声功率与可再生能源投切带来的电磁噪声功率; 表示ui到网关之间的路径损失; 表示攻击者到网关之间的路径损失。Ni表示ui的天线数量; 为攻击者的干扰噪声功率。
[0116] 本发明用保密容量来定义系统的安全性能,保密容量参数化了在向攻击者泄露信息极少的情况下,能够可靠地传递到网关的可实现的传输速率。ui在cj上的保密容量为[0117]
[0118] 其中, 是攻击者的信道容量,表示为
[0119]
[0120] 其中, 是为攻击者在cj上的SINR,表示为
[0121]
[0122] 其中, 表示ui和攻击者之间的路径损耗。
[0123] 4)设备侧能耗模型
[0124] ui传输数据到网关的能耗表示为
[0125]
[0126] 因此,ui的总能耗可以计算为
[0127]
[0128] 5)设备侧排队时延模型
[0129] ui的排队时延定义为平均队列长度与平均数据到达率的比值,表示为
[0130]
[0131] 其中, 是到第t个时隙的平均数据到达率,即
[0132]
[0133] (2)针对信道选择与功率分配联合优化的电碳信息转换保密容量保障问题建模[0134] 1)优化问题设计
[0135] 本发明解决的优化问题为通过时间敏感和安全的边端协同实现适应园区电碳信息转换的保密容量保障系统。问题的优化目标为在设备侧队列稳定性约束下,联合实现网络保密容量最大化、设备能耗和排队时延最小化。此信道选择与功率分配的联合优化问题定义为
[0136]
[0137] 其中,ViC、ViE和ViT是保密容量、能耗和时延的非负权值。约束条件C1表示信道选择约束,在每个时隙每个设备只能选择一个信道。约束条件C2表示队列稳定性约束。
[0138] 2)优化问题转化
[0139] 长期随机优化问题P1为NP难问题,难以直接求解。基于Lyapunov优化将P1转化为一系列短期优化子问题。定义H(t)为第t个时隙的数据队列集合,定义一个漂移减奖励以实现在队列稳定性约束下,实现P1优化目标的最大化,表示为
[0140] DMRV(H(t))=VΔL(H(t))‑E[η(t)|H(t)](13)
[0141] 其中,V是权衡队列稳定性和奖励最大化的权重;ΔL(H(t))是参数化队列波动的Lyapunov漂移,即Lyapunov函数L(H(t))在两个相邻时隙之间的条件期望差;L(H(t))定义为队列积压的二次和;η(t)为短期优化目标,表示为
[0142]
[0143] 定理1:DMRV(H(t))的上界为
[0144]
[0145] 其中C(t)与η(t)不相关。
[0146] 证明略
[0147] 因此,(15)中导出的DMRV(H(t))的上界在第t个时隙的约束C1下最小化。逐个时隙上的短期子问题的表达式为
[0148]
[0149] P2可以进一步分解为I子问题,由每个设备并行解决。定义信道选择和功率分配变量的集合为Xi(t)={xi,1(t),…,xi,j(t),…,xi,J(t),ρi(t)}。因此,可得ui解决的第i个子问题,表示为
[0150]
[0151] 但由于缺乏集中协同,当多个设备同时选择同一信道时,由于各设备各自优化,会导致接入冲突。
[0152] (3)基于自适应学习的电碳信息转换安全边端协同算法设计
[0153] 本发明提出了基于自适应学习的电碳信息转换安全边端协同算法(Adaptive learning‑based seCure Edge‑End collaboration for electric carbon information 2
con version,ACE)来求解P3。
[0154] 首先,P3被建模为一个马尔可夫决策过程(Markov decision process,MDP),其基本要素介绍如下。
[0155] 1)状态:状态空间Si(t)定义为设备侧队列积压、经验任务到达率、第(t‑1)个时隙的信道选择、功率分配策略和保密容量的函数,即
[0156] 2)动作:动作空间定义为优化问题P3的优化变量Xi(t)。
[0157] 3)奖励:将奖励定义为P3的优化目标,即Γ(Xi(t))。
[0158] 由于攻击者行为与其他设备接入策略存在不确定性,因此准确地建模MDP转移概2 2
率具有重要意义。本发明提出了ACE联合优化信道选择和任务分配策略。ACE的算法结构如图2所示,包括四个部分,即1)设备侧动作绘制;2)边侧协同;3)设备侧学习率调整;4)设备
2
侧网络更新。ACE 结合了深度演员评论家(deep actor‑critic,DAC)的学习能力、“赢或快速学习”(win or learn fast,WoLF)机制的适应性和边侧协同能力。具体来说,每个设备具有一个基于策略的演员神经网络θi和一个基于值的评论家神经网络ωi。演员网络与环境交互并绘制动作策略,而评论家网络评估当前的动作策略并指导策略更新。为提高低碳服务
2
下资源管理的收敛速度、学习最优性和适应性,ACE 利用WoLF机制,根据设备侧性能反馈动
2
态调整学习率。在边侧协同中,网关通过比较设备侧的动作状态值来消除接入冲突。ACE 算法流程图如图3所示。
[0159] 具体的实现步骤介绍如下。
[0160] 1)设备侧动作绘制:每个ui∈U根据状态空间Si(t)和演员神经网络θi,绘制策略π(Si(t),Si(t)|θi),即
[0161]
[0162] 其中,xi(t)是动作空间集合。然后,每个ui∈U绘制动作xi(t)。此外,设备侧状态动作值Q(Si(t),xi(t)|ωi)是用评论家神经网络ωi得到的。
[0163] 2)边侧协同:每个ui∈U传递xi(t)和Q(Si(t),xi(t)|ωi)到网关。如果多个设备选择一个相同的信道cj,网关将cj调度到具有最大Q(Si(t),xi(t)|ωi)的设备并拒绝其他的。其余的设备重复“设备‑网关”交互,直到每个信道被不超过一个设备选择或所有信道已被调度。接下来,每个ui∈U执行xi(t)并计算奖励Γ(Xi(t))。
[0164] 3)设备侧学习率调整:本发明采用(ψω,δω)和(ψl,δl)两种学习参数集合。基于WoLF机制,ui∈U应该在赢的时候学习得更快,输的时候学习得更慢,即满足δl>δω且ψl>ψω。因此,学习率表示为
[0165]
[0166] 其中,当Ωi成立时,I{Ωi}=1。当策略的期望状态‑行为值π(Si(t),xi(t)|θi)大于时,Ωi表示ui∈U取胜,表示为
[0167]
[0168] 其中, 为平均混合策略,更新为
[0169]
[0170] 其中, 表示折损因子。随后,每个ui∈U转移到下一状态Si(t+1),基于(1)更新Qi(t+1),获取Q(Si(t+1),xi(t+1)|ωi)。
[0171] 4)设备侧网络更新:定义时序差分(time difference,TD)误差为φi,表示为[0172] φi(t)=Γ(Xi(t))+γQ(Si(t+1),ωi)‑Q(Si(t),ωi)(22)
[0173] 然后,基于梯度上升法,将θi和ωi更新为
[0174]
[0175]
[0176] 对比算法1:一种基于演员评论家功率控制算法(actor‑critical‑based power allocation algorithm,ACPA)的保密容量保障方法。
[0177] 对比算法2:一种基于“赢或快速学习”爬山策略功率分配算法(win or learn faster‑policy hill climbing‑based power allocation algorithm,WoLF‑PHC)的保密容量保障方法。
[0178] ACPA和WoLF‑PHC的优化目标是通过优化功率分配最大化保密容量,而ACPA和WoLF‑PHC均未考虑信道选择和边端协同,PIoT设备随机接入信道。
[0179] 在仿真中,设置攻击者在时隙101~200窃听WLAN信道,在时隙201~300窃听微功率无线信道。仿真结果如下:
[0180] 图4展示了保密容量随时隙的变化关系。当t=1~100时,ACE2的保密容量由于信道选择和功率分配的不断优化而逐渐增大。当t=101~200时,由于窃听者的攻击,保密容2 2
量急剧下降,然后逐渐增加。这是因为ACE进行了功率分配优化,当数据传输被窃听时,ACE增加AN的传输功率,提高数据传输的安全性。当t=201~300时,由于微功率无线信道传输速率低且传输功率有限,对多属性QoS的攻击影响较小,使保密容量逐渐提高。与ACPA和
2
WoLF‑PHC相比,ACE提高了保密容量38.71%和22.86%。通过切换到非窃听信道,对多模态信道选择的额外考虑提高了保密容量。
[0181] 图5展示了不同业务类型下的排队时延和保密容量。仿真结果表明,ACE2为低碳业务提供了多属性的QoS保障。负荷监测业务排队时延最小且保密容量最大,碳足迹监测业务2
排队时延最大且保密容量最小。原因在于ACE使碳足迹监测大概率选择通信能耗最小的微功率无线信道,而负荷监测业务大概率选择保密容量最大的AC/DC PLC信道。
[0182] 本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的实施方法,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。