微波无源器件的设计方法和装置转让专利

申请号 : CN202310856674.0

文献号 : CN117272778B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李晓春武泽明李正毛军发

申请人 : 上海交通大学

摘要 :

本发明公开了一种微波无源器件的设计方法和装置,方法包括:确定设计目标及设计参数范围;进行采样生成初始设计参数样本集XI和扩展样本集XU;对XI进行全波仿真计算,得到散射参数并从中提取出电磁特性数据集YI,得到初始设计数据集DI;将DI分为训练集和测试集,训练正向的多层感知机神经网络和高斯过程并计算测试误差;预测XU的设计性能;根据建模精度作为权重,选取其预测值的加权平均数作为扩展设计性能;将扩展设计性能及对应的扩展设计参数作为扩展设计数据集DE;利用DI和DE训练可逆神经网络;根据设计目标生成设计候选值,进行测试验证确定最终设计参数,实现了智能化设计。

权利要求 :

1.一种微波无源器件的设计方法,其特征在于,包括以下步骤:确定待设计微波无源器件的设计目标,所述待设计微波无源器件为待改进性能的微波无源器件;

根据待设计微波无源器件的设计目标确定待设计微波无源器件的设计参数的允许范围,所述设计参数是微波无源器件的尺寸参数;

采用拉丁超立方采样法对待设计微波无源器件的设计参数进行采样,分别生成初始设计参数样本集XI 和扩展设计参数样本集XU;

对初始设计参数样本集XI进行全波仿真计算,得到初始设计参数样本的散射参数,并从散射参数中提取出电磁特性数据集YI 作为设计性能,得到初始设计数据集 = {XI, YI};

采用k‑fold交叉验证方法将初始设计数据集 分为训练集和测试集,训练正向的多层感知机神经网络 和高斯过程 ,并分别计算多层感知机神经网络 和高斯过程的测试误差;

如果测试误差不满足精度要求,则利用拉丁超立方采样继续向初始设计参数样本集XI添加样本,否则进入下一步;

利用多层感知机神经网络 和高斯过程 分别预测扩展设计参数样本集XU的设计性能;

根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为扩展设计性能;将扩展设计性能及对应的扩展设计参数作为扩展设计数据集 ;

利用初始设计数据集 和扩展设计数据集 训练可逆神经网络;

使用可逆神经网络根据设计目标生成设计候选值,并利用多层感知机神经网络和高斯过程进行测试验证,选择测试误差最小的设计候选值作为最终的设计参数。

2.根据权利要求1所述的微波无源器件的设计方法,其特征在于,所述设计目标为微波无源器件的电磁特性,包括但不限于工作频带和工作频点处的回波损耗。

3.根据权利要求1所述的微波无源器件的设计方法,其特征在于, 所述初始设计参数样本集XI 为:XI =

其中,m为初始设计参数样本数, 为初始设计参数样本;

所述扩展设计参数样本集XU为:

XU =

其中,n为扩展设计参数样本数, 为扩展设计参数样本;

所述电磁特性数据集YI为:

YI = { }

其中, 为电磁特性。

4.根据权利要求1所述的微波无源器件的设计方法,其特征在于,所述设计性能的计算公式为:其中, 为初始设计参数样本或扩展设计参数样本, 为多层感知机神经网络的预测值, 为高斯过程的预测值。

5.根据权利要求4所述的微波无源器件的设计方法,其特征在于,所述设计性能的计算公式为:其中, 为利用多层感知机神经网络和高斯过程预测的设计性能, 为多层感知机神经网络的测试误差, 为高斯过程的测试误差。

6.根据权利要求1‑5任意一项所述的微波无源器件的设计方法,其特征在于,所述可逆神经网络由可逆块构成:i i+1 i

其中,h 代表第i个可逆块正向过程输入,h 代表第i个可逆块的正向过程g (·)的输出,i=1、2……N,N为可逆神经网络的可逆块数量;

i i i

正向过程g (·)的具体计算过程为先将  按照维度分为[h1:d,hd+1:D],其中, 为d维向量, 为D‑d维向量;再用下式计算:s(·)和t(·)由任意的神经网络构成,并且都是从d维到D‑d维的映射; 是元素乘积符号;

可逆块的逆向过程为:

i+1 i

变量转换定理定义h 到 h 的概率分布变化:

i

其中,p(·)代表概率,det( )是g ( )的雅可比行列式:其中,Id是d×d的单位矩阵,  是对角线元素为 的对角矩阵。

7.根据权利要求6所述的微波无源器件的设计方法,其特征在于,所述可逆神经网络的训练为采用反向传播算法最小化可逆神经网络的损失函数进行训练可逆神经网络参数:其中, 为训练集设计参数, 为可逆神经网络逆向过程得到的设计参数,b为训练集大小, 为可逆神经网络正向过程针对训练集第i个设计参数得到的预测值, 为相应的真实值; 为先验分布, 为可逆神经网络正向过程的预测值,MMD为最大均值误差;

假定数据分布P={p1,p2,…,pb}和Q={q1,q2,…,qb},则MMD的计算公式为:其中, 为核函数,P和Q分别为训练集设计参数 和可逆神经网络逆向过程得到的设计参数 的数据分布;

采用逆多二次径向基函数作为核函数:

其中,为超参数, ,或, ;

当损失函数值收敛后,将 作为可逆神经网络的参数,得到 模型。

8.根据权利要求7所述的微波无源器件的设计方法,其特征在于,所述使用可逆神经网络根据设计目标生成设计候选值,包括:

1 N

令h = x以及 h = [y, z],其中z满足标准高斯分布;

可逆神经网络将z的分布转化为条件概率分布p(x|y),使可逆神经网络能够在给定设计目标y下依靠概率采样的方法得到多组设计候选值x;

基于高斯分布采样g个z,将采样的z和目标y作为可逆神经网络的输入,代入下式:得到g个设计候选值。

9.根据权利要求8所述的微波无源器件的设计方法,其特征在于,所述利用多层感知机神经网络和高斯过程进行测试验证的过程为:将生成的g个设计候选值通过训练的多层感知机神经网络 和高斯过程 计算电磁性能,并计算电磁性能与目标电磁性能的误差:其中, 和 为第j个设计候选值对应的多层感知机神经网络的输出和高斯过程的输出。

10.一种微波无源器件的设计装置,其特征在于,包括:设计目标确定模块,用于确定待设计微波无源器件的设计目标,所述待设计微波无源器件为待改进性能的微波无源器件;

设计参数范围确定模块,用于根据待设计微波无源器件的设计目标确定待设计微波无源器件的设计参数的允许范围,所述设计参数是微波无源器件的尺寸参数;

设计参数样本集生成模块,用于采用拉丁超立方采样法对待设计微波无源器件的设计参数进行采样,分别生成初始设计参数样本集XI 和扩展设计参数样本集XU;

全波仿真计算模块,用于对初始设计参数样本集XI进行全波仿真计算,得到初始设计参数样本的散射参数,并从散射参数中提取出电磁特性数据集YI作为设计性能,得到初始设计数据集 = {XI, YI};

测试误差计算模块,用于采用k‑fold交叉验证方法将初始设计数据集 分为训练集和测试集,训练正向的多层感知机神经网络 和高斯过程 ,并分别计算多层感知机神经网络 和高斯过程 的测试误差;

测试误差判断模块,用于判断测试误差是否满足精度要求,如果不满足精度要求则利用拉丁超立方采样继续向初始设计参数样本集XI添加样本,否则进入下一步;

设计性能预测模块,用于利用多层感知机神经网络 和高斯过程 分别预测扩展设计参数样本集XU的设计性能;

扩展设计数据集确定模块,用于根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为扩展设计性能;将扩展设计性能及对应的扩展设计参数作为扩展设计数据集 ;

可逆神经网络训练模块,用于利用初始设计数据集 和扩展设计数据集 训练可逆神经网络;

最终设计参数确定模块,用于使用可逆神经网络根据设计目标生成设计候选值,并利用多层感知机神经网络和高斯过程进行测试验证,选择测试误差最小的设计候选值作为最终的设计参数。

说明书 :

微波无源器件的设计方法和装置

技术领域

[0001] 本发明涉及一种微波无源器件的设计方法和装置,具体地说是一种基于半监督‑可逆神经网络逆建模的微波无源器件的设计方法和装置,属于微波无源器件设计技术领域。

背景技术

[0002] 随着微波与射频电路的发展,对微波无源器件的性能要求逐渐提高,为了适应微波与射频电路高性能要求,一些新颖的微波器件结构层出不穷,使得微波无源器件的设计问题日趋复杂。微波无源器件的性能通常与其物理和尺寸参数相关,传统微波器件的设计方法依赖于参数扫描,需要多次调用仿真软件对不同物理和尺寸参数的微波器件进行精确的数值计算,以优化出最合适的设计参数,这大大增加了微波无源器件的设计周期,提高了设计成本。不仅如此,微波器件的设计需要设计者对电磁场与微波技术有较深的理解,设计门槛较高。因此微波器件的智能化和自动化设计在如今变得十分必要。
[0003] 逆建模设计方法已成为微波无源器件设计领域重要的发展方向。逆建模是相对于正向建模而言的,正向建模输入是设计参数,输出是设计指标,而逆建模指将设计目标看作模型的输入,设计参数看作模型的输出,通过模型直接从设计目标得到设计参数。因此逆建模设计方法是最为便捷且不依赖于专业知识的设计方法,目前逆建模方法主要依赖于多层感知机神经网络模型,相关研究证明多层感知机神经网络逆建模方法有一定的应用局限性。
[0004] 第一个局限是使用多层感知机神经网络不适用于处理存在一对多问题的逆建模。微波无源器件逆设计的一对多问题指的是同一设计目标可能对应多组设计参数,多层感知机神经网络的原理是使模型预测的输出与数据集真实值的平方均值误差最小,因此当数据集中存在一对多问题时,使用神经网络直接进行逆建模会造成极大的误差。第二个局限是相对于正向建模而言,使用神经网络进行逆建模需要大量的数据集,而数据集的获取需要依赖全波仿真软件获取,这一过程十分耗时,尤其当微波器件结构复杂、设计参数多的情况下,神经网络逆建模所需数据集规模更大,时间耗费问题更加突出。

发明内容

[0005] 为了解决上述问题,本发明提出了一种基于半监督‑可逆神经网络逆建模的微波无源器件的设计方法和装置,能够利用可逆神经网络提高逆建模的精度,并提出半监督学习的方法提高生成数据集的效率,使设计者不依赖于经验知识,能够从设计目标直接获得设计参数,实现微波无源器件的智能化设计。
[0006] 本发明解决其技术问题采取的技术方案是:
[0007] 第一方面,本发明实施例提供的一种微波无源器件的设计方法,包括以下步骤:
[0008] 确定待设计微波无源器件的设计目标,所述待设计微波无源器件为待改进性能的微波无源器件;
[0009] 根据待设计微波无源器件的设计目标确定待设计微波无源器件的设计参数的允许范围,所述设计参数是微波无源器件的尺寸参数;
[0010] 采用拉丁超立方采样法对待设计微波无源器件的设计参数进行采样,分别生成初始设计参数样本集XI和扩展设计参数样本集XU;
[0011] 对初始设计参数样本集XI进行全波仿真计算,得到初始设计参数样本的散射参数,并从散射参数中提取出电磁特性数据集YI作为设计性能,得到初始设计数据集 = {XI,YI};
[0012] 采用k‑fold交叉验证方法将初始设计数据集 分为训练集和测试集,训练正向的多层感知机神经网络 和高斯过程 ,并分别计算多层感知机神经网络 和高斯过程 的测试误差;
[0013] 如果测试误差不满足精度要求,则利用拉丁超立方采样继续向初始设计参数样本集XI添加样本,否则进入下一步;
[0014] 利用多层感知机神经网络 和高斯过程 分别预测扩展设计参数样本集XU的设计性能;
[0015] 根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为扩展设计性能;将扩展设计性能及对应的扩展设计参数作为扩展设计数据集;
[0016] 利用初始设计数据集 和扩展设计数据集 训练可逆神经网络;
[0017] 使用可逆神经网络根据设计目标生成设计候选值,并利用多层感知机神经网络和高斯过程进行测试验证,选择测试误差最小的设计候选值作为最终的设计参数。
[0018] 作为本实施例一种可能的实现方式,所述设计目标为微波无源器件的电磁特性,包括但不限于工作频带和工作频点处的回波损耗。所述工作频带包括微波无源器件工作带宽对应的上截止频率和下截止频率。
[0019] 作为本实施例一种可能的实现方式,所述初始设计参数样本集XI为:
[0020] XI=
[0021] 其中,m为初始设计参数样本数, 为初始设计参数样本;
[0022] 所述扩展设计参数样本集XU为:
[0023] XU=
[0024] 其中,n为扩展设计参数样本数, 为扩展设计参数样本;
[0025] 所述电磁特性数据集YI为:
[0026] YI= { }
[0027] 其中, 为电磁特性。
[0028] 作为本实施例一种可能的实现方式,所述设计性能的计算公式为:
[0029]
[0030] 其中, 为初始设计参数样本或扩展设计参数样本, 为多层感知机神经网络的预测值, 为高斯过程的预测值。
[0031] 作为本实施例一种可能的实现方式,所述设计性能的计算公式为:
[0032]
[0033] 其中, 为利用多层感知机神经网络和高斯过程预测的设计性能, 为多层感知机神经网络的测试误差, 为高斯过程的测试误差。
[0034] 作为本实施例一种可能的实现方式,所述可逆神经网络由可逆块构成:
[0035]
[0036] 其中,hi代表第i个可逆块正向过程输入,hi+1代表第i个可逆块的正向过程gi(·)的输出;i
[0037] 正向过程g (·)的具体计算过程为先将 按照维度分为[ , ,再用下式计算:
[0038]
[0039] s(·)和t(·)由任意的神经网络构成,并且都是从d维到D‑d维的映射; 是元素乘积符号;
[0040] 可逆块的逆向过程为:
[0041]
[0042] 变量转换定理定义hi+1到hi的概率分布变化:
[0043]i
[0044] 其中,det( )是g ( )的雅可比行列式:
[0045]
[0046] 其中,Id是d×d的单位矩阵, 是对角线元素为 的对角矩阵。
[0047] 作为本实施例一种可能的实现方式,所述可逆神经网络的训练为采用反向传播算法最小化可逆神经网络的损失函数进行训练可逆神经网络参数 :
[0048]
[0049] 其中, 为训练集设计参数, 为可逆神经网络逆向过程得到的设计参数,b为训练集大小, 为可逆神经网络正向过程针对训练集第i个设计参数得到的预测值,为相应的真实值; 为先验分布, 为可逆神经网络正向过程的预测值,MMD为最大均值误差;
[0050] 假定数据分布 和 ,则MMD的计算公式为:
[0051]
[0052] 其中, 为核函数;
[0053] 采用逆多二次径向基函数作为核函数:
[0054]
[0055] 其中,为超参数, ,或, ;
[0056] 当损失函数值收敛后,将 作为可逆神经网络的参数,得到 模型。
[0057] 作为本实施例一种可能的实现方式,所述使用可逆神经网络根据设计目标生成设计候选值,包括:
[0058] 令h1=x以及hN= [y,z],其中z满足标准高斯分布;
[0059] 可逆神经网络将z的分布转化为条件概率分布p(x|y),使可逆神经网络能够在给定设计目标y下依靠概率采样的方法得到多组设计候选值x;
[0060] 基于高斯分布采样g个z,将采样的z和目标y作为可逆神经网络的输入,代入下式:
[0061]
[0062] 得到g个设计候选值。
[0063] 作为本实施例一种可能的实现方式,所述利用多层感知机神经网络和高斯过程进行测试验证的过程为:
[0064] 将生成的g个设计候选值通过训练的多层感知机神经网络 和高斯过程计算电磁性能,并计算电磁性能与目标电磁性能的误差:
[0065]
[0066] 其中, 和 为第j个设计候选值对应的多层感知机神经网络的输出和高斯过程的输出。
[0067] 第二方面,本发明实施例提供的一种微波无源器件的设计装置,包括:
[0068] 设计目标确定模块,用于确定待设计微波无源器件的设计目标,所述待设计微波无源器件为待改进性能的微波无源器件;
[0069] 设计参数范围确定模块,用于根据待设计微波无源器件的设计目标确定待设计微波无源器件的设计参数的允许范围,所述设计参数是微波无源器件的尺寸参数;
[0070] 设计参数样本集生成模块,用于采用拉丁超立方采样法对待设计微波无源器件的设计参数进行采样,分别生成初始设计参数样本集XI和扩展设计参数样本集XU;
[0071] 全波仿真计算模块,用于对初始设计参数样本集XI进行全波仿真计算,得到初始设计参数样本的散射参数,并从散射参数中提取出电磁特性数据集YI作为设计性能,得到初始设计数据集 = {XI,YI};
[0072] 测试误差计算模块,用于采用k‑fold交叉验证方法将初始设计数据集 分为训练集和测试集,训练正向的多层感知机神经网络 和高斯过程 ,并分别计算多层感知机神经网络 和高斯过程 的测试误差;
[0073] 测试误差判断模块,用于判断测试误差是否满足精度要求,如果不满足精度要求则利用拉丁超立方采样继续向初始设计参数样本集XI添加样本,否则进入下一步;
[0074] 设计性能预测模块,用于利用多层感知机神经网络 和高斯过程 分别预测扩展设计参数样本集XU的设计性能;
[0075] 扩展设计数据集确定模块,用于根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为扩展设计性能;将扩展设计性能及对应的扩展设计参数作为扩展设计数据集 ;
[0076] 可逆神经网络训练模块,用于利用初始设计数据集 和扩展设计数据集 训练可逆神经网络;
[0077] 最终设计参数确定模块,用于使用可逆神经网络根据设计目标生成设计候选值,并利用多层感知机神经网络和高斯过程进行测试验证,选择测试误差最小的设计候选值作为最终的设计参数。
[0078] 本发明实施例的技术方案可以具有的有益效果如下:
[0079] 本发明实施例的技术方案的一种微波无源器件的设计方法,
[0080] 本发明利用可逆神经网络提高逆建模的精度,并提出半监督学习的方法提高生成数据集的效率,使设计者不依赖于经验知识,能够从设计目标直接获得设计参数,实现了微波无源器件的智能化设计;本发明利用半监督可逆神经网络来进行微波无源器件的设计,可逆神经网络能够通过概率采样的方法在给定设计性能条件下直接生成多组设计候选值,从而避免了工程师的经验参与,极大的提高了设计效率;本发明还提出半监督学习方法,提高了生成用于可逆神经网络训练的数据集的效率,其次提出新的验证方法代替使用全波仿真验证设计参数,极大的提高了验证效率。
[0081] 本发明的应用场景是固定结构的微波无源器件参数设计,根据不同的设计性能确定微波无源器件的设计参数,通过半监督学习提高数据集获取的效率,并训练可逆神经网络以学习微波无源器件设计目标与设计参数之间的关系;可逆神经网络依据设计目标生成设计候选值,设计候选值经过验证模块之后可以得到准确的设计参数。
[0082] 本发明将可逆神经网络引入微波无源器件的逆建模,解决了逆建模中存在的一对多问题,从而提高了逆建模的精度。本发明将微波无源器件的设计问题转化为逆建模问题,即将设计目标看作模型的输入,设计参数看作模型的输出,通过模型直接从设计目标得到设计参数。本发明采用可逆神经网络,通过学习微波无源器件的给定设计性能下设计参数的分布,通过概率采样的方法生成设计参数,从而能够提供多组参数,可以智能地解决逆建模中的一对多问题。
[0083] 本发明将半监督学习方法引入来提高生成数据集的效率。本发明采用正向模型为逆建模提供数据集,具体为利用从全波仿真软件获得的小样本数据集训练出多层感知机神经网络和高斯过程作为正向模型,然后利用正向模型预测更多无设计性能数据的设计性能,即预测设计参数的设计性能,从而为逆建模提供更大的数据集。本发明通过半监督学习方法获得数据集,明显减少了时间,从而提高了生成数据集的效率。
[0084] 本发明运用之前训练好的多层感知机神经网络和高斯过程作为正向模型,将可逆神经网络生成的参数送入两个正向模型进行交叉验证,从而提高了验证效率和精度。

附图说明

[0085] 图1是根据一示例性实施例示出的一种微波无源器件的设计方法的流程图;
[0086] 图2是根据一示例性实施例示出的一种可逆神经网络的示意图;
[0087] 图3是根据一示例性实施例示出的一种可逆神经网络基本单元互耦仿射层的示意图;
[0088] 图4是根据一示例性实施例示出的一种利用本发明所述装置进行微波无源器件的设计流程图;
[0089] 图5是根据一示例性实施例示出的一种腔体滤波器的结构示意图;
[0090] 图6是根据一示例性实施例示出的一种使用本发明所述方法得到的设计参数对应的设计性能和目标设计性能的对比示意图。

具体实施方式

[0091] 下面结合附图与实施例对本发明做进一步说明:
[0092] 为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
[0093] 如图1所示,本发明实施例提供的一种微波无源器件的设计方法,包括以下步骤:
[0094] 确定待设计微波无源器件的设计目标,所述待设计微波无源器件为待改进性能的微波无源器件;
[0095] 根据待设计微波无源器件的设计目标确定待设计微波无源器件的设计参数的允许范围,所述设计参数是微波无源器件的尺寸参数;
[0096] 采用拉丁超立方采样法对待设计微波无源器件的设计参数进行采样,分别生成初始设计参数样本集XI和扩展设计参数样本集XU;
[0097] 对初始设计参数样本集XI进行全波仿真计算,得到初始设计参数样本的散射参数,并从散射参数中提取出电磁特性数据集YI作为设计性能,得到初始设计数据集 = {XI,YI};
[0098] 采用k‑fold交叉验证方法将初始设计数据集 分为训练集和测试集,训练正向的多层感知机神经网络 和高斯过程 ,并分别计算多层感知机神经网络 和高斯过程 的测试误差;
[0099] 如果测试误差不满足精度要求,则利用拉丁超立方采样继续向初始设计参数样本集XI添加样本,否则进入下一步;
[0100] 利用多层感知机神经网络 和高斯过程 分别预测扩展设计参数样本集XU的设计性能;
[0101] 根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为扩展设计性能;将扩展设计性能及对应的扩展设计参数作为扩展设计数据集;
[0102] 利用初始设计数据集 和扩展设计数据集 训练可逆神经网络;
[0103] 使用可逆神经网络根据设计目标生成设计候选值,并利用多层感知机神经网络和高斯过程进行测试验证,选择测试误差最小的设计候选值作为最终的设计参数。
[0104] 本发明采用拉丁超立方采样的方法能够有效反应样本空间的信息,通过拉丁超立方采样获得初始数据集和扩展数据集的设计参数,为后续建模坐铺垫;通过全波仿真得到m个设计参数样本的散射参数,并从散射参数中提取出电磁特性YI= { },并将其作为设计性能,得到初始有设计性能数据集 = {XI,YI},这样可以获得初始数据集,为正向建模提供了数据集;计算多层感知机神经网络和高斯过程的测试误差是为了训练出多层感知机神经网络和高斯过程作为正向模型,为扩展数据集和验证设计参数提供了依据;通过测试误差的判断,确保能够训练出精度符合要求的多层感知机神经网络和高斯过程,从而确保得到的设计参数的正确性;利用多层感知机神经网络和高斯过程分别预测n个设计参数样本的设计性能,是为了得到待设计微波无源器件的设计性能;选取其预测值的加权平均数作为扩展设计性能,方便获得最终的扩展数据集,并确保数据集的精度;通过训练可逆神经网络训练出可逆神经网络,得到多组设计候选值,并选择误差最小的设计候选值作为最终的设计参数。
[0105] 作为本实施例一种可能的实现方式,所述设计目标为微波无源器件的电磁特性,包括但不限于工作频带和工作频点处的回波损耗。所述工作频带包括微波无源器件工作带宽对应的上截止频率和下截止频率。
[0106] 作为本实施例一种可能的实现方式,所述初始设计参数样本集XI为:
[0107] XI=
[0108] 其中,m为初始设计参数样本数, 为初始设计参数样本;
[0109] 所述扩展设计参数样本集XU为:
[0110] XU=
[0111] 其中,n为扩展设计参数样本数, 为扩展设计参数样本;
[0112] 所述电磁特性数据集YI为:
[0113] YI= { }
[0114] 其中, 为电磁特性。
[0115] 作为本实施例一种可能的实现方式,所述设计性能的计算公式为:
[0116]
[0117] 其中, 为初始设计参数样本或扩展设计参数样本, 为多层感知机神经网络的预测值, 为高斯过程的预测值。
[0118] 作为本实施例一种可能的实现方式,所述设计性能的计算公式为:
[0119]
[0120] 其中, 为利用多层感知机神经网络和高斯过程预测的设计性能, 为多层感知机神经网络的测试误差, 为高斯过程的测试误差。
[0121] 作为本实施例一种可能的实现方式,所述可逆神经网络由可逆块构成:
[0122]
[0123] 其中,hi代表第i个可逆块正向过程输入,hi+1代表第i个可逆块的正向过程gi(·)的输出;
[0124] 正向过程gi(·)的具体计算过程为先将 按照维度分为[ , ,再用下式计算:
[0125]
[0126] s(·)和t(·)由任意的神经网络构成,并且都是从d维到D‑d维的映射; 是元素乘积符号;
[0127] 可逆块的逆向过程为:
[0128]
[0129] 变量转换定理定义hi+1到hi的概率分布变化:
[0130]
[0131] 其中,det( )是gi( )的雅可比行列式:
[0132]
[0133] 其中,Id是d×d的单位矩阵, 是对角线元素为 的对角矩阵。
[0134] 作为本实施例一种可能的实现方式,所述可逆神经网络的训练为采用反向传播算法最小化可逆神经网络的损失函数进行训练可逆神经网络参数 :
[0135]
[0136] 其中, 为训练集设计参数, 为可逆神经网络逆向过程得到的设计参数,b为训练集大小, 为可逆神经网络正向过程针对训练集第i个设计参数得到的预测值,为相应的真实值; 为先验分布, 为可逆神经网络正向过程的预测值,MMD为最大均值误差;
[0137] 假定数据分布 和 ,则MMD的计算公式为:
[0138]
[0139] 其中, 为核函数;
[0140] 采用逆多二次径向基函数作为核函数:
[0141]
[0142] 其中,为超参数, ,或, ;
[0143] 当损失函数值收敛后,将 作为可逆神经网络的参数,得到 模型。
[0144] 作为本实施例一种可能的实现方式,所述使用可逆神经网络根据设计目标生成设计候选值,包括:
[0145] 令h1=x以及hN= [y,z],其中z满足标准高斯分布;
[0146] 可逆神经网络将z的分布转化为条件概率分布p(x|y),使可逆神经网络能够在给定设计目标y下依靠概率采样的方法得到多组设计候选值x;
[0147] 基于高斯分布采样g个z,将采样的z和目标y作为可逆神经网络的输入,代入下式:
[0148]
[0149] 得到g个设计候选值。
[0150] 作为本实施例一种可能的实现方式,所述利用多层感知机神经网络和高斯过程进行测试验证的过程为:
[0151] 将生成的g个设计候选值通过训练的多层感知机神经网络 和高斯过程计算电磁性能,并计算电磁性能与目标电磁性能的误差:
[0152]
[0153] 其中, 和 为第j个设计候选值对应的多层感知机神经网络的输出和高斯过程的输出。
[0154] 本发明的应用场景是固定结构的微波无源器件参数设计,利用本发明所述方法可以根据不同的设计性能确定微波无源器件的设计参数,本发明所述设计性能指的是微波无源器件的电磁特性,包括但不限于工作频带、工作频点处的回波损耗等电磁性能;设计参数指的是微波无源器件的尺寸参数。本发明所述方法通过半监督学习提高数据集获取的效率,并训练可逆神经网络以学习微波无源器件设计目标与设计参数之间的关系。可逆神经网络可以依据设计目标生成设计候选值,设计候选值经过验证模块之后得到准确的设计参数。
[0155] 本发明实施例提供的一种微波无源器件的设计装置,包括:
[0156] 设计目标确定模块,用于确定待设计微波无源器件的设计目标,所述待设计微波无源器件为待改进性能的微波无源器件;
[0157] 设计参数范围确定模块,用于根据待设计微波无源器件的设计目标确定待设计微波无源器件的设计参数的允许范围,所述设计参数是微波无源器件的尺寸参数;
[0158] 设计参数样本集生成模块,用于采用拉丁超立方采样法对待设计微波无源器件的设计参数进行采样,分别生成初始设计参数样本集XI和扩展设计参数样本集XU;
[0159] 全波仿真计算模块,用于对初始设计参数样本集XI进行全波仿真计算,得到初始设计参数样本的散射参数,并从散射参数中提取出电磁特性数据集YI作为设计性能,得到初始设计数据集 = {XI,YI};
[0160] 测试误差计算模块,用于采用k‑fold交叉验证方法将初始设计数据集 分为训练集和测试集,训练正向的多层感知机神经网络 和高斯过程 ,并分别计算多层感知机神经网络 和高斯过程 的测试误差;
[0161] 测试误差判断模块,用于判断测试误差是否满足精度要求,如果不满足精度要求则利用拉丁超立方采样继续向初始设计参数样本集XI添加样本,否则进入下一步;
[0162] 设计性能预测模块,用于利用多层感知机神经网络 和高斯过程 分别预测扩展设计参数样本集XU的设计性能;
[0163] 扩展设计数据集确定模块,用于根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为扩展设计性能;将扩展设计性能及对应的扩展设计参数作为扩展设计数据集 ;
[0164] 可逆神经网络训练模块,用于利用初始设计数据集 和扩展设计数据集 训练可逆神经网络;
[0165] 最终设计参数确定模块,用于使用可逆神经网络根据设计目标生成设计候选值,并利用多层感知机神经网络和高斯过程进行测试验证,选择测试误差最小的设计候选值作为最终的设计参数。
[0166] 如图2和图3所示,本发明所述可逆神经网络由可逆块构成,可逆块由互耦仿射层i构成,可逆块的计算包含正向过程和逆向过程。令D维向量h 代表第i个可逆块正向过程输i+1 i
入,h 代表第i个可逆块的正向过程g (·)的输出,则有:
[0167]i
[0168] 正向过程g (·)的具体计算过程为先将 按照维度分为[ , ,再用下式计算:
[0169]
[0170] s(·)和t(·)由任意的神经网络构成,并且都是从d维到D‑d维的映射; 是元素乘积符号;
[0171] 可逆块的逆向过程为:
[0172]
[0173] 变量转换定理定义了hi+1到hi的概率分布变化:
[0174]
[0175] 其中det( )是gi( )的雅可比行列式。该雅可比行列式为:
[0176]
[0177] 其中Id是d×d的单位矩阵, 是对角线元素为 的对角矩阵。可以发现,雅可比行列式不需要计算s(·)和t(·)的导数,从而简化了可逆神经网络的计算。
[0178] 如果令h1=x以及hN= [y,z],其中z满足标准高斯分布,那么可逆神经网络可以将z的分布转化为条件概率分布p(x|y),从而使可逆神经网络能够在给定设计目标下依靠概率采样的方法得到多组设计候选值。
[0179] 确定待设计微波无源器件的设计目标以及设计参数的允许范围后;如图4所示,利用本发明所述装置进行微波无源器件的设计过程如下。
[0180] 步骤1:通过拉丁超立方对待设计微波无源器件的设计参数进行采样,分别生成m个设计参数样本XI= 和n个设计参数样本XU= 。拉丁超立方采样的方法能够有效反应样本空间的信息,通过拉丁超立方采样获得初始数据集和扩展数据集的设计参数,为后续建模坐铺垫。
[0181] 步骤2:通过全波仿真软件得到m个设计参数样本的散射参数,并从散射参数中提取出电磁特性YI= { },并将其作为设计性能。得到初始有设计性能数据集 = {XI,YI}。该步骤可以获得初始数据集,为步骤3正向建模提供了数据集。
[0182] 步骤3:基于 ,采用k‑fold交叉验证方法将 分为训练集和测试集训练正向的多层感知机神经网络 和高斯过程 ,计算多层感知机神经网络和高斯过程的测试误差。该步骤目的是为了训练出多层感知机神经网络和高斯过程作为正向模型,为步骤5扩展数据集和步骤9验证设计参数提供了依据。
[0183] 步骤4:如果测试误差不满足精度范围,则利用拉丁超立方采样继续向XI添加样本;如果满足精度要求,则转入步骤5。该步骤的目的是确保能够训练出精度符合要求的多层感知机神经网络和高斯过程,从而确保步骤6和步骤9的结果正确。
[0184] 步骤5:利用多层感知机神经网络和高斯过程分别预测n个设计参数样本的设计性能。采用下式得到设计性能:
[0185]
[0186] 该步骤的目的是得到步骤1中没有设计性能的设计参数的设计性能。
[0187] 步骤6:根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为样本设计性能。将其得到设计性能y及其对应的x作为扩展的数据集 。
[0188] 根据步骤3中得到多层感知机神经网络 和高斯过程 对应的测试集误差和 ,计算样本设计性能为:
[0189]
[0190] 该步骤目的是获得最终的扩展数据集,并确保数据集的精度。
[0191] 步骤7:基于 和 训练可逆神经网络。
[0192] 令hi代表第i个可逆块正向过程输入,hi+1代表第i个可逆块的正向过程gi(·)的输出,则有:
[0193]
[0194] 变量转换定理定义了hi+1到hi的概率分布变化:
[0195]
[0196] 其中det( )是gi( )的雅可比行列式。如果h1=x以及hN= [y,z],令z满足标准高斯分布,那么可逆神经网络相当于将z的分布转化为条件概率分布p(x|y),从而使可逆神经网络能够在给定电磁响应(y)下依靠概率采样的方法得到多组设计参数(x)。
[0197] 训练可逆神经网络参数 的方法具体为采用反向传播算法最小化可逆神经网络的损失函数,即
[0198]
[0199] 其中 为训练集设计参数, 为可逆神经网络逆向过程得到的设计参数,b为训练集大小, 为可逆神经网络正向过程针对训练集第i个设计参数得到的预测值, 为相应的真实值。 为先验分布, 为可逆神经网络正向过程的预测值,MMD为最大均值误差,假定数据分布 和 ,MMD的计算公式为:
[0200]
[0201] 为核函数,在本发明中选择为逆多二次径向基函数。其表达式为:
[0202]
[0203] 其中 为超参数,可通过网格搜索法得到。通过采用Adam算法优化可逆神经网络的损失函数,可以训练可逆神经网络参数 。当损失函数值收敛后,可将 可作为可逆神经网络的参数,得到 模型。
[0204] 该步骤的目的为训练出可逆神经网络,用于步骤8生成设计候选值。
[0205] 步骤8:使用可逆神经网络根据设计目标生成g个设计候选值。
[0206] 先基于高斯分布采样g个z,将采样的z和目标y作为可逆神经网络的输入,根据公式 输出g个设计候选值。
[0207] 该步骤的目的是得到多组设计候选值,以供步骤9筛选。
[0208] 步骤9:利用多层感知机神经网络和高斯过程验证:
[0209] 将步骤8中生成的g个设计候选值通过步骤3训练的多层感知机神经网络 和高斯过程 计算其电磁性能,并计算电磁性能与目标电磁性能的误差,即:
[0210]
[0211] 其中 和 为第j个设计候选值对应的多层感知机神经网络的输出和高斯过程的输出。
[0212] 选择误差最小的设计候选值作为最终的设计参数。
[0213] 上述步骤1‑步骤7可以训练出在给定的微波无源器件结构下,根据设计性能能够直接得到设计候选值的可逆神经网络和能够用于验证设计候选值的多层感知机神经网络与高斯过程。步骤8‑9为具体的如何用可逆神经网络和多层感知机神经网络与高斯过得到设计参数的方法。本发明的应用场景是固定结构的微波无源器件参数设计,根据不同的设计性能确定微波无源器件的设计参数,通过半监督学习提高数据集获取的效率,并训练可逆神经网络以学习微波无源器件设计目标与设计参数之间的关系;可逆神经网络依据设计目标生成设计候选值,设计候选值经过验证模块之后可以得到准确的设计参数。
[0214] 如图5所示,利用本发明所示方法设计一款腔体滤波器,图5中,L1,L2为腔体滤波器的谐振腔的长度,W1,W2为谐振腔之间的间距,a和b为波导的长和宽,需要固定,本例中使用WR‑75波导,a为19.05mm,b为9.525mm;t为谐振腔的宽度,该滤腔体滤波器包含四个设计参数 ;设计性能指标为带宽11.85‑12.15 GHz,回波损耗S11在带宽内最大值为‑20dB。该腔体滤波器的设计步骤如下:
[0215] 步骤a1:运用拉丁超立方采样将 分成10层,生成160组初始设计参数 ,和600组扩展设计参数 。其中,L1的范围为12‑18mm,L2的范围是12‑18mm,W1的范围是6‑12mm,W2的范围是6‑12mm,t的范围是1‑3mm。
[0216] 步骤a2:通过全波仿真软件得到设计参数 对应的散射参数并提取出工作带宽对应的上截止频率、下截止频率和回波损耗(S11)在工作频段最大值作为设计指标,得到数据集的设计性能 ,进而得到初始数据集 。
[0217] 步骤a3:基于 ,采用k‑fold交叉验证方法训练多层感知机神经网络和高斯过程模型,计算多层感知机神经网络和高斯过程的测试误差。
[0218] 步骤a4:若测试误差不满足精度范围,则利用拉丁超立方采样继续向 添加样本;若精度满足要求,则转向步骤a5。该具体实施例中,初始数据集已可以训练出符合精度的多层感知机神经网络和高斯过程,故不需要额外添加样本。
[0219] 步骤a5:利用训练好的多层感知机神经网络和高斯过程模型预测扩展设计参数的工作带宽对应的上截止频率、下截止频率和回波损耗(S11)最大值。
[0220] 步骤a6:根据多层感知机神经网络和高斯过程的建模精度作为权重,选取其预测值的加权平均数作为样本设计性能。将其得到设计性能y及其对应的x作为扩展的数据集。
[0221] 步骤a7:基于 和 训练可逆神经网络。
[0222] 步骤a8:基于给定的目标设计性能 ,从高斯分布中随机采样100组z,将y和z作为可逆神经网络的输入,得到100组设计候选值。使用本发明所提出方法得到的设计参数对应的设计性能和目标设计性能如图6所示,图6中,虚线为设计目标,实线为所提方法给出的设计性能。
[0223] 步骤a9:利用多层感知机神经网络和高斯过程验证,选择误差最小的设计候选值作为最终的设计参数。
[0224] 使用多层感知机神经网络进行逆建模的精度与所提方法的精度对比如表1所示,[0225] 表1:
[0226]
[0227] 具体对比方法为计算各自方法所得设计参数的设计性能与目标设计性能的均方误差。值得注意的是,本发明所示方法的均方误差计算方式为计算设计候选值对应设计性能与目标性能的均方误差,而非最终验证后得到设计参数对应设计性能与目标性能的均方误差。
[0228] 本发明将可逆神经网络引入微波无源器件的逆建模,解决了逆建模中存在的一对多问题,从而提高了逆建模的精度。本发明将微波无源器件的设计问题转化为逆建模问题,即将设计目标看作模型的输入,设计参数看作模型的输出,通过模型直接从设计目标得到设计参数。逆建模中存在一对多问题,即相同设计性能对应多组设计参数,传统建模方法会遇到阻碍。如果采用公开号为CN109284541A、专利名称为《一种用于微波无源器件的神经网络多物理建模方法》的专利中多层感知机神经网络进行逆建模,由于其建模过程是使神经网络预测值与真实值间误差最小,当存在一对多问题时,多层感知机神经网络的输出值会是设计性能对应的多组设计参数的平均值,从而造成很大的误差。本发明采用可逆神经网络,通过学习微波无源器件的给定设计性能下设计参数的分布,通过概率采样的方法生成设计参数,从而能够提供多组参数,可以智能地解决逆建模中的一对多问题,从而提高了逆建模的精度。
[0229] 本发明将半监督学习方法引入来提高生成数据集的效率。传统获取数据集的方法为使用随机生成设计参数的方式,并将所有设计参数带入到全波仿真软件进行计算,来获得对应的电磁性能,即设计性能值。由于全波仿真时间较长,因此获取设计参数对应的设计性能较为缓慢。而本发明采用正向模型为逆建模提供数据集,具体为利用从全波仿真软件获得的小样本数据集训练出多层感知机神经网络和高斯过程作为正向模型,然后利用正向模型预测更多无设计性能数据的设计性能,即预测设计参数的设计性能,从而为逆建模提供更大的数据集。本发明通过半监督学习方法获得数据集,明显减少了时间,从而提高了生成数据集的效率。
[0230] 本发明提出了验证设计参数方法。传统的验证需要将设计参数送入全波仿真软件进行验证,较为耗时。而本发明运用之前训练好的多层感知机神经网络和高斯过程作为正向模型,将可逆神经网络生成的参数送入两个正向模型进行交叉验证,从而提高了验证效率和精度。
[0231] 本发明训练出在给定的微波无源器件结构下,根据设计性能能够直接得到设计候选值的可逆神经网络和能够用于验证设计候选值的多层感知机神经网络与高斯过程。
[0232] 最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。