基于深度学习的纳米天线阵列电磁性能预测方法转让专利

申请号 : CN202110658416.2

文献号 : CN113705031B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王树龙马兰段小玲王国生刘晨钰赵蓉吴介豫

申请人 : 西安电子科技大学

摘要 :

本发明属于光电器件与人工智能技术领域,具体公开了一种基于深度学习的纳米天线阵列电磁性能预测方法,本发明利用传统的机器学习来自行建立超表面性能预测模型,对纳米天线阵列超表面的电磁性能即散射截面积进行精准预测,建立了纳米天线阵列的结构参数与电磁性能之间的映射关系,从而利用网络的推断能力和计算力来解决纳米天线阵列设计过程中费时费力的问题,有望突破纳米光学领域中器件设计的问题,也为工程师带来便利。

权利要求 :

1.基于深度学习的纳米天线阵列电磁性能预测方法,其特征在于,包括以下步骤:步骤1,确定纳米天线阵列的结构设计参数和电磁性能参数;获取多组已设计完成的纳米天线阵列数据作为待训练数据,构建训练样本集;

其中,所述结构设计参数包含纳米天线阵列中纳米棒的长、宽、高和波长,所述电磁性能参数为散射截面积;所述纳米天线阵列数据包含纳米棒的长、宽、高、波长和散射截面积;

步骤2,构建深度神经网络预测模型,所述深度神经网络预测模型包含线性扩展模块、深度空洞卷积模块、卷积模块和全连接模块;所述线性扩展模块用于将输入数据拓展到更高维度;所述深度空洞卷积模块用于对高纬度数据进行不同尺度的特征提取,所述全连接模块用于对变量之间的相互依赖关系进行回归处理;

步骤3,采用训练样本集对深度神经网络预测模型进行训练,利用损失函数对预测模型的网络参数进行迭代更新,得到训练完成的预测模型;

步骤4,给定待预测纳米天线阵列的结构设计参数,并将其输入训练完成的预测模型,输出待预测纳米天线阵列的散射截面积预测值。

2.根据权利要求1所述的基于深度学习的纳米天线阵列电磁性能预测方法,其特征在于,步骤1中,所述待训练数据的获取过程为:利用软件的波动光学模块进行有限元数值模拟,仿真纳米天线阵列结构,并通过对纳米天线的散射横截面进行归一化来计算纳米棒的散射效率;通过改变纳米棒的长、宽、高,从而得到多组散射截面积数据。

3.根据权利要求2所述的基于深度学习的纳米天线阵列电磁性能预测方法,其特征在于,所述纳米棒的长度的取值范围为200‑290nm之间,取值间隔10nm;其宽度的取值范围为

20‑70nm,取值间隔为10nm;其高度的取值范围为20‑60nm,取值间隔10nm。

4.根据权利要求1所述的基于深度学习的纳米天线阵列电磁性能预测方法,其特征在于,所述线性扩展模块包含多个依次级联的线性扩展层,每个线性扩展层由线性化层、归一化层和Mish激活函数组成;

所述深度空洞卷积模块包含多个依次级联的深度卷积单元,每个深度卷积单元包含相互并列的空洞卷积层和深度可分离卷积单元,所述深度可分离卷积单元由点卷积层、深度可分离卷积层、点卷积层和卷积层组成,每个网络层的后面都加入归一化层和Mish激活函数;

所述全连接模块由多个全连接层组成。

5.根据权利要求1所述的基于深度学习的纳米天线阵列电磁性能预测方法,其特征在于,所述深度神经网络预测模型还包含dropout模块,所述dropout模块位于全连接模块之前。

6.根据权利要求1所述的基于深度学习的纳米天线阵列电磁性能预测方法,其特征在于,所述采用训练样本集对深度神经网络预测模型进行训练,具体过程为:

3.1,对所述深度神经网络预测模型的网络参数进行随机初始化;

3.2,将纳米天线阵列中纳米棒的长、宽、高、波长和波长的平方作为一组数据输入初始化网络参数的深度神经网络预测模型;

3.3,通过计算每批次训练的损失函数,反向传播优化网络参数,采用ADAM优化器优化网络参数,直至模型收敛,得到训练完成的预测模型。

7.根据权利要求6所述的基于深度学习的纳米天线阵列电磁性能预测方法,其特征在于,所述损失函数的计算公式为:其中,N是训练样本集中的样本个数,R′为预测值,R为标签。

说明书 :

基于深度学习的纳米天线阵列电磁性能预测方法

技术领域

[0001] 本发明涉及光电器件与人工智能技术领域,尤其涉及一种基于深度学习的纳米天线阵列电磁性能预测方法,可用于工程设计中。

背景技术

[0002] 纳米天线是目前科学界的热门话题之一,它们能够突破衍射极限将电磁能存储在微小结构中并与光强烈地相互作用。传统天线需要采用机械扫描的方式对目标进行探测和定位,波束的偏转也需要机械转动装置的辅助。纳米天线是利用超表面控制波前相位和振幅进行波束调控,突破了传统探索相位累计效应实现波束偏转的机理。但是纳米天线器件结构设计是需要仿真软件进行多次迭代后确定最优解,此过程耗时且计算量过大。再次如何解决天线结构设计的问题显得尤为重要。
[0003] 深度学习作为机器学习领域最重要的技术,能够模拟人脑进行分析和学习。传统方法需要人工设计特征提取器,而这需要丰富的经验与基础知识且人工很难完全提取出数据中所包含的信息。而深度学习的方法可以根据数据自动提取特征,免除了高昂的入门成本及人为因素的干扰。在图像处理,自动驾驶,医疗健康诊断等方面,机器学习和深度学习都已经在预测和聚类等方面取得良好的结果。这些过程的基本思想是:根据一组以往的数据,通过算法找到输入和输出之间的非线性关系,映射完成后,给模型添加一个新的输入,便可以自动快速地预测其输出。依靠神经网络的学习能力,深度学习在材料设计、筛选和器件性能预测等领域拥有强大的潜力。

发明内容

[0004] 针对现有技术存在的问题,本发明的目的在于提供一种基于深度学习的纳米天线阵列电磁性能预测方法,使用深度学习方法建立纳米天线结构与其电磁特征散射截面之间的关系,找到相应的复杂关联或映射关系,用于解决纳米天线阵列设计过程中费时费力的问题。
[0005] 为了达到上述目的,本发明采用以下技术方案予以实现。
[0006] 基于深度学习的纳米天线阵列电磁性能预测方法,包括以下步骤:
[0007] 步骤1,确定纳米天线阵列的结构设计参数和电磁性能参数;获取多组已设计完成的纳米天线阵列数据作为待训练数据,构建训练样本集;
[0008] 其中,所述结构设计参数包含纳米天线阵列中纳米棒的长、宽、高和波长,所述电磁性能参数为散射截面积;所述纳米天线阵列数据包含纳米棒的长、宽、高、波长和散射截面积;每个训练样本包含纳米棒的长、宽、高、波长和波长的平方,标签为对应的散射截面积;
[0009] 步骤2,构建深度神经网络预测模型,所述深度神经网络预测模型包含线性扩展模块、深度空洞卷积模块、卷积模块和全连接模块;所述线性扩展模块用于将输入数据拓展到更高维度;所述深度空洞卷积模块用于对高纬度数据进行不同尺度的特征提取,所述全连接模块用于对变量之间的相互依赖关系进行回归处理;
[0010] 步骤3,采用训练样本集对深度神经网络预测模型进行训练,利用损失函数对预测模型的网络参数进行迭代更新,得到训练完成的预测模型;
[0011] 步骤4,给定待预测纳米天线阵列的结构设计参数,并将其输入训练完成的预测模型,输出待预测纳米天线阵列的散射截面积预测值。
[0012] 与现有技术相比,本发明的有益效果为:
[0013] 本发明利用传统的机器学习来自行建立超表面性能预测模型,对纳米天线阵列超表面的电磁性能即散射截面积进行精准预测,建立了纳米天线阵列的结构参数与电磁性能之间的映射关系,从而利用网络的推断能力和计算力来解决纳米天线阵列设计过程中费时费力的问题,有望突破纳米光学领域中器件设计的问题,也为工程师带来便利。

附图说明

[0014] 下面结合附图和具体实施例对本发明做进一步详细说明。
[0015] 图1是本发明实施例的金相控阵天线的结构示意图;
[0016] 图2(a)仿真中最小单元结构示意图。
[0017] 图2(b)绘制纳米天线长度为200nm,220nm,240nm,260nm,280nm 时仿真得到的散射截面的值;
[0018] 图2(c)绘制纳米天线宽度为30nm,40nm,50nm,60nm时仿真得到的散射截面的值;
[0019] 图2(d)绘制纳米天线宽度为20nm,30nm,40nm,50nm时仿真得到的散射截面的值;
[0020] 图3是本发明的深度神经网络预测模型架构图;
[0021] 图4是本发明的深度神经网络预测模型处理流程图;
[0022] 图5是本发明的预测结果图;
[0023] 图6是采用传统机器学习和本发明的预测误差结果比对图。

具体实施方式

[0024] 下面将结合实施例对本发明的实施方案进行详细描述,但是本领域的技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。
[0025] 本发明提供了一种基于深度学习的纳米天线阵列电磁性能预测方法,包括以下步骤:
[0026] 步骤1,确定纳米天线阵列的结构设计参数和电磁性能参数;获取多组已设计完成的纳米天线阵列数据作为待训练数据,构建训练样本集;
[0027] 其中,所述结构设计参数包含纳米天线阵列中纳米棒的长、宽、高和波长,所述电磁性能参数为散射截面积;所述纳米天线阵列数据包含纳米棒的长、宽、高、波长和散射截面积;每个训练样本包含纳米棒的长、宽、高、波长和波长的平方,标签为对应的散射截面积;
[0028] 本发明利用COMSOL Multiphysics 5.4软件的波动光学模块进行有限元数值模拟,仿真纳米天线阵列结构,并通过对纳米天线的散射横截面进行归一化来计算棒的散射效率。通过改变纳米棒的长、宽、高,从而得到多组散射截面积数据,以便用于深度学习之中。本实施例以基于超表面金纳米棒的纳米天线阵列为例进行试验,其天线阵列结构如图1所示,具体待训练数据获取过程为:
[0029] 1.1,在软件中搭建的器件结构:器件基板是玻璃材料(折射率=1.5),其上是长、宽、高以及间距可变的金纳米棒,纳米棒上方被空气包围(折射率=1);
[0030] 1.2,用于仿真的金的介电常数根据Drude模型公式计算得到,具体公式为:
[0031]
[0032] 其中,ωp为等离子频率;r代表吸收损耗的金属损耗因子,ω为角速度。在这里金‑1 ‑1的参数分别为,ωp=1.37e16[s ];r=1.215e14[s ];ω=2* ∏*f;f=V/λ(其中f为频率,V为光速,λ为波长).在不同λ下,计算得到相应的ε)。
[0033] 1.3,设置电磁波、频域物理场,选择不包含纳米棒的区域先计算散射场。其中,仿真需要在上下界面添加两个端口。其中下表面的端口用于定义入射平面波,同时吸收镜面反射的反射波。另外一个端口用于吸收基板透射的平面波。侧边界具有周期性弗洛凯条件,有效地将模型转换为在xy平面中无限延伸的几何结构的一部分;
[0034] 1.4,设置第二个电磁波,频域接口引入金纳米颗粒作为散射体,并在几何结构周围使用完美匹配层。利用在第一个接口中获得的散射长作为背景场,仅需要在PML(完美匹配层)中吸收散射场。
[0035] 1.5,为了使模型收敛,网格的划分是必要的,定义最大网格单元大小为材料波长的六分之一的网格。在纳米棒中,划分43nm的网格。此外,由于侧边界设置了周期性条件,因此对应的两个面需要划分相同的网格。完美匹配层最好采用至少有六个单元的扫掠网格。
[0036] 1.6,在软件中进行散射截面的计算,计算公式为:
[0037]
[0038] 其中,n是纳米天线的法向量,方向指向外部,SSC散射强度坡印亭矢量,I0是入射强度。
[0039] 1.7,通过改变纳米棒的长、宽、高,从而得到多组散射数据以便用于深度学习中。(长度的取值范围为200‑290nm之间,取值间隔10nm;宽度的取值范围为20‑70nm,取值间隔为10nm;高度的取值范围为20‑60nm,取值间隔10nm。具体试验结果如图2(b)、2(c)、2(d)所示。
[0040] 步骤2,构建深度神经网络预测模型,所述深度神经网络预测模型包含依次连接的线性扩展模块、深度空洞卷积模块和全连接模块;所述线性扩展模块用于将输入数据拓展到更高维度;所述深度空洞卷积模块用于对高纬度数据进行不同尺度的特征提取,所述全连接模块用于对变量之间的相互依赖关系进行回归处理;
[0041] 本发明利用pytorch编写神经网络结构,如图3和图4所示,具体地:
[0042] 2.1,所述线性扩展模块包含多个依次级联的线性扩展层,每个线性扩展层由线性化层、归一化层和Mish激活函数组成。本实施例的线性扩展模块包含三层线性扩展层,以便于将数据拓展到更高维度以便提取更多的特征;
[0043] 2.2,模拟resnet(深度残差网络)构造分支结构,所述深度空洞卷积模块包含多个依次级联的深度卷积单元,每个深度卷积单元包含相互并列的空洞卷积层和深度可分离卷积单元,所述深度可分离卷积单元由点卷积层、深度可分离卷积层、点卷积层和卷积层组成,每个网络层的后面都加入归一化层和Mish激活函数。
[0044] 本实施例中,构建1*3点卷积和空洞卷积的方式,并在结尾后使用Mish 激活函数;目的是为了先采用点卷积扩大通道数量,升高维度,增强数据的特征;在点卷积后,使用3*3的深度可分离卷积添加Mish激活函数进行特征提取,获得更好的特征质量;再利用点卷积添加Mish激活函数,进行信息综合并降低维度以实现高效计算;与此同时,用空洞卷积代替残差块以提取不同尺度的特征且不会过多增加计算量。来自卷积部分的特征被馈送到由两个全连接层组成的全连接模块,对变量之间的相互依赖关系进行回归处理。网络中每一层都使用Mish激活函数,Mish激活函数平滑且无边界的特点避免了死神经元的产生Mish=X*X
tanh(ln(1+e));X为每层处理后的数据;
[0045] 在全连接模块前加入dropout模块,防止过拟合。
[0046] 步骤3,采用训练样本集对深度神经网络预测模型进行训练,利用损失函数对预测模型的网络参数进行迭代更新,得到训练完成的预测模型;
[0047] 3.1,对所述深度神经网络预测模型的网络参数进行随机初始化;
[0048] 3.2,将纳米天线阵列中纳米棒的长、宽、高、波长和波长的平方作为一组数据输入初始化网络参数的深度神经网络预测模型;
[0049] 3.3,通过计算每批次训练的损失函数,反向传播优化网络参数,采用ADAM优化器优化网络参数,直至模型收敛,得到训练完成的预测模型。
[0050] 损失函数计算公式为:
[0051]
[0052] 其中,N是训练样本集中的样本个数,R′为预测值,R为标签。
[0053] 本发明中,在网络构建完成后,将1400组待训练数据划分为训练样本和测试样本,其中,984组数据作为训练样本集,随机选择416组数据进行测试。网络的输入变量为:纳米天线的长,宽,高,波长。输出为:散射截面积;
[0054] 对网络进行第一次训练后,结果显示:在网络拟合的情况下,测试集中仅有159个数据的误差小于0.02,测试集中所有数据的MSE的标准差为0.164;
[0055] 本发明采用了优化的损失函数,训练后在拟合的情况下,最终只有一个数据的MSE大于0.02,并且数据的标准差也降低到0.0344。
[0056] 在观察到器件的长宽高与波长分别成二次函数关系后,另外在初始网络的基础2
上,对输入数据进行拓展,添加变量λ,在调试网络的过程中,网络始终过拟合,最终的有
137个数据的误差小于0.02,数据的标准差也增加到0.2716。进一步地,对于初始网络添加dropout模块,防止过拟合,训练后343 个数据的误差小于0.02MSE标准差也略减小为
0.1017。结果如图5所示,通过图5的直方图也可以直接看出,100%的误差都低于0.9%。比较好的完成了器件的预测。
[0057] 表1对预测模型逐步优化过程中的测试结果
[0058]
[0059] 表1中,初始为未优化之前的测试结果,损失函数表示优化损失函数后的训练结果,特征扩展为添加波长平方作为输入数据后的测试结果,dropout 为添加dropout模块后的测试结果,所有表示包括以上所有优化手段后的测试结果,即本发明的最优模型结构。从表1可以看出,本发明的最优模型结构的测试准确度非常高,且稳定性好。
[0060] 通过对网络逐个的优化后,最终网络可以拟合,并且所有数据的MSE均小于0.02,标准差也减小到0.00049。确定最终的网络。
[0061] 步骤4,给定待预测纳米天线阵列的结构设计参数,并结合波长和波长平方输入训练完成的预测模型,输出待预测纳米天线阵列的散射截面积预测值。
[0062] 模型的输入数据为纳米棒的长、宽、高、波长和波长的平方,输出为丹参截面积。在纳米天线阵列的设计过程中,通过不同的结构设计参数组合就可以预测相应的电磁性能,大大缩短纳米天线阵列的设计时间和耗费精力,具有巨大的工程实际应用价值。
[0063] 使用传统的机器学习方法和本发明对数据进行训练,传统的机器学习方法包括随机森林,支持向量机(SVM)和KNN,结果如图6和表2所示。
[0064] 表2为传统机器学习和本发明方法的测试结果
[0065]
[0066] 从图6可以看出,传统机器学习效果不仅误差大而且误差值分布范围较大。本发明的DNN模型预测数据的平均相对误差值为0.004。从表2可以看出,本发明的标准差为0.00049,较传统机器学习方法提高了几个数量级,说明该预测模型的稳定性好,可以准确预测设备性能。综上所述,DNN具有更大的应用价值,这也是深度学习在光学器件预测性能领域的突破。
[0067] 虽然,本说明书中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。