一种基于神经网络的光谱响应设计方法转让专利
申请号 : CN202010332612.6
文献号 : CN111551252B
文献日 : 2021-08-17
发明人 : 郝翔 , 宋洪亚 , 张文屹 , 刘旭
申请人 : 浙江大学 , 舜宇光学(浙江)研究院有限公司
摘要 :
权利要求 :
1.一种基于神经网络的光谱响应设计方法,其特征在于,该方法包括以下步骤:(1)确定目标光谱的光谱通道数N以及光谱调制器的个数M;
(2)构建光谱感知网络;所述光谱感知网络的第一层为输入单元数为N,输出单元数为M的线性连接层,该线性连接层为硬件层;根据神经网络线性连接层的数学特性,硬件层描述了M个光谱调制器对输入的目标光谱的调制过程,即硬件层的第i(i=1,2,…,N)个输入单元与第j(j=1,2,…,M)个输出单元之间的权重项wji表示第j个光谱调制器在第i个光谱通道处的光谱响应值,第j个输出单元的响应值代表目标光谱经过第j个光谱调制器后探测器的响应;硬件层之后为若干神经网络连接层,负责对硬件层的输出响应值做进一步处理,以使整个光谱感知网络实现光谱重构和光谱识别;
(3)构建正向预测网络;所述正向预测网络的输入单元数为P,对应于P个控制光谱调制器光谱响应的物理参数;输出单元数为N,对应于光谱调制器在N个光谱通道处的响应值;训练正向预测网络,以达到根据物理参数预测光谱响应的功能;
(4)向所述光谱感知网络中添加一组参数pjk(j=1,2,…,M;k=1,2,…,P),表示控制第j个光谱调制器光谱响应的第k个物理参数;硬件层的权重项wji由参数pjk输入至正向预测网络生成,对wji的初始化和更新即转化为对物理参数pjk的初始化和更新;
(5)训练光谱感知网络;将所述光谱感知网络的硬件层的所有偏置项bj(j=1,2,…,M)设置为0且在训练过程中不进行更新,选择已知的光谱数据集对光谱感知网络进行训练,不断更新参数pjk;当训练过程完成后,所得的参数pj1,pj2,…,pjP即为优化得到的第j个光谱调制器的设计参数,将其输入到正向预测网络,得到的权重值wj1,wj2,…,wjN即为第j个光谱调制器的光谱响应曲线。
2.根据权利要求1所述的一种基于神经网络的光谱响应设计方法,其特征在于,所述步骤(1)中,所述光谱通道数N的计算公式如下:N=(λmax‑λmin)/Δλ
其中,λmin、λmax分别为目标光谱波长的最小值和最大值,Δλ为光谱分辨率。
3.根据权利要求1所述的一种基于神经网络的光谱响应设计方法,其特征在于,所述步骤(2)中,所述神经网络连接层为软件层;各软件层的结构和单元数由设计者根据具体应用场景确定,以实现对光谱信号的重构、分类或识别;根据对应的功能确定用于训练光谱感知网络的损失函数。
说明书 :
一种基于神经网络的光谱响应设计方法
技术领域
像、农业农产品检测以及卫生医药与健康领域。
背景技术
活。近年来,随着压缩感知和机器学习等软件算法被引入光谱检测中,大批的计算型光谱探
测技术涌现出来,从而有希望改善传统光谱仪的这些缺点。传统光谱探测设备分辨率的提
高依赖于窄带滤光片的个数或者色散元件的色散能力,而计算型光谱探测设备由于对滤光
片等光谱调制器的光谱曲线进行了优化设计,通过使用算法重构出光谱,可以使光谱通道
数大于光谱调制器的个数,大大降低设备的体积、重量、复杂程度以及成本。
计算型光谱探测技术一般是根据压缩感知原理进行设计。根据压缩感知原理,如果光谱信
号为稀疏信号,那么可以使用满足独立同分布的随机矩阵作为测量矩阵。然而现实中的光
谱调制器(滤光片、宽谱光源等)光谱响应曲线都具有一定的连续性和光滑性,不可能严格
满足随机分布。另一方面,满足某种统计学分布规律的数值组合有很多种,仅用这一条原则
来生成光谱响应曲线,并不能得出确定的最优解,而不同的优化结果之间也往往无法定量
评估孰优孰劣。
制器件多种多样,包括光学薄膜滤光片、量子点滤光片、光子晶体、超表面微纳器件等等。这
些器件中,光学薄膜的反向设计工艺较为成熟,但由于其光谱响应对膜层厚度极其敏感,加
工时微小的误差可能引起光谱曲线的巨大改变;而诸如微纳器件、量子点等新材料的反向
设计尚不成熟,设计效果依赖于设计者的经验。现有对光谱调制器的设计方法大都为基于
选择的设计,即在给定的光谱调制器集合中选择出光谱响应最符合设计要求的一组作为最
优设计。虽然这种方法可以定量评估最优性,但这种方法无法保证所选择的光谱响应曲线
集合能够覆盖所有可能的设计,从而很难进一步优化系统的表现。
度学习方法可以通过设定具体的损失函数实现优化效果的定量评估,从而优化出一组目标
光谱响应曲线。但是由于器件反向设计较为困难,实际中很难设计出具有目标光谱响应的
光谱调制器,人们仍然只能依靠设计经验向曲线的优化过程添加限制条件,以使器件便于
设计。这就极大地降低了优化的自由度,从而降低了优化效果。虽然近期也出现了利用深度
学习进行反向设计的尝试,但是其稳定性还需提高。基于深度学习的反向设计网络很难达
到正向预测网络的拟合精度。
发明内容
的训练方法,可以实现对光谱调制器光谱响应曲线的优化。同时训练一个高拟合精度的正
向预测网络,将此网络的输出作为所述线性连接层的权重,则权重的更新依赖于正向预测
网络输入参数的变化,在对光谱响应曲线优化的同时实现了光谱调制器的硬件设计。由于
神经网络训练过程中的损失函数对训练目标做出了明确的定义,所以能够避免对光谱响应
曲线集合完备性的依赖,更易于评估优化结果的最优性。由于本发明采用正向预测网络对
优化过程中的权重更新进行限制,从而可以直接得出易于物理实现的硬件设计参数。而且
整个流程中只使用了高精度的正向预测网络而未采用反向设计网络,提高了设计精度。本
发明最可终用于光谱识别、光谱探测以及光谱成像等应用。
层描述了M个光谱调制器对输入的目标光谱的调制过程,即硬件层的第i(i=1,2,…,N)个
输入单元与第j(j=1,2,…,M)个输出单元之间的权重项wji表示第j个光谱调制器在第i个
光谱通道处的光谱响应值,第j个输出单元的响应值代表目标光谱经过第j个光谱调制器后
探测器的响应;硬件层之后为若干神经网络连接层,负责对硬件层的输出响应值做进一步
处理,以使整个光谱感知网络实现光谱重构、光谱识别等特定功能。
值;训练正向预测网络,以达到根据物理参数预测光谱响应的功能。
预测网络生成,对wji的初始化和更新即转化为对物理参数pjk的初始化和更新。
训练,不断更新参数pjk;当训练过程完成后,所得的参数pj1,pj2,…,pjP即为优化得到的第j
个光谱调制器的设计参数,将其输入到正向预测网络,得到的权重值wj1,wj2,…,wjN即为第j
个光谱调制器的光谱响应曲线。
理功能;根据对应的功能确定用于训练光谱感知网络的损失函数。
光谱响应无法定量评估的问题。
结果欠佳。
附图说明
具体实施方式
=1,2,…,N)个输入单元与第j(j=1,2,…,M)个输出单元之间的权重项wji代表第j个光谱
调制器在第i个光谱通道处的光谱响应值。
功能。根据对应的功能确定用于训练光谱感知网络的损失函数。
在N个光谱通道处的响应值。训练正向预测网络,以达到根据物理参数预测光谱响应的功
能。
入至正向预测网络生成,对wji的初始化和更新即转化为对pjk的初始化和更新。
数pjk。当训练过程完成时,参数pj1,pj2,…,pjP即为针对该光谱数据集优化得到的第j个光谱
调制器的设计参数。将参数pj1,pj2,…,pjP输入到正向预测网络得到的权重值wj1,wj2,…,wjN
即为优化得到的第j个光谱调制器的光谱响应曲线。
谱调制装置后,探测器所获得的该点光谱强度信号Ij可表示为
式可用矩阵的形式写为
接权重wji(如图2所示)。而这M个光谱调制器的输出值I1,I2,…,IM可以继续作为一个输入单
元数为M的神经网络的输入,从而实现光谱探测、光谱分类、光谱识别等光谱感知功能。对这
个光谱感知网络进行训练即可得到优化的光谱响应Sji(wji)。
函数中添加对wji的正则化项,以使wji符合某种要求(如非负、光滑等)。但是由于正则化项
一般很难描述复杂的物理规律,使用这种方法训练生成的光谱响应可能难以被设计实现。
而过度严格的正则化则容易使优化效果变差,错过找到物理上最优解的机会。
利用神经网络的这一特点,可以提前训练好一个正向预测网络,其输入参数即为满足物理
条件和加工要求的物理参数,输出为对应的光谱响应。在训练光谱感知网络时,将光谱响应
参数wji链接到正向预测网络的输出,对wji的初始化和更新即转化为对正向预测网络输入
参数的初始化和更新。这样就相当于添加了使wji符合物理规律和加工要求的限制条件,避
免了设计所得的光谱调制器件难以达到所需光谱的情况。同时由于神经网络可以方便地通
过反向传播来传递误差,加入正向传播网络限制后的光谱感知网络的训练速度并不会有明
显降低,这对于一些仿真过程极为耗时的器件设计(如光子晶体、超表面等)来说有巨大的
优势。
件层的第i(i=1,2,…,N)个输入单元与第j(j=1,2,…,M)个输出单元之间的权重wji代表
第j个光谱调制器在第i个光谱通道处的响应值Sji。由于硬件层的权重项对应于光谱响应值
而偏置项没有对应的物理意义,故需将硬件层的所有偏置项bj(j=1,2,…,M)设置为0,且
在训练过程中不进行更新。在硬件层之后设置若干层神经网络,称为软件网络。软件网络的
输出单元数可根据需要实现的不同功能设置为不同的数目(如光谱探测应设置为重构光谱
通道数,光谱分类应设置为光谱类别数等)。软件网络各层的结构、单元数、层数均可以灵活
设计以实现更好的拟合效果。
个光谱通道处的响应值。训练正向预测网络,以达到根据物理参数预测光谱响应的功能。
至正向预测网络生成,对wji的初始化和更新即转化为对pjk的初始化和更新。光谱感知网络
的训练过程示意图如图3所示。
参数。将参数pj1,pj2,…,pjP输入到正向预测网络得到的权重值wj1,wj2,…,wjN即为优化得到
的第j个光谱调制器的光谱响应曲线。
计出的光谱调制器光谱响应即为优化得到的光谱响应曲线。将光线经每个光谱调制器调制
后的强度值输入到训练得到的软件网络,即可实现对光谱的探测、分类或识别等功能。
数M=50。
(i=1,2,…,300)个输入单元与第j(j=1,2,…,50)个输出单元之间的权重项wji代表第j个
滤光片在第i个光谱通道处的光谱响应值。
设置3组线性连接层(Fully Connected Layer)、批归一化层(Batch Normalization
Layer)以及修正线性单元(Rectified Linear Unit),其中线性连接层的输出单元数目分
别为1000、1000、300。其输出数据为光谱曲线,整个光谱感知网络的功能是光谱探测。其损
失函数为输入光谱曲线与输出光谱曲线的均方误差。
处的响应值。训练正向预测网络,以达到根据膜层厚度预测滤光片光谱响应的功能。
向预测网络生成,对wji的初始化和更新即转化为对pjk的初始化和更新。
数据集。对光谱感知网络进行训练,不断更新参数pjk。当训练过程完成时,参数pj1,pj2,…,
pjP即为针对该光谱数据集优化得到的第j个滤光片的膜系厚度。将参数pj1,pj2,…,pjP输入
到正向预测网络得到的权重值wj1,wj2,…,wjN即为优化得到的第j个滤光片的光谱响应曲
线。
输入至训练后的软件层网络,即可重构得到光谱数据。该设备可以进一步应用于农产品检
测等光谱分析领域。
=16。
个输入单元与第j(j=1,2,…,16)个输出单元之间的权重wji代表第j个光谱调制器在第i个
光谱通道处的响应值。
Layer)、批归一化层(Batch Normalization Layer)以及泄漏修正线性单元(Leaky
Rectified Linear Unit),其中线性连接层的输出单元数目分别为500、800、800、200、20。
其输出数据为光谱类别,整个光谱感知网络的功能是光谱分类。其损失函数为输出光谱类
别标签与光谱数据标签的交叉熵。
200,对应于光谱调制器在200个光谱通道处的响应值。训练正向预测网络,以达到根据微纳
结构参数预测光谱响应的功能。
pjk输入至正向预测网络生成,对wji的初始化和更新即转化为对pjk的初始化和更新。
络进行训练,不断更新参数pjk。当训练过程完成时,参数pj1,pj2,…,pjP即为针对该光谱数据
集优化得到的第j个光谱调制器的微纳结构参数。将参数pj1,pj2,…,pjP输入到正向预测网
络得到的权重值wj1,wj2,…,wjN即为优化得到的第j个光谱调制器的光谱响应曲线。
将这些数字信号输入至训练后的软件层网络,即可得到光谱分类数据。该设备可以进一步
应用于农产品检测、识别等光谱分析领域。