基于卷积神经网络模型的太阳耀斑预报方法转让专利

申请号 : CN201510727599.3

文献号 : CN105372723B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 黄鑫王华宁戴幸华

申请人 : 中国科学院国家天文台

摘要 :

本发明公开了一种基于卷积神经网络模型的太阳耀斑预报方法,该预报方法包括:A、活动区原始观测数据的准备步骤;B、建立深度预报模型,采用卷积神经网络从观测数据中提取特征,并预报该活动区是否产生太阳耀斑。采用本发明的方法,能够直接将观测的原始数据作为该模型的输入,利用深度神经网络强大的学习能力,自动地从原始数据中提取用于太阳耀斑预报的预报因子,并建立相应的预报模型,从而利用其达到理想的预报能力。

权利要求 :

1.一种基于卷积神经网络模型的太阳耀斑预报方法,其特征在于,该预报方法包括:A、活动区原始观测数据的准备步骤;

B、建立深度预报模型,采用卷积神经网络从观测数据中提取特征,并预报该活动区是否产生太阳耀斑;

步骤A前进一步包括提取活动区的参量以刻画活动区的特性的步骤;

所述步骤A具体包括:

A1、获取太阳活动区的原始数据,即SOHO/MDI全日面纵向磁图;

A2、获取太阳耀斑样本的步骤;

A3、确定太阳耀斑强度的步骤;

A4、将所述数据按照时间分为训练数据和测试数据,并将活动区的观测数据转化为取值在0~1之间相同大小的图像;

A5、保留训练数据中所有的耀斑样本,并从非耀斑样本中随机选择与耀斑样本数量相同的非耀斑样本,组成新的两类平衡的训练数据集。

2.根据权利要求1所述的基于卷积神经网络模型的太阳耀斑预报方法,其特征在于,所述确定太阳耀斑强度,具体为:A31、太阳耀斑强度由指定时间段内发生的太阳耀斑的加权和确定,其表达式为:Itot=∑c+10∑m+100∑x

其中:c,m和x分别代表C级,M级和X级耀斑的系数。

3.根据权利要求1所述的基于卷积神经网络模型的太阳耀斑预报方法,其特征在于,步骤B所述卷积神经网络由6层组成,具体为:第1层为输入层,输入层为100×100的光球磁场观测数据;

第2层为卷积层,卷积层共包括100个滤波器,滤波器尺寸为7,步长为5;卷积层的输出为100组19×19的特征图;

第3层为池化层,池化层滤波器尺寸为3,步长为2,池化方法为取滤波器内的最大值;池化层的输出为100组9×9的图;

第4层为第一全联接层,节点数目为200;

第5层为第二全联接层,节点数目为20;

第6层为输出层,节点数目为2,分别对应模型的两种输出状态,所述两种输出状态为:未来将产生太阳耀斑和不产生太阳耀斑;

在上述模型训练过程中,学习率设为0.01,动量设为0.9,最大循环数设为45000。

4.根据权利要求3所述的基于卷积神经网络模型的太阳耀斑预报方法,其特征在于,所述从观测数据中提取特征,并预报该活动区是否产生太阳耀斑,具体为:所述活动区是否产生大于一定阈值的太阳耀斑的预报,为一个典型的二值预报问题,对于一个二值预报系统,其预报结果为如下四种可能的结果:本身是正类又被正确地预测为正类的样本被称为正确的肯定;本身是负类又被正确地预测为负类的样本被称为正确的否定;本身是正类又被错误地预测为负类的样本被称为错误的否定;本身是负类又被错误地预测为正类的样本被称为错误的肯定。

5.根据权利要求4所述的基于卷积神经网络模型的太阳耀斑预报方法,其特征在于,在太阳耀斑预报中,将耀斑样本作为正类样本,非耀斑样本作为负类样本;根据预报结果的四类输出,定义如下四个指标刻画预报模型的性能:其中:NTP为正确的肯定样本数,NFN为错误的否定样本数;

其中:NTN为正确的否定样本数,NFP为错误的肯定样本数;

TSS=TP rate-FP rate

其中:FP rate=1-TN rate;

其中:N=NTP+NFN+NTN+NFP,所述TP rate和TN rate分别用于评价耀斑预报的准确程度和非耀斑预报的准确程度;

所述指标TSS对耀斑样本数和非耀斑样本数的比例不敏感;所述HSS用于反映预报模型的预报能力相较随机猜测的增加值。

6.根据权利要求1所述的基于卷积神经网络模型的太阳耀斑预报方法,其特征在于,所述步骤B之后,进一步包括:C、评价预报模型的步骤。

说明书 :

基于卷积神经网络模型的太阳耀斑预报方法

技术领域

[0001] 本发明涉及太阳活动的研究技术,尤其涉及一种基于卷积神经网络模型的太阳耀斑预报方法。

背景技术

[0002] 太阳是空间天气的源头,剧烈的太阳活动可能引起卫星故障,通信中断,导航失灵,甚至输电网络瘫痪。如果能够准确地预报未来一段时间太阳爆发活动的情况,就能够及时地进行灾害的防护和处理。
[0003] 太阳耀斑是一种剧烈的太阳活动现象,太阳耀斑的预报具有较长的研究和应用历史。以太阳黑子观测为基础,1990年McIntosh在“McIntosh,P.S.1990,Sol.Phys.,125,251”中提出太阳黑子的形态学分类(McIntosh分型),基于黑子的McIntosh分型,人工建立了一个包含500多条规则的太阳耀斑预报专家系统(Theo)。1994年Bornmann和Shaw在“Bornmann,P.L.&Shaw,D.1994,Sol.Phys.,150,127”中统计了太阳黑子的McIntsho分型与太阳耀斑的关系,并建立了McIntosh分型与太阳耀斑的回归模型。2007年李蓉等在“Li,R.,Wang,H.-N.,He,H.,Cui,Y.-M.,&Du,Z.-L.2007,ChJAA,7,441”中使用太阳黑子的面积、磁分类、McIntosh分型、10厘米射电流量作为模型输入,利用支持向量机方法建立太阳耀斑预报模型。2009年Colak和Qahwaji在“Colak,T.&Qahwaji,R.2009,Space Weather,7,06001”中利用图像处理技术和机器学习技术建立自动太阳活动预报系统(ASAP),该系统自动检测太阳黑子并对自动识别其McIntosh分型,在此基础上,利用神经网络方法建立太阳耀斑预报模型。2012年Bloomfield等在“Bloomfield,D.S.,Higgins,P.A.,McAteer,R.T.J.,&Gallagher,P.T.2012,ApJL,747,L41”中使用黑子的McIntosh分型,利用泊松统计技术建立太阳耀斑预报模型。
[0004] 以已经发生的太阳耀斑事件为基础,2005年Wheatland在“Wheatland,M.S.2005,Space Weather,3,07003”中仅使用太阳耀斑本身的历史观测数据,利用贝叶斯方法建立了太阳耀斑预报模型。
[0005] 以太阳光球磁场观测为基础,2006年崔延美等在“Cui,Y.M.,Li,R.,Wang,H.N.,&He,H.2007,Sol.Phys.,242,1”中从MDI纵向磁场数据中提取活动区的纵向磁场最大水平梯度、中心线长度、孤立奇点数目3个物理量,并统计了这些物理量和太阳耀斑间的关系。基于这些物理参量王华宁等在“Wang,H.N.,Cui,Y.M.,Li,R.,Zhang,L.Y.,&Han,H.2008,Adv.Space Res.,42,1464”中使用人工神经网络方法建立了太阳耀斑预报模型。2007年Georgoulis和Rust在“Georgoulis,M.K.&Rust,D.M.2007,ApJ,661,109”中定义了活动区磁场的有效联接性参数Beff,该参数反映了活动区光球磁通量分布以及光球磁场链接特性。2007年Schrijver在“Schrijver,C.J.2007,ApJ,655,117”一文中,作者发现大的太阳耀斑与活动区强梯度中性线有关,耀斑能量来源于浮现的纤维结构(fibrils)所携带的自由磁能。为了刻画磁纤维通过光球浮现所携带的电流特性,作者定义了15Mm内强磁场、大梯度中性线附近的无符号磁场通量R值,并统计了该物理量与太阳耀斑间的关系。2007年Leka和Barnes在“Leka,K.D.&Barnes,G.2007,ApJ,656,1173”中利用活动区光球矢量磁图计算了大量磁场参量(包括磁倾角、磁场水平梯度、纵向电流密度、缠绕参数、电流螺度、磁剪切角、自由磁能密度等),发现在这些参数中,光球磁自由能具有最强的预报能力,但是任何一个单一的光球磁场参数都不足以判断活动区是否产生大的太阳耀斑。2008年Barnes和Leka在“Barnes,G.&Leka,K.D.2008,ApJ,688,L107”中基于相同的数据集、建模方法和评价指标,测试了文献“Georgoulis,M.K.&Rust,D.M.2007,ApJ,661,109”和文献“Schrijver,C.J.2007,ApJ,655,117”中提出的物理参量的预报能力,指出这些物理参量在用于太阳耀斑预报时,并不具备显著的差异,并且单个参量的预报能力是有限的。2010年Mason和Hoeksema在“Mason,J.P.&Hoeksema,J.T.2010,ApJ,723,634”中利用MDI纵向磁场观测,计算了活动区的无符号总磁通量,主要的中心线长度,活动区有效分割距离,梯度加权的中性线长度,并发现梯度加权的中性线长度融合了反映结构的中性线信息和反映剪切的磁场梯度信息,因而能够更好地反映活动区耀斑发生情况。2010年McAteer等在“McAteer,R.T.J.,Gallagher,P.T.,&Conlon,P.A.2010,AdSpR,45,1067”中从活动区磁场能谱和多分形特征两个角度出发,刻画光球活动区磁场复杂性,并利用这些参数预报太阳耀斑的发生。2013年Ahmed等在“Ahmed,O.W.,Qahwaji,R.,&Colak,T.et al.2013,SoPh,283,157”中使用太阳监测活动区跟踪器(SMART)提取活动区磁场特性,并利用神经网络方法建立太阳耀斑预报模型。2015年Bobra和Couvidat在“Bobra M.G.and Couvidat S.2015 ApJ 798135”中利用SDO的矢量磁场观测,提取了25个反映活动区特性的物理参量,并利用支持向量机建立太阳耀斑预报模型。
[0006] 综上所述,现有的太阳耀斑预报模型建模流程如图1所示。现有的预报模型需要首先提取活动区的参量以刻画活动区的特性,将提取的活动区参量作为预报模型的输入,进而给出预报结果。
[0007] 然而,目前对太阳耀斑发生的物理机制还不是十分明确,人为地构造活动区的参量具有一定的困难,而且已经提取的活动区参量并未达到理想的预报能力。

发明内容

[0008] 有鉴于此,本发明的主要目的在于提供一种基于卷积神经网络模型的太阳耀斑预报方法,直接将观测的原始数据作为该模型的输入,利用深度神经网络强大的学习能力,自动地从原始数据中提取用于太阳耀斑预报的预报因子,并建立相应的预报模型,从而利用其达到理想的预报能力。
[0009] 为达到上述目的,本发明的技术方案是这样实现的:
[0010] 一种基于卷积神经网络模型的太阳耀斑预报方法,该预报方法包括:
[0011] A、活动区原始观测数据的准备步骤;
[0012] B、建立深度预报模型,采用卷积神经网络从观测数据中提取特征,并预报该活动区是否产生太阳耀斑。
[0013] 其中,步骤A之前进一步包括提取活动区的参量以刻画活动区的特性的步骤。
[0014] 所述步骤A具体包括:
[0015] A1、获取太阳活动区的原始数据,即SOHO/MDI全日面纵向磁图;
[0016] A2、获取太阳耀斑样本的步骤;
[0017] A3、确定太阳耀斑强度的步骤;
[0018] A4、将所述数据按照时间分为训练数据和测试数据,并将活动区的观测数据转化为取值在0~1之间相同大小的图像;
[0019] A5、保留训练数据中所有的耀斑样本,并从非耀斑样本中随机选择与耀斑样本数量相同的非耀斑样本,组成新的两类平衡的训练数据集。
[0020] 所述确定太阳耀斑强度,具体为:
[0021] A31、太阳耀斑强度由指定时间段内发生的太阳耀斑的加权和确定,其表达式为:
[0022] Itot=∑c+10∑m+100∑x
[0023] 其中:c,m和x分别代表C级,M级和X级耀斑的系数。
[0024] 步骤B所述卷积神经网络由6层组成,具体为:
[0025] 第1层为输入层,输入层为100×100的光球磁场观测数据;
[0026] 第2层为卷积层,卷积层共包括100个滤波器,滤波器尺寸为7,步长为5;卷积层的输出为100组19×19的特征图;
[0027] 第3层为池化层,池化层滤波器尺寸为3,步长为2,池化方法为取滤波器内的最大值;池化层的输出为100组9×9的图;
[0028] 第4层为第一全联接层,节点数目为200;
[0029] 第5层为第二全联接层,节点数目为20;
[0030] 第6层为输出层,节点数目为2,分别对应模型的两种输出状态,所述两种输出状态为:未来将产生太阳耀斑和不产生太阳耀斑;
[0031] 在上述模型训练过程中,学习率设为0.01,动量设为0.9,最大循环数设为45000。
[0032] 所述从观测数据中提取特征,并预报该活动区是否产生太阳耀斑,具体为:
[0033] 所述活动区是否产生大于一定阈值的太阳耀斑的预报,为一个典型的二值预报问题,对于一个二值预报系统,其预报结果为如下四种可能的结果:
[0034] 本身是正类又被正确地预测为正类的样本被称为正确的肯定;本身是负类又被正确地预测为负类的样本被称为正确的否定;本身是正类又被错误地预测为负类的样本被称为错误的否定;本身是负类又被错误地预测为正类的样本被称为错误的肯定。
[0035] 在太阳耀斑预报中,将耀斑样本作为正类样本,非耀斑样本作为负类样本;根据预报结果的四类输出,定义如下四个指标刻画预报模型的性能:
[0036]
[0037] 其中:NTP为正确的肯定样本数,NFN为错误的否定样本数;
[0038]
[0039] 其中:NTN为正确的否定样本数,NFP为错误的肯定样本数;
[0040] TSS=TP rate-FP rate
[0041] 其中:FP rate=1-TN rate。
[0042]
[0043] 其中:
[0044] N=NTP+NTP+NTP+NTP,
[0045]
[0046]
[0047] 所述TP rate和TN rate分别用于评价耀斑预报的准确程度和非耀斑预报的准确程度;所述指标TSS对耀斑样本数和非耀斑样本数的比例不敏感;所述HSS用于反映预报模型的预报能力相较随机猜测的增加值。
[0048] 所述步骤B之后,进一步包括:
[0049] C、评价预报模型的步骤。
[0050] 本发明所提供的基于卷积神经网络的太阳耀斑预报方法,具有以下优点:
[0051] 本发明通过利用新建立的太阳耀斑预报模型,不再需要人为的提取活动区的物理参量,而是直接从原始数据中学习活动区的特征表达,大大地降低了人为因素对预报的影响,降低了预报模型的应用难度,提高了预报模型的应用范围。

附图说明

[0052] 图1为现有太阳耀斑预报模型建模流程;
[0053] 图2为本发明基于卷积神经网络模型的太阳耀斑预报方法的模型建模流程示意图;
[0054] 图3为本发明实施例中所使用的卷积神经网络示意图;
[0055] 图4为本发明的太阳耀斑预报模型性能测试结果示意图。

具体实施方式

[0056] 下面结合附图及本发明的实施例对本发明的基于卷积神经网络的太阳耀斑预报方法作进一步详细的说明。
[0057] 图2为本发明基于卷积神经网络模型的太阳耀斑预报方法的模型建模流程示意图。
[0058] 如图2所示,本发明基于卷积神经网络模型的太阳耀斑预报方法,是直接将观测的原始数据作为模型的输入,利用深度神经网络强大的学习能力,自动地从原始数据中提取用于太阳耀斑预报的预报因子,并建立相应的预报模型。新的太阳耀斑预报模型不再需要人为的提取活动区的物理参量,而是直接从原始数据中学习活动区的特征表达,这样,能够大大降低人为因素对预报的影响,并降低了预报模型的应用难度,提高了预报模型的应用范围。
[0059] 本发明利用卷积神经网络从观测数据中自动提取特征,并给出了预测未来48小时该活动区是否爆发太阳耀斑活动的结果。本发明利用太阳活动区磁场信息预报太阳耀斑的发生。
[0060] 下面结合图1~图4,对本发明的基于卷积神经网络模型的太阳耀斑预报方法进行详细说明。该方法包括如下步骤:
[0061] 步骤10:提取活动区的参量以刻画活动区的特性的步骤。该步骤为公知技术,这里不再赘述。
[0062] 步骤11:活动区原始观测数据的准备步骤。
[0063] 在本发明的实施例中,太阳活动区的原始数据来自时间分辨率为96分钟的SOHO/MDI全日面纵向磁图。所述SOHO/MDI全日面纵向磁图可从ftp://soi-ftp.stanford.edu/pub/magnetograms/下载得到。
[0064] 本发明使用了1996年5月到2007年6月期间出现在日面30°范围内的共1055个NOAA活动区的信息。对于在日面30°范围内的活动区,我们忽略其投影效应。
[0065] 获取太阳耀斑样本的步骤。本发明实施例中的太阳耀斑样本从美国日地物理数据中心National Geophysical Data Center(NGDC)ftp://ftp.ngdc.noaa.gov/STP/SOLAR_DATA/SOLAR_FLARES/FLARES_X RAY/获得。
[0066] 确定太阳耀斑强度。所述太阳耀斑强度由指定时间段内发生的太阳耀斑的加权和确定。其表达式为:
[0067] Itot=∑c+10∑m+100∑x
[0068] 其中:c,m和x分别代表C级,M级和X级耀斑的系数。
[0069] 例如,在给定时间段内发生3个耀斑(C4,M3和X2),太阳耀斑的总强度则为234(即4+10×3+100×2)。
[0070] 在给定的预报时段内,如果太阳耀斑的总强度大于给定的阈值,就认为该样本为耀斑样本,否则,该样本被认为是非耀斑样本。在本实施例中,预报时段为48小时,Itot的阈值被设置为10,即相当于产生一个M1.0级耀斑。
[0071] 为了客观地评价预报模型的性能,从1996年到2007年间所有的数据按照时间分为训练数据和测试数据。1996年到2006年间的数据为训练数据,2007年的数据作为测试数据。训练数据用于预报模型的建立,测试数据用于预报模型性能的评价。
[0072] 为了适应建模方法的要求,所有活动区的观测数据都被转化为取值在0~1之间相同大小(100×100像素)的图像。
[0073] 由于在训练样本中非耀斑样本的数量远多于耀斑样本的数量,如果直接利用原始数据训练预报模型,模型通常会偏向于样本数量多的类别。因此,本发明保留训练数据中所有的耀斑样本,并从非耀斑样本中随机选择与耀斑样本数量相同的非耀斑样本,一同组成新的两类平衡的训练数据集。测试数据保持不变。
[0074] 步骤12:建立深度预报模型的步骤。
[0075] 本发明采用卷积神经网络从观测数据中提取特征,并预报该活动区是否产生太阳耀斑。图3为本发明实施例所使用的卷积神经网络示意图。如图3所示,所述卷积神经网络由6层组成,具体为:
[0076] 第1层为输入层,输入层为100×100的光球磁场观测数据。
[0077] 第2层为卷积层,卷积层共包括100个滤波器,滤波器尺寸为7,步长为5。因此,卷积层的输出为100组19×19的特征图。
[0078] 第3层为池化层,池化层滤波器尺寸为3,步长为2,池化方法为取滤波器内的最大值。池化层的输出为100组9×9的图。
[0079] 第4层为第一全联接层,节点数目为200。
[0080] 第5层为第二全联接层,节点数目为20。
[0081] 第6层为输出层,节点数目为2,分别对应模型的两种输出状态。即未来将产生太阳耀斑和不产生太阳耀斑。
[0082] 在上述模型训练过程中,学习率设为0.01,动量设为0.9,最大循环数设为45000。
[0083] 本发明给出活动区是否产生大于一定阈值的太阳耀斑的预报,这是一个典型的二值预报问题。对于一个二值预报系统,其预报结果存在四种可能的结果,如表1所示。
[0084] 本身是正类又被正确地预测为正类的样本被称为正确的肯定,本身是负类又被正确地预测为负类的样本被称为正确的否定,本身是正类又被错误地预测为负类的样本被称为错误的否定,本身是负类又被错误地预测为正类的样本被称为错误的肯定。
[0085] 表1:二值预报结果的四种可能结果
[0086]  预测的正类 预测的负类
真实的正类 正确的肯定(TP) 错误的否定(FN)
真实的负类 错误的肯定(FP) 正确的否定(TN)
[0087] 在太阳耀斑预报中,我们将耀斑样本看成正类样本,非耀斑样本看成负类样本。基于表1所示的四类输出,定义如下四个指标刻画预报模型的性能:
[0088]
[0089] 其中:NTP为正确的肯定样本数,NFN为错误的否定样本数。
[0090]
[0091] 其中:NTN为正确的否定样本数,NFP为错误的肯定样本数。
[0092] TSS=TP rate-FP rate
[0093] 其中:FP rate=1-TN rate。
[0094]
[0095] 其中:N=NTP+NTP+NTP+NTP,
[0096]
[0097]
[0098] 在上述四个评价指标中,TP rate和TN rate分别用于评价耀斑预报的准确程度和非耀斑预报的准确程度。为了能够给整个预报模型一个整体的评价,我们还需要使用true skill statistic(TSS)和Heidke skill score(HSS)这两个评价指标。TSS对耀斑样本数和非耀斑样本数的比例不敏感,而HSS反映了预报模型的预报能力相较随机猜测的增加值。
[0099] 步骤13:评价预报模型的步骤。
[0100] 本发明的实施例将2007年的活动区和耀斑数据作为测试数据。测试数据中包含1172个耀斑样本和8828个非耀斑样本。本发明中的卷积神经网络训练45000次,每隔1000次测试一次模型的性能,测试结果如图4所示。
[0101] 从图4中可以看出,在前5000次训练中,预报模型并没有从数据中学习到有用的信息;
[0102] 从第6000次开始,卷积神经网络从观测数据中学习到有用的特征,模型开始具有预报能力。
[0103] 第6000次和8000次太阳耀斑预报性能显示在表3和表5中,预报模型从6000次到8000次的训练过程中,给予耀斑样本更多的关注,与此同时,非耀斑样本的预报准确率降低,这需要我们根据不同任务的需要,选择满足任务要求的预报模型。模型在训练10000次后趋于稳定,如图4所示。
[0104] 表2:第6000步时,耀斑预报模型输出的结果
[0105]  预测的正类 预测的负类
真实的正类 正确的肯定(707) 错误的否定(465)
真实的负类 错误的肯定(1129) 正确的否定(7699)
[0106] 表3:第6000步时,耀斑预报模型性能测试结果
[0107]性能评价指标 测试结果
TP rate 60%
TN rate 87%
ACC 84%
HSS 0.38
TSS 0.48
[0108] 表4:第8000步时,耀斑预报模型输出的结果
[0109]  预测的正类 预测的负类
真实的正类 正确的肯定(753) 错误的否定(419)
真实的负类 错误的肯定(1884) 正确的否定(6944)
[0110] 表5:第8000步时,耀斑预报模型性能测试结果
[0111]性能评价指标 测试结果
TP rate 64%
TN rate 79%
ACC 77%
HSS 0.28
TSS 0.43
[0112] 以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。