光传输设备在线失效预测方法和装置转让专利

申请号 : CN201810481392.6

文献号 : CN108667514B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 郑福生陈芳李皎陈彦宇陈灿罗睿周鸿喜

申请人 : 国家电网公司信息通信分公司

摘要 :

本发明公开了一种光传输设备在线失效预测方法和装置,所述方法包括以下步骤:周期性地获取所述光传输设备的基础数据,所述基础数据包括模拟数据和失效影响因子数据;分别基于模拟数据和失效影响因子数据进行失效预测。本发明从多个维度进行单板的失效预测,能够实现失效提前预测,有助于可能故障的提前处理,提升网络稳定性。

权利要求 :

1.一种光传输设备在线失效预测方法,其特征在于,包括以下步骤:周期性地获取单板光传输设备的基础数据,所述基础数据包括模拟数据和失效影响因子数据;

分别基于模拟数据和失效影响因子数据进行失效预测;

所述基础数据包括:

网元、单板列表;单板温度、电源电压,以及光模块偏置电流和/或发送光功率;系统参数,包括单板基础失效率、支持电压列表、光模块列表、降额设计数据;以及用户输入的各个网元的机房环境数据;

所述基于失效影响因子进行失效预测包括:

将单板基础失效率、质量因子、电应力因子、温度因子、环境因子和现网失效修正因子相乘获得单板失效概率;基于单板失效概率计算单板未来一年的失效概率。

2.如权利要求1所述的光传输设备在线失效预测方法,其特征在于,基于模拟数据进行失效预测包括单板光模块失效预测和单板电源失效预测。

3.如权利要求2所述的光传输设备在线失效预测方法,其特征在于,所述单板光模块失效预测包括:在满足至少一个判别条件时,光模块有失效趋势;其中,所述判别条件包括:当前周期内,偏置电流或光功率当前值到达寿命终止值;

当前周期内,偏置电流当前值到达预警点电流值;

当前周期内,光功率的变化值达到指定阈值。

4.如权利要求2所述的光传输设备在线失效预测方法,其特征在于,所述单板电源失效预测包括:对单板电源电压数据进行线性拟合,得到电压变化趋势;

在满足至少一个判别条件时,电源有失效趋势;其中,所述判别条件包括:当前电压变化值超过一定阈值;

基于电压变化趋势预测的未来一个周期内电压绝对值低于一定阈值。

5.如权利要求4所述的光传输设备在线失效预测方法,其特征在于,所述现网失效修正因子根据现网失效单板进行统计,根据在网年限、失效数量、现网存量三个维度进行失效率统计计算,形成失效经验数据,并和理论失效率进行对比,形成失效率修正因子。

6.一种光传输设备在线失效预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任一项所述的光传输设备在线失效预测方法。

7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的光传输设备在线失效预测方法。

8.一种基于权利要求1-5任一项所述的光传输设备在线失效预测方法的辅助决策系统。

说明书 :

光传输设备在线失效预测方法和装置

技术领域

[0001] 本发明属于光电子设备技术领域,尤其涉及一种光传输设备在线失效预测方法和装置。

背景技术

[0002] 随着光通信技术的日益广泛应用,同步数字体系(Synchronous Digital Hierarchy,SDH)网络设备单板承接的业务越来越多,且越来越复杂,单板的突发失效会引起业务的中断或倒换,影响网络稳定。因此,其性能稳定可靠是保证网络稳定的基础。为保证网络稳定,目前的一种策略是:规定在一定年限内强制进行更新,由于各设备的使用寿命并非完全一致,这就导致了很多设备在远未到达寿命前,就被替换掉从而产生资金和人力的浪费。
[0003] 现有技术中已经涉及光电元器件、光模块等寿命的预测方法,但是影响单板使用寿命的因素复杂多样,预测的准确度仍有待提高。在现有的光模块设计中一般半导体激光器偏置电路是自动光功率控制电路,即正常工作时,通过激光器组件中的光电监测器检测出激光器的平均输出光功率,然后负反馈控制激光器偏置电流大小,以确保输出光功率的稳定。但是当激光器由于长期工作老化而导致输出光功率下降时,如果再采用加大偏置电流来稳定输出光功率会带来恶劣的后果。并且,业界网管和第三方系统提供板件故障的告警,大多是失效后告警提示,是事后报警而不是预测。
[0004] 因此,急需一种能够准确进行失效预测的方法,以实现提前预警和通信传输设备运维辅助决策。

发明内容

[0005] 为克服上述现有技术的不足,本发明提供了一种光传输设备在线失效预测方法和装置,基于多源数据,从多个维度进行单板的失效预测,包括:基于可测的模拟数据进行失效预测,并给出失效预警,以及基于不可测的失效影响因子,基于预测模型预测失效概率。实现了失效提前预测,有助于可能故障的提前处理,提升网络稳定性。
[0006] 为实现上述目的,本发明采用如下技术方案:
[0007] 一种光传输设备在线失效预测方法,包括以下步骤:
[0008] 周期性地获取所述光传输设备的基础数据,所述基础数据包括模拟数据和失效影响因子数据;
[0009] 分别基于模拟数据和失效影响因子数据进行失效预测。
[0010] 进一步地,所述基础数据包括:
[0011] 网元、单板列表;单板温度、电源电压,以及光模块偏置电流和/或发送光功率;系统参数,包括单板基础失效率、支持电压列表、光模块列表、降额设计数据;以及用户输入的各个网元的机房环境数据。
[0012] 进一步地,基于模拟数据进行失效预测包括单板光模块失效预测和单板电源失效预测。
[0013] 进一步地,所述单板光模块失效预测包括:
[0014] 在满足至少一个判别条件时,光模块有失效趋势;其中,所述判别条件包括:
[0015] 当前周期内,偏置电流或光功率当前值到达寿命终止值;
[0016] 当前周期内,偏置电流当前值到达预警点电流值;
[0017] 当前周期内,光功率的变化值达到指定阈值。
[0018] 进一步地,所述单板电源失效预测包括:对单板电源电压数据进行线性拟合,得到电压变化趋势;
[0019] 在满足至少一个判别条件时,电源有失效趋势;其中,所述判别条件包括:
[0020] 当前电压变化值超过一定阈值;
[0021] 基于电压变化趋势预测的未来一个周期内电压绝对值低于一定阈值。
[0022] 进一步地,基于失效影响因子进行失效预测包括:
[0023] 将单板基础失效率、质量因子、电应力因子、温度因子、环境因子和现网失效修正因子相乘获得单板失效概率;基于单板失效概率计算单板未来一年的失效概率。
[0024] 进一步地,所述现网失效修正因子根据现网失效单板进行统计,根据在网年限、失效数量、现网存量三个维度进行失效率统计计算,形成失效经验数据,并和理论失效率进行对比,形成失效率修正因子。
[0025] 根据本发明的第二目的,本发明还提供了一种光传输设备在线失效预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的光传输设备在线失效预测方法。
[0026] 根据本发明的第三目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的光传输设备在线失效预测方法。
[0027] 根据本发明的第四目的,本发明还提供了一种基于所述光传输设备在线失效预测方法的辅助决策系统。
[0028] 本发明的有益效果
[0029] 1、本发明是一个板级、在线的好坏预测方案,通过对单板监控点的监测,识别模拟器件、数字芯片两类失效模式,综合采用模拟信号预测、数字失效率预测技术,自动识别单板失效风险,提前给出警报和失效概率,有利于维护部门提前制定有针对性的对应方案,降低由于设备突发故障引发的系统瘫痪性故障,支撑运行维护从事后被动型向事前主动型转变,提高通信传输设备的精益化运维管理水平。
[0030] 2、综合了模拟器件检测和可靠性预测两个功能,通过多维度观察单板进行失效预测,包括:基于可测的模拟数据进行失效预测,并给出失效预警,以及基于不可测的失效影响因子,基于预测模型预测失效概率;失效预测所采用的源数据丰富多样,提高了预测结果的准确性。
[0031] 3、本发明综合考虑了多种影响因子进行失效概率预测,并且基于单板失效的统计数据引入失效修正因子,可靠性更高。

附图说明

[0032] 构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
[0033] 图1为本发明失效预测方法示意图;
[0034] 图2为电源模块失效时电压异常对下游器件的影响示意图;
[0035] 图3电源电压与下游器件工作状态关系图;
[0036] 图4为电源电压变化趋势图;
[0037] 图5为基于电源电压进行失效判断的判决条件示意图;
[0038] 图6为失效概率预测原理图。

具体实施方式

[0039] 应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
[0040] 需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0041] 在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0042] 预测基础:单板在设计时会进行FMEA(Failure Modes and Effects Analysis,失效模式与影响分析)分析,分析的结果会在单板的软硬件中落入相应的故障检测方法和基础监控点。辅助决策系统利用这些检测方法和监控点来进行单板的失效预测。
[0043] 预测分类:单板监控点的模拟类器件,可观察模拟量输出的变化,检测器件失效趋势;数字器件根据可靠性原理预测失效概率。如图1所述。
[0044] 基于可靠性原理,不同的器件有不同的失效模式。大类划分为模拟器件类和数字器件类。模拟器件类由于有可观察的模拟信号,如电流、光功率、电压、转速等,对这些信号进行测量,计算变化趋势,可实现失效趋势检测。数字器件类的输出只有0、1两种状态,没有中间状态,所以只可根据可靠性原理,预测失效概率。
[0045] Microcontroller Unit,(MCU),指微控制单元,为光模块内部控制器。
[0046] APC-Automatic Power Control,指自动功率控制。
[0047] EOS:Electrical Over Stress,指所有的过度电性应力。超过其最大指定极限后,器件功能会减弱或损坏。
[0048] ESD:Electrical Static Discharge,指静电放电。电荷从一个物体转移到另一个物体。
[0049] EOS通常产生于电源和测试装置,其过程持续时间可能是几微秒到几秒。ESD属于EOS的特例,由于静态电荷引起,其过程持续时间为几皮秒到几纳秒,其可见性不强。
[0050] 实施例一
[0051] 本实施例公开了一种光传输设备在线失效预测方法,包括以下步骤:
[0052] 周期性地获取基础数据;所述基础数据从网管、设备和外部三个源获取,包括模拟数据和失效影响因子数据;
[0053] 分别基于模拟数据和失效影响因子数据进行失效预测。
[0054] 所述方法具体包括以下内容:
[0055] (一)系统周期性的从网管、设备和外部输入三个源采集基础数据。
[0056] (1)从网管获取网元信息、单板列表,确定待预测的板件范围;
[0057] (2)从设备上获取单板温度、电源电压、光模块偏置电流/发送光功率;
[0058] (3)其它数据:单板基础失效率、支持电压列表、光模块列表、降额设计数据属于系统参数,随系统软件包发布,各个网元的机房环境数据属于客户输入数据。其中,基础失效率:单板基础失效率是由单板所有元器件在特定温度因子、电应力因子、质量因子、环境因子等条件下的失效率总和。
[0059] (二)利用对单板的电压和光模块采集的模拟数据进行计算,判断失效趋势,预测单板失效;
[0060] 预测原理为:利用传感器获取器件在单板/部件运行的性能状态、环境条件等数据信息,通过对数据信息的处理和分析对该器件的健康状态做出诊断,并在器件故障发生前对其进行预测。模拟器件的失效预测的整体思路是:由检测电路对信号做测量、检测信号能总结变化曲线(算法)、曲线的变化到达某个点(阈值),能够判定好坏(量变引起质变)、整个曲线变化持续时长要足够长,要能够检测(突然死亡不可预测)。
[0061] 对模拟类数据进行计算,预测单板是否短期失效,包括:
[0062] 对单板电压数据进行线性拟合计算,如计算出单板电源模块有失效趋势,则报该单板有失效风险,建议及时更换该单板。
[0063] 对单板光模块周期性采集偏置电流和光功率数据进行计算,如光模块有失效趋势,则报该光模块有失效风险,建议及时更换该光模块或单板(针对光模块不可插拔单板)。
[0064] (1)光模块失效预测
[0065] 光模块的不同受电应力损坏部位不同,引发不同的失效模式,分别是指数模型、对数模型和台阶模型。
[0066] 当ESD/EOS*(见备注)引入,局部晶格结构破坏,成为非辐射复合中心,不断增加内损耗,而不产生增益,偏置电流升高。
[0067] ESD/EOS引入,导致腔面局部损耗增加,且被损伤的腔面反射率会增加,促使腔面处的光功率密度增大,短时间器件失效。
[0068] 引入EOS*,化合物半导体衬底位错被激活的概率增加,进入量子阱,由于阱的禁带宽度较窄,获得的激活能相对较低,生长速度较慢。
[0069] 偏置电流检测:偏置电流监控观察确定如下的预警告警点和寿命终止点(表1),各种规格的光模块给出的不同的预警点和寿命点。
[0070] 表1偏置电流预警判断表
[0071]初始电流Io 预警点电流值 寿命终止电流值
<10mA 12.5mA 15mA
10~30mA Io*125% Io*150%
30~40mA Io*120% Io*150%
>40mA Io+8mA Io+20mA
[0072] 发送光功率:不支持偏置电流的光模块则监控发送光功率指标(表2)。
[0073] 表2光功率预警判断条件表
[0074] 光模块 变化值 寿命终止值各光模块 1dBm 光模块参数表定义
[0075] 只要以下A、B、C任一个条件成立,则判断该光模块有失效趋势:
[0076] 判决条件A:当前周期内,偏置电流或光功率当前值到达寿命终止值,报光模块失效告警
[0077] 判决条件B:当前周期内,偏置电流当前值到达预警点电流值,报光模块即将失效预警
[0078] 判决条件C:当前周期内,光功率的变化值达到1dBm,报光模块可能失效预警[0079] (2)电源失效预测
[0080] 单板电源模块(二次电源)无复杂器件,数字器件少,原理简单,电源模块失效会导致输出电压的变化,失效预测方案就是按线性关系进行观察和预测。
[0081] 电源模块输出电压处于正常工作区,则后端器件的正常工作。输出电压在预警区,则下游器件处于临界状态,就需要提示失效风险。如果电源模块电压输出进入不正常工作区,则下游器件工作不正常,影响业务(如图2和3)。
[0082] 电压检测方案使用最小二乘法线性拟合算法进行拟合计算,图4是3.3V电压随时间变化趋势图,其中,3V和3.6V是电源失效阈值,3.03V和3.56V是预警阈值,超过预警阈值时就认为有失效趋势。
[0083] 判断失效有两个条件:一个是当前变化值已经超过容忍的范围,另外一个就是根据拟合曲线预测在未来一个周期内,电压的绝对值达到一个预警门限。只要以下A、B任一个条件成立,则判断该电源模块有失效趋势(如图5):
[0084] 判决条件A:当前周期内,电压变化值ΔV超过阈值(0.1V);
[0085] 判决条件B:预测周期内,电压绝对值低于预警门限(3.03V)。
[0086] 只要任一电压模块有失效趋势,则判断该单板有失效趋势。
[0087] (三)利用单板基础失效率、单板工作温度、现网失效统计数据、电应力、机房环境、质量因子,计算单板未来一年的失效概率。
[0088] 对单板周期性采集温度数据,在体检任务中根据温度计算工作温度,结合基础失效率、电应力参数、机房环境等数据计算未来一年的失效概率,对于失效概率偏高的单板报风险,建议提高这种单板的储备量。
[0089] 获取单板的基础失效率、温度、现网失效统计、电应力等数据,使用预测模型,预测单板未来一年的失效率,其中温度是关键因子,现网失效修正是依托故障板件跟踪流程数据统计结果的修正因子。
[0090] 失效概率预测计算方法:
[0091] 器件基础失效率λSSi=λGi·πQi·πSi·πTi·πEi
[0092] 单板基础失效率
[0093] 单板失效率λSS=λbd·πQ·πS·πT·πE·πF
[0094] 单板年失效率λr=λSS*8760/109
[0095] 其中,λGi——第i个器件的基本失效率;πQ——质量因子;πS——电应力因子;πT——温度应力因子;πE——环境应力因子;πF—现网失效修正因子;器件基础失效率由器件厂家提供,单板在设计时会计算出单板基础失效率,8760=365天*24小时。
[0096] (1)温度因子
[0097] 环境温度升高会加速器件热老化、氧化及物料化学反应,导致单板失效率上升,是影响单板失效率的关键因子。
[0098] 温度因子的采集依赖于辅助决策系统周期性的到网元设备上去进行查询,在实际应用中会优先选择入风口或低功耗单板的温度值作为环境温度。
[0099]
[0100] Ea——激活能量,Ea=0.7~0.8eV,MSTP产品取0.75;
[0101] K——玻尔兹曼常数,取8.62×10-5eV/°k;
[0102] T——为年有效温度,单板温度=环境温度+温升15度。
[0103] (2)现网失效修正因子
[0104] 按年统计单板的发货数和失效数,用于结果修正,评估数据更准确。
[0105] 表3某单板失效统计数据举例
[0106] 在网年限t 失效数f 累计出货数量1 106 46,597
2 111 44,315
3 119 41,115
4 73 37,075
5 87 32,524
6 39 24,693
7 9 9,312
合计 544 46,597
[0107] 采用现网失效数据评估方法进行评估:
[0108]
[0109] 其中,
[0110] λBB=λbd·πQ·πS·πT·πE
[0111] 运行时间t:指现网相同或相似单板在统计周期内运行的总时间,为统计总数量*统计周期,单位为小时。
[0112] 统计时间必须满足如下两个条件:①失效数必须大于2个;或②
[0113] 失效数f:指现网相同或相似单板在统计周期内失效总数。
[0114] 调整因子V:如果单板相同,且现网工作温度和电应力条件和被预测对象一致,则V=1,否则需要调整因子。
[0115] 环境因子 指现网相同或相似单板工作的环境,和前述定义的环境因子一致。
[0116] 基本失效率λBB:指现网相同或相似单板的基本失效率,即理想环境下的理论失效率λbd加上现网温度等因子后的现场理论失效率。
[0117] 现网失效因子πF是一个与V、t、 f相关的修正因子,πF=f(V,t,πEc,f),利用现网失效修正因子可对理论计算出的失效率进行修正,使得最终的单板失效率λss数值更贴近实际情况,避免理论和实际的误差。根据统计经验,一般取值范围在0.25~0.5,即单板的实际失效率大约为理论失效率的1/2~1/4。
[0118] (4)环境因子
[0119] 输入机房环境,根据所述机房环境获取环境因子πE。
[0120] 系统中预存机房环境和环境因子对应关系表(表4)。
[0121] 表4机房环境和环境因子对应关系表
[0122]
[0123] (4)质量因子
[0124] 系统中预存质量定级标准和质量因子的对应关系表(表5)。按MSTP供货现状,可确定质量因子πQ。
[0125] 表5质量定级标准和质量因子的对应关系表
[0126]
[0127] (5)电应力因子
[0128] 电应力因子πS:各个单板根据降额设计结果确定各项参数
[0129]
[0130] 其中,P0=50%;如果存在多个电应力,则多个电应力因子相乘。仅电容、二极管、继电器、电阻、电子开关、三极管等器件才需要考虑电应力,该类器件的基础失效率占总单板的失效率约10%,MSTP单板设计一般采用80%的降额设计。所以MSTP单板,建议m取2.9,P1取80%。
[0131] 环境、质量和电应力取合理的值,有助于提升计算结果的正确性。环境因子属于系统输入量,提供输入界面方面用户进行输入,默认是一类环境。优选地,电应力因子统一按照MSTP设计规范,取80%的降额值,质量因子统一按照商业器件标准定义取值1。
[0132] 实施例二
[0133] 本实施例的目的是提供一种计算装置。
[0134] 一种光传输设备在线失效预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤,包括:
[0135] 周期性地获取所述光传输设备的基础数据,所述基础数据包括模拟数据和失效影响因子数据;
[0136] 分别基于模拟数据和失效影响因子数据进行失效预测。
[0137] 实施例三
[0138] 本实施例的目的是提供一种计算机可读存储介质。
[0139] 一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行以下步骤:
[0140] 周期性地获取所述光传输设备的基础数据,所述基础数据包括模拟数据和失效影响因子数据;
[0141] 分别基于模拟数据和失效影响因子数据进行失效预测。
[0142] 实施例四
[0143] 本实施例的目的是提供一种辅助决策系统。
[0144] 为了实现上述目的,本发明采用如下一种技术方案:
[0145] 本实施例提供了一种辅助决策系统,基于所述光传输设备在线失效预测方法进行失效预测;
[0146] 当判断所述设备具有失效趋势时,发出警报;以及
[0147] 根据未来一年的失效概率,预测合适的单板备件储备量。
[0148] 以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0149] 本发明的有益效果
[0150] 1、本发明是一个板级、在线的好坏预测方案,通过对单板监控点的监测,识别模拟器件、数字芯片两类失效模式,综合采用模拟信号预测、数字失效率预测技术,自动识别单板失效风险,提前给出警报和失效概率,有利于维护部门提前制定有针对性的对应方案,降低由于设备突发故障引发的系统瘫痪性故障,支撑运行维护从事后被动型向事前主动型转变,提高通信传输设备的精益化运维管理水平。
[0151] 2、综合了模拟器件检测和可靠性预测两个功能,通过多维度观察单板进行失效预测,包括:基于可测的模拟数据进行失效预测,并给出失效预警,以及基于不可测的失效影响因子,基于预测模型预测失效概率;失效预测所采用的源数据丰富多样,提高了预测结果的准确性。
[0152] 3、本发明综合考虑了多种影响因子进行失效概率预测,并且基于单板失效的统计数据引入失效修正因子,可靠性更高。
[0153] 本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0154] 上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。