一种核心网与基站传输网络异常预测及定位的方法转让专利

申请号 : CN202210508171.X

文献号 : CN115022908B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 王玉梁朱文进

申请人 : 中电信数智科技有限公司

摘要 :

一种核心网与基站传输网络异常预测及定位的方法,通过对核心网与gNB之间传输网络的端到端各排查流程吞吐数据进行分类。端到端流程包含(服务器、核心网、传输链路、gNB、UE、连接UE的PC)五个环节。通过各环节的历史日志数据分析得出初始故障发生概率;同时本次巡检排查获得实时数据,并依据吞吐率给各环节打分;通过历史和实时数据分析得出实时故障转移正常和正常转移到故障的数据生成矩形集合。然后,将三组数据组成的矩形集合放入人工智能模型分析得出未来各环节发生故障的概率。通过对各环节的排查时的吞吐量打分结合环节未来发生故障概率生成故障概率与评分基线进行比较分析,通过分析结果对故障进行排查及定位。

权利要求 :

1.一种核心网与基站传输网络异常预测及定位的方法,其特征在于,包括以下步骤:

S1:对核心网与基站之间传输网络中各个节点进行统计,根据每个节点的指标类型进行二级指标分类;定期根据二级指标分类的状态情况对每个节点进行评测评分,以此计算每个二级指标分类的评分;其中,步骤S1的具体内容如下:S1.1:遍历核心网与基站之间的传输网络中各个环节节点;包括:服务器、核心网、传输链路、gNB、UE及连接UE的PC端;

S1.2:根据每个节点的指标类型进行二级指标分类;所述服务器包括2个二级指标分类:硬件性能状态、参数设置状态;所述核心网包括2个二级指标分类:核心网限速状态、承载网状态;所述传输链路包括3个二级指标分类:传输链路带宽限制状态、传输链路大时延抖动状态、传输链路丢包乱序状态;所述gNB包括3个二级指标分类:基站速率限制状态、基站处理能力状态、算法特性限制状态;所述UE及连接UE的PC端包括终端能力状态、PC性能状态、TCP设置状态、软件设置状态;

S1.3:设置每个二级指标分类占所对应环节的节点评分占比权重;

S1.4:定期根据二级指标分类的状态情况对所对应的环节节点进行评分;同时根据评分占比权重得出每轮评测中每个二级指标分类的评分;

S2:当进行第n轮评测过程时,获取第n轮评测之前的历史数据,计算每个二级指标分类的异常发生概率,并将其作为第n轮评测的初始异常发生概率a;计算每个二级指标分类的正常发生概率,并将其作为第n轮评测的初始正常发生概率b;其中步骤S2的具体内容如下:通过历史数据确定第n轮评测之前的总体评测次数,以及确定在总体评测次数中每个二级指标分类出现异常的次数,通过计算每个二级指标分类出现异常的次数所占总体评测次数比例进而确定第n轮评测中对应的二级指标分类的初始异常发生概率a,因此第n轮评测中对应的二级指标分类的初始正常发生概率b=1‑a;

S3:获取当前评测轮:第n轮评测的各个二级指标分类的评分,并与历史数据中相对应的二级指标分类的评分进行比较,进而确定每个二级指标分类在下一轮n+1评测过程中由异常转移正常的概率c、每个二级指标分类在下一轮n+1评测过程中由异常仍保持异常的概率d、每个二级指标分类在下一轮n+1评测过程中由正常转移异常的概率e、每个二级指标分类在下一轮n+1评测过程中过程由正常仍保持正常的概率f;其中,步骤S3的具体内容如下:获取当前第n轮评测之前历史数据中的各个二级指标分类的评分,并进行加权平均得到每个二级指标分类的平均评分,将当前n轮评测中每个二级指标分类的评分与所对应的二级指标分类的平均评分进行比较,确定增减幅度,根据增减幅度的区间确定每个二级指标分类在后续评测中由异常转移正常的概率c,并计算每个二级指标分类在后续评测中由异常仍保持异常的概率d=1‑c;同理,根据增减幅度的区间确定每个二级指标分类在后续评测中由正常转移异常的概率e,并计算每个二级指标分类在后续评测中由正常仍保持正常的概率f=1‑c;

S4:根据当前评测轮:第n轮评测的初始异常发生概率a,以及当前评测轮第n轮评测的初始正常发生概率b,预测计算在n+1轮评测过程中各个二级指标分类的异常发生概率g和正常发生概率h;

S5:当第n+1轮进行评测时,此时的当前评测轮n=n+1,并将步骤S4预测计算的异常发生概率g作为该轮评测过程中的初始异常发生概率a,将正常发生概率h作为该轮评测过程中初始正常发生概率b;

S6:循环步骤S3‑S5,即可以结合每次评测时的数据即及其历史数据,计算其后续一轮轮评测中各个二级指标分类的异常发生概率和正常发生概率,以此进行对核心网与基站之间的传输网络中各个节点的异常情况进行预测、定位;

步骤S7:选取步骤S6多轮评测过程中部分轮评测所获得的各个二级指标预测数据以及评测评分数据,生成故障概率基线和评分基线,并进行对比分析;

若预测的异常概率增大,且评分降低,则两者结果一致,属于正常情况;

若预测的异常概率减小,且评分增高,则两者结果一致,属于正常情况;

若预测的异常概率增大,且评分增高,则两者结果不匹配,属于非正常情况,说明对应的二级指标分类存在隐匿异常;

若预测的异常概率减小,且评分降低,则两者结果不匹配,属于非正常情况,说明二级指标分类存在隐匿异常;

根据两者的匹配状态对二级指标分类进行排查。

2.根据权利要求1所述的一种核心网与基站传输网络异常预测及定位的方法,其特征在于,步骤S4的具体内容为:预测计算的第n+1轮评测的各个二级指标分类的异常发生概率g、正常发生概率h与当前评测轮第n轮的初始异常发生概率a、初始正常发生概率b之间的关系为:g=a*d+b*e、h=a*c+b*f。

说明书 :

一种核心网与基站传输网络异常预测及定位的方法

技术领域

[0001] 本发明涉及网络故障排查技术领域,特别涉及一种核心网与基站传输网络异常预测及定位的方法。

背景技术

[0002] 在网络通信环境中,核心网与gNB(基站)之间传输网络的结构、环境复杂;因此当网络出现异常时,容易造成运维人员对异常点的溯源、追踪能力不足,且网络之间联系紧密,有些隐匿故障点难以排查。
[0003] 本申请将核心网与gNB之间传输网络端到端排查流程分为服务器、核心网、传输链路、gNB、UE及连接UE的PC五个环节。通过对各环节排查时的吞吐量打分结合环节未来发生故障概率生成故障概率与评分基线进行比较分析,对故障进行排查及定位。

发明内容

[0004] 本发明针对现有技术中的不足,提供一种核心网与基站传输网络异常预测及定位的方法;采用人工智能的分析及预测可以快速及时对各种网络故障(异常)特征进行排查,快速定位故障环节。较好的帮助维护人员发现网络节点中的隐匿故障,尽快恢复网络通信,提升用户的使用体验。
[0005] 为实现上述目的,本发明采用以下技术方案:
[0006] 一种核心网与基站传输网络异常预测及定位的方法,包括以下步骤:
[0007] S1:对核心网与基站之间传输网络中各个节点进行统计,根据每个节点的指标类型进行二级指标分类;定期根据二级指标分类的状态情况对每个节点进行评测评分,以此计算每个二级指标分类的评分;
[0008] S2:当进行第n轮评测过程时,获取第n轮评测之前的历史数据,计算每个二级指标分类的异常发生概率,并将其作为第n轮评测的初始异常发生概率a;计算每个二级指标分类的正常发生概率,并将其作为第n轮评测的初始正常发生概率b;
[0009] S3:获取当前评测轮:第n轮评测的各个二级指标分类的评分,并与历史数据中相对应的二级指标分类的评分进行比较,进而确定每个二级指标分类在下一轮n+1评测过程中由异常转移正常的概率c、每个二级指标分类在下一轮n+1评测过程中由异常仍保持异常的概率d、每个二级指标分类在下一轮n+1评测过程中由正常转移异常的概率e、每个二级指标分类在下一轮n+1评测过程中过程由正常仍保持正常的概率f;
[0010] S4:根据当前评测轮:第n轮评测的初始异常发生概率a,以及当前评测轮第n轮评测的初始正常发生概率b,预测计算在n+1轮评测过程中各个二级指标分类的异常发生概率g和正常发生概率h;
[0011] S5:当第n+1轮进行评测时,此时的当前评测轮n=n+1,并将步骤S4预测计算的异常发生概率g作为该轮评测过程中的初始异常发生概率a,将正常发生概率h作为该轮评测过程中初始正常发生概率b;
[0012] S6:循环步骤S3‑S5,即可以结合每次评测时的数据即及其历史数据,计算其后续一轮轮评测中各个二级指标分类的异常发生概率和正常发生概率,以此进行对核心网与基站之间的传输网络中各个节点的异常情况进行预测、定位。
[0013] 为优化上述技术方案,采取的具体措施还包括:
[0014] 进一步地,步骤S1的具体内容为:
[0015] S1.1:遍历核心网与基站之间的传输网络中各个环节节点;包括:服务器、核心网、传输链路、gNB、UE及连接UE的PC端;
[0016] S1.2:根据每个节点的指标类型进行二级指标分类;所述服务器包括2个二级指标分类:硬件性能状态、参数设置状态;所述核心网包括2个二级指标分类:核心网限速状态、承载网状态;所述传输链路包括3个二级指标分类:传输链路带宽限制状态、传输链路大时延抖动状态、传输链路丢包乱序状态;所述gNB包括3个二级指标分类:基站速率限制状态、基站处理能力状态、算法特性限制状态;所述UE及连接UE的PC端包括终端能力状态、PC性能状态、TCP设置状态、软件设置状态;
[0017] S1.3:设置每个二级指标分类占所对应环节的节点评分占比权重;
[0018] S1.4:定期根据二级指标分类的状态情况对所对应的环节节点进行评分;同时根据评分占比权重得出每轮评测中每个二级指标分类的评分。
[0019] 进一步地,步骤S2的具体内容为:通过历史数据确定第n轮评测之前的总体评测次数,以及确定在总体评测次数中每个二级指标分类出现异常的次数,通过计算每个二级指标分类出现异常的次数所占总体评测次数比例进而确定第n轮评测中对应的二级指标分类的初始异常发生概率a,因此第n轮评测中对应的二级指标分类的初始正常发生概率b=1‑a。
[0020] 进一步地,步骤S3的具体内容为:获取当前第n轮评测之前历史数据中的各个二级指标分类的评分,并进行加权平均得到每个二级指标分类的平均评分,将当前n轮评测中每个二级指标分类的评分与所对应的二级指标分类的平均评分进行比较,确定增减幅度,根据增减幅度的区间确定每个二级指标分类在后续评测中由异常转移正常的概率c,并计算每个二级指标分类在后续评测中由异常仍保持异常的概率d=1‑c;同理,根据增减幅度的区间确定每个二级指标分类在后续评测中由正常转移异常的概率e,并计算每个二级指标分类在后续评测中由正常仍保持正常的概率f=1‑c。
[0021] 进一步地,步骤S4的具体内容为:预测计算的第n+1轮评测的各个二级指标分类的异常发生概率g、正常发生概率h与当前评测轮第n轮的初始初始异常发生概率a、初始正常发生概率b之间的关系为:g=a*d+b*e、h=a*c+b*f。
[0022] 进一步地,还包括,
[0023] 步骤S7:选取步骤S6多轮评测过程中部分轮评测所获得的各个二级指标预测数据以及评测评分数据,生成故障概率基线和评分基线,并进行对比分析;
[0024] 若预测的异常概率增大,且评分降低,则两者结果一致,属于正常情况;
[0025] 若预测的异常概率减小,且评分增高,则两者结果一致,属于正常情况;
[0026] 若预测的异常概率增大,且评分降低,则两者结果不匹配,属于非正常情况,说明对应的二级指标分类存在隐匿异常;
[0027] 若预测的异常概率减小,且评分增高,则两者结果不匹配,属于非正常情况,说明二级指标分类存在隐匿异常;
[0028] 根据两者的匹配状态对二级指标分类进行排查。
[0029] 本发明的有益效果是:
[0030] 1、本申请结合当前轮评测数据以及往期历史数据,即可计算预测在后续一轮评测中各个二级指标分类的异常发生概率和正常发生概率,以此作为运维人员的参考数据,对异常发生概率较高的二级分类指标,运维人员可着重排查,减少故障异常点的排查时间。同时本申请通过风险较高的二级分类指标还有助于查询一些隐匿的、难以排查的故障点;给予运维人员较可靠的排查建议。
[0031] 2、本申请将多轮评测过程中的各个二级指标预测数据以及评测评分数据,生成故障概率基线和评分基线,并进行对比分析;将两者的进行互相制约比较,确定是否存在隐匿的故障异常,以此帮助运维人员进行故障排查。
[0032] 3、本申请突出了人工智能优化5G小区核心网与基站传输网络故障预测的地位,采用人工智能的分析及预测可以快速及时对各种网络故障特征进行排查,快速定位故障环节。较好的帮助维护人员发现网络节点中的隐匿故障,尽快恢复网络通信,提升用户的使用体验。

附图说明

[0033] 图1是本发明网络传输过程中各个环节节点的连接关系以及所对应节点主要涉及的指标关系示意图。
[0034] 图2是本发明实施例中下一轮评测预测的数据与初始异常/正常发生概率之间的关系计算示意图。
[0035] 图3是本发明实施例中将故障概率基线与评分基线的对比示意图。

具体实施方式

[0036] 现在结合附图对本发明作进一步详细的说明。
[0037] 参考图1‑图3,本申请的主要技术方案为:
[0038] 步骤一,首先,通过对核心网与gNB之间传输网络进行的排查流程中的各环节对应的可能故障因素及相关指标进行分类。端到端流程包含(服务器、核心网、传输链路、gNB、UE及连接UE的PC)五个环节。每个环节评分总和为1,其中二级分类数量加权平均分摊评分指标。通过各环节的历史日志数据分析得出初始故障发生概率;同时本次巡检排查获得实时数据,并依据流程各环节参考指标给各环节打分;通过历史和实时数据分析得出实时故障转移正常和正常转移到故障的数据生成矩形集合。
[0039] 第一类、服务器环节分成2个2级分类:
[0040] 硬件性能、参数设置二级分类:
[0041] 1、硬件性能
[0042] 根据存储在核心网与gNB之间传输网络设备上的日志文件查询是否有硬件告警(光模块、磁盘损坏、内存条异常、板卡故障、CPU温度过高、内存温度过高)均属于硬件问题。
[0043] 2、参数设置
[0044] 根据存储在核心网与gNB之间传输网络设备上的日志文件查询是否有TCP和软件参数告警(TCP参数告警、软件参数告警)均属于参数设置问题。TCP参数告警(SYN Cookies、sockets的快速回收、向外连接的端口范围、SYN队列的长度、系统同时保持TIME_WAIT的最大数量),软件参数告警(数据库连接最大数、访问内存最大值设置)。
[0045] 第二类、核心网环节分成2个2级分类:
[0046] 限速、专有承载二级分类:
[0047] 1、核心网限速
[0048] 根据存储在核心网设备上的配置文件查询设置的限速与带宽配置参数比例是否正确。例如:带宽配置1000M,而限速是500,则带宽利用率最大只有50%需要进行调整。
[0049] 2、承载网
[0050] 首先,通过基站侧信令跟踪检查开户信息,核心网是否有其他特殊配置,如果有则根据存储在核心网与gNB之间传输网络设备上的日志文件查询是否有承载网及相应告警数据。承载网:就是打通基站和中心机房之间的连接。负责承载数据、汇聚数据的网络。
[0051] 第三类、传输链路环节分成3个2级分类:
[0052] 传输链路带宽限制、大时延抖动、丢包乱序:
[0053] 1、传输链路带宽限制
[0054] 根据存储在gNB上的配置文件检查传输带宽是否受限。
[0055] 2、传输链路大时延抖动
[0056] 采集传输链路上的网络流量,比较上一次巡检与本次巡检之间是否有较大幅度时延抖动突增减情况。
[0057] 3、传输链路丢包乱序
[0058] 采集传输链路上的网络流量并结合告警信息是否有基于UDP和TCP协议的丢包及乱序告警,对UDP和TCP协议进行丢包重发机制和超时机制。
[0059] 第四类、gNB环节分成3个2级分类:
[0060] 基站速率限制、基站处理能力、算法特性限制:
[0061] 1、基站速率限制
[0062] 根据存储在gNB上的配置文件查询设置的限速与带宽配置参数比例是否正确。例如:带宽配置1000M,而限速是500,则带宽利用率最大只有50%需要进行调整。
[0063] 2、基站处理能力
[0064] 根据存储在gNB上的配置文件查询:
[0065] S1、带宽和天线数等基本配置是否不合理造成吞吐量问题;
[0066] S2、更换测试设备,确认是否是测试终端问题;
[0067] S3、无线信号差必然导致吞吐量降低,因此我们通过小区内近,远二处测试无线信号质量。
[0068] 近点造成,远点异常:小区边缘干扰导致吞吐量二话,寻找干扰源,进行RF优化。RF优化包括准备工作、数据采集、问题分析、调整实施这四个阶段,其中数据采集、问题分析、优化调整需要根据优化目标要求和实际优化现状,反复进行,直至网络情况满足优化目标KPI要求为止。
[0069] 近点异常,远点正常:检查终端能力,判断当前速率是否已接近理论峰值。
[0070] 3、算法特性限制
[0071] 根据存储在gNB上的配置文件查询加密算法和存储性算法配置是否正确。
[0072] 第五类、UE及连接UE的PC环节分成4个2级分类:
[0073] 终端能力、PC性能、TCP设置、软件配置(FTP配置、防火墙);
[0074] 1、终端能力
[0075] 通过客户上传测量报告检查UE终端配置是否过低情况。
[0076] 2、PC性能
[0077] 检查连接UE的业务PC性能是否满足要求及UE侧配置是否正确。
[0078] 3、TCP设置
[0079] 在数据源充足及信道条件较好的前提下查看调度是否充足。检测信道质量是否满足需求(峰值测试时需要SINR>25dB,误块率为0)。
[0080] 4、软件配置
[0081] FTP配置和防火墙配置。
[0082] 其中,
[0083] 在一个实施例中,排查结果如下表1所示:
[0084] 表1核心网与gNB之间传输网络排查结果表
[0085]
[0086]
[0087]
[0088] 步骤二,根据【故障预测模型】分析得出下一次核心网与gNB之间传输网络吞吐率各个环节发生故障的概率。最后,将各个环节故障发生概率生成故障概率基线,评分生成评分基线。
[0089] S1、构建【故障预测模型】
[0090] 【故障预测模型】公式:
[0091] 概率矩阵模型公式:X(k+1)=X(k)×P
[0092] 公式中:X(k)表示趋势分析与预测对象在t=k时刻的状态向量,P表示一步转移概率矩阵,X(k+1)表示趋势分析与预测对象在t=k+1时刻的状态向量。
[0093] S1‑1、通过访问当前排查环节的二级分类对应的数据源含(存储在gNB上的配置文件或存储在核心网与gNB之间传输网络设备上的日志)分析二级分类关键字,获取历史数据生成初始概率发生数据;
[0094] 例如:程序排查‑>服务器环节‑>硬件性能二级分类通过历史数据获得发生故障概率30%,则发生正常的概率为1‑30%=0.7【0.3 0.7】。
[0095] S1‑2、通过本次排查采集数据(内存、cpu、磁盘大小等)与S1数据源历史监控指标(内存、cpu、磁盘大小等)加权平均数据比较得出增减幅度。即,本次排查过程中硬件性能发生故障转移正常比例;
[0096] 例如:程序排查‑>服务器环节‑>硬件性能二级分类通过本次排查采集数据(内存、cpu、磁盘大小等)与历史数据比对获得本次排查过程中硬件性能发生故障转移正常比例40%,则故障仍保持故障的比例为1‑0.4=0.6【0.4 0.6】。
[0097] (具体根据增减幅度确定转移概率是通过增减幅度范围区间来设定的,例如服务器的二级指标分类中的硬件性能,其在本次评测中分数为a,在历史评测中加权平均为分数b,增减幅度为c;当c位于某一区间时,设定其故障转移正常或正常转移故障的概率为d%;当c位于另外某一区间时,设定其故障转移正常或正常转移故障的概率为e%;以此确定转移概率)
[0098] S1‑3、通过本次排查采集数据(内存、cpu、磁盘大小等)与S1数据源历史监控指标(内存、cpu、磁盘大小等)加权平均数据比较得出增减幅度。即,本次排查过程中硬件性能发生正常转移故障比例;
[0099] 例如:程序排查‑>服务器环节‑>硬件性能二级分类通过本次排查采集数据(内存、cpu、磁盘大小)与历史数据比对获得本次排查过程中硬件性能发生正常转移故障比例30%,则正常仍保持正常的比例为1‑0.3=0.7【0.3 0.7】。
[0100] 参考图2,将运算所得三组数据进行矩形聚合,并进行运算获得结果,则:
[0101] 下次‑本环节二级分类故障发生概率运算过程及结果:
[0102] 1、故障发生概率=0.3x0.6+0.3x0.7=0.39
[0103] 2、故障不发生概率=0.3x0.4+7x0.7=0.61
[0104] 服务器环节‑>硬件性能二级分类:排查故障下次发生概率39%,不发生概率61%【0.39 0.61】
[0105] 下下次‑本环节二级分类故障发生概率运算过程及结果:
[0106] 将【0.39 0.61】数据当作初始概率,假设不改变S1‑2和S1‑3的转移概率情况下,下下次发生故障概率。
[0107] 1、故障发生概率=0.39x0.6+0.61x0.3=0.417
[0108] 2、故障不发生概率=0.39x0.4+0.61x0.7=0.583
[0109] 服务器环节‑>硬件性能二级分类:排查故障下次发生概率41.7%,不发生概率58.3%。【0.417 0.583】
[0110] 步骤三,故障概率与评分基线进行比较分析,对故障进行排查及定位。故障概率基线简称:(A)、评分基线简称:(B)比较公式:
[0111] A升B降:故障概率变大、评分变低(正常)(参考图3的右侧趋势图)
[0112] A降B升:故障概率变小、评分变高(正常)
[0113] A升B升:故障概率变大、评分变高(异常)(参考图3的左侧趋势图)
[0114] 具体描述:故障概率变大同时评分很高可能原因是由于网络异常抖动、敏感误报、其他网络节点隐匿故障造成,因此当出现A升B升的时对一级环节结合告警信息进行重点排查。
[0115] A降B降:故障概率变小、评分变低(异常)
[0116] 具体描述:故障概率变小同时评分很低可能原因如出现在业务高峰时段,监测指标数值过高但时段属于高峰可适当调整高峰时段监测指标告警阈值。如出现低峰时段,可能原因为在网络负载较小时进行数据备份,同时结合各环节实时数据对非备份的异常数据进行重点排查。
[0117] 需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
[0118] 以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。