一种网络流特征值的预测方法转让专利

申请号 : CN202310101070.5

文献号 : CN115801604B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 姜达成谭帅帅刘文印

申请人 : 广东工业大学

摘要 :

本发明公开一种网络流特征值的预测方法,包括,获取物联网网络中的网络流;提取所述网络流中的特征值,基于特征值得到时间序列;对所述时间序列进行检验;基于检验结果通过ARIMA模型或正态分布对时间序列进行预测,得到网络流特征值预测结果。

权利要求 :

1.一种网络流特征值的预测方法,其特征在于,包括:获取物联网网络中的网络流;提取所述网络流的特征值,基于特征值得到时间序列;

对所述时间序列进行检验,检验判断所述时间序列是否充分随机;基于检验结果通过ARIMA模型或正态分布对时间序列进行预测,得到网络流特征值预测结果;

对所述时间序列的随机性进行检验后,所述时间序列不是充分随机的,则通过ARIMA模型对所述时间序列进行预测,若所述时间序列是充分随机的,则通过正态分布对所述时间序列进行预测;

通过ARIMA模型对时间序列进行预测的过程包括:构建ARIMA模型,将所述时间序列输入到ARIMA模型中进行参数拟合,得到模型参数,将模型参数代入更新ARIMA模型,将所述特征值序号t输入至更新后的ARIMA模型中,得到预测特征值 即网络流特征值预测结果:其中ARIMA模型 为:

其中, 为自回归模型的阶数,

D为差分度,为移动平均模型的阶数,为固定滞后算子, 为第i个滞后算子, 是自回归模型的参数, 为移动平均模型的参数,是误差项,是常数项;

通过正态分布对时间序列进行预测的过程包括:计算时间序列中的特征值的均值 ;

计算时间序列中的特征值的方差 ;

基于所述均值及方差,得到预测特征值 即网络流特征值预测结果:其中, 为从给定的均值、方差

构成的正态分布中,返回一个抽取的随机样本。

2.根据权利要求1所述的预测方法,其特征在于:所述物联网网络中的网络流中包括少于网络流实际数据包数量的数据包,即所述网络流为一条不完整的网络流。

3.根据权利要求1所述的预测方法,其特征在于:对所述时间序列进行检验的具体过程包括:构建并初始化滞后值,并对滞后值进行迭代更新,直到滞后值达到预设条件时停止更新;

基于停止更新后的滞后值,对所述时间序列进行显著性分析,得到统计量;

对所述统计量进行阈值判断,当所述统计量小于预设阈值时,则时间序列为充分随机的,否则时间序列不是充分随机的。

4.根据权利要求3所述的预测方法,其特征在于:所述预设条件为:

其中, 为滞后值, 为向下取整函

数, 为网络流数据包的数量。

说明书 :

一种网络流特征值的预测方法

技术领域

[0001] 本发明涉及物联网设备识别技术领域,特别涉及一种网络流特征值的预测方法。

背景技术

[0002] 伴随着物联网生态系统发展,对物联网设备进行特征化与指纹识别成为了一种趋势。在指纹识别模型中,需要使用网络流特征向量来进行判断,但是特征向量只能通过完整的网络流提取,无法实时获取网络流的特征向量,从而无法对物联网设备进行正确识别。
[0003] 为了保证物联网设备的准确识别,如何准确获得网络流的特征向量即网络流特征值是亟待解决的问题。

发明内容

[0004] 为解决上述现有技术中所存在的问题,本发明提供一种网络流特征值的预测方法,能够准确获取网络流的特征向量。
[0005] 为了实现上述技术目的,本发明提供了如下技术方案:一种网络流特征值的预测方法,包括:
[0006] 获取物联网网络中的网络流;提取所述网络流的特征值,基于特征值得到时间序列;
[0007] 对所述时间序列进行检验,检验判断所述时间序列是否充分随机;基于检验结果通过ARIMA模型或正态分布对时间序列进行预测,得到网络流特征值预测结果。
[0008] 可选的,所述物联网网络中的网络流中包括少于网络流实际数据包数量的数据包,即所述网络流为一条不完整的网络流。
[0009] 可选的,对所述时间序列的随机性进行检验后,所述时间序列不是充分随机的,则通过ARIMA模型对所述时间序列进行预测,若所述时间序列是充分随机的,则通过正态分布对所述时间序列进行预测。
[0010] 可选的,对所述时间序列进行检验的具体过程包括:
[0011] 构建并初始化滞后值,并对滞后值进行迭代更新,直到滞后值达到预设条件时停止更新;
[0012] 基于停止更新后的滞后值,对所述时间序列进行显著性分析,得到统计量;
[0013] 对所述统计量进行阈值判断,当所述统计量小于预设阈值时,则时间序列为充分随机的,否则时间序列不是充分随机的。
[0014] 可选的,所述预设条件为:
[0015]
[0016] 其中,为滞后值, 为向下取整函数, 为网络流数据包的数量。
[0017] 可选的,通过ARIMA模型对时间序列进行预测的过程包括:
[0018] 构建ARIMA模型,将所述特征时间序列输入到ARIMA模型中进行参数拟合,得到模型参数,将模型参数代入更新ARIMA模型,将所述特征值序号t输入至更新后的ARIMA模型中,得到预测特征值 即网络流特征值预测结果:
[0019]
[0020] 其中ARIMA模型 为:
[0021]
[0022] 其中, 为自回归模型的阶数,D为差分度, 为移动平均模型的阶数, 为固定滞后算子, 为第i个滞后算子, 是自回归模型的参数, 为移动平均模型的参数, 是误差项, 是常数项。
[0023] 可选的,通过正态分布对时间序列进行预测的过程包括:计算时间序列中的特征值的均值 ;计算时间序列中的特征值的方差 ;基于所述均值及方差,得到预测特征值即网络流特征值预测结果:
[0024] 其中, 为从给定的均值、方差构成的正态分布中,返回一个抽取的随机样本。
[0025] 本发明具有如下技术效果:
[0026] 本发明通过对传输中的网络流进行时间序列分析,判断其是否为充分随机,如果为不充分随机,则使用ARIMA模型对其进行预测;如果为充分随机,则使用正态分布对其进行预测,能够准确有效预测网络流的特征向量,从而更好地进行其他工作。

附图说明

[0027] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0028] 图1为本发明实施例提供的方法流程示意图。

具体实施方式

[0029] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0030] 如图1所述,本发明提供了一种网络流特征值的预测方法,本发明通过捕捉物联网网络中传输的网络流,提取网络流特征值及其时间序列,根据特征值时间序列随机程度来选择预测方法,不充分随机则选择ARIMA模型,充分随机则选择正态分布,从而得到预测的网络流特征值,以进行下一步工作的开展。
[0031] 整体流程步骤:S1.捕捉网络流,得到一条不完整的网络流;S2.提取特征值及其时间序列;S3.判断时间序列是否为充分随机;S4.不充分随机,使用ARIMA模型进行预测;S5.充分随机,使用正态分布进行预测。
[0032] 具体步骤:
[0033] S1  对物联网网络中传输的某一条网络流进行捕捉,捕捉的网络流记为为第 个数据包,其中, 为流实际上的包数量,共捕捉到 个包, 为实际上的包数量与捕捉到的包数量的差值,即捕捉得到的是一条不完整的网络流
[0034] S2 提取特征值及其时间序列
[0035] S21  提取捕捉的网络流 中各个包的特征向量,即特征值,并存储到中,表达式如下:
[0036]
[0037] 其中, 为特征值的数量,由选取的特征值决定; 为不同的提取特征值函数,共提取 次
[0038] S2 2  根 据提取 的特 征值 ,计算对 应特征 值的时 间序 列 ,记 为[0039] 说明:以数据包到达的平均时间为例, ,以此类推可以得到各个特征值的时间序列。
[0040] S3 检测特征值时间序列是否为充分随机,使用Ljung‑Box检验时间序列的随机性;
[0041] S31 初始化随机性标签变量
[0042] 其中,当 时,说明时间序列 不是充分随机的,使用ARIMA模型进行预测;当 时,说明时间序列 是充分随机的,
使用正态分布进行预测
[0043] S32 进行遍历,从 开始,步长为1,直至停止;
[0044] 其中, 为求出参数 中的最小值, 为向下取整函数;
[0045] S321 计算假定值 ,用于判断时间序列是否充分随机,计算公式如下:
[0046]
[0047] 其中,是流特征值时间序列的大小, 是滞后k处的自相关, 为测试中的滞后值。
[0048] S33 将假定值 与经验值0.05进行比较:
[0049] 说明:经验值可以自行设定,本发明设定为0.05
[0050] S331 若 ,令
[0051] S332 若 ,不进行操作
[0052] S34 将 与 进行比较:
[0053] 当 时,说明时间序列 不是充分随机的,使用ARIMA模型预测未来特征值,当 时,说明时间序列 是充分随机的,
使用正态分布预测未来特征值。
[0054] S4 若 ,时间序列 不是充分随机的,使用ARIMA模型预测未来特征值;
[0055] S41 建立ARIMA模型,预测特征值 的公式如下:
[0056]
[0057] 其中, 为自回归模型的阶数,D为差分度, 为移动平均模型的阶数, 为第i个滞后算子, 为固定滞后算子, 是自回归模型的第i个参数, 为移动平均模型的第i个参数, 是误差项, 是常数项, 其中N为自回归模型/移动平均模型的参数数量。
[0058] 说明:自回归模型:一种处理时间序列的方法,用同一变数例如 的之前各期,亦即 至 来预测本期 的表现,并假设它们为一线性关系;
[0059] 移动平均模型:时间序列当期值为随机误差项以及滞后误差项线性函数所形成的模型
[0060] S42 将特征值时间序列 输入至ARIMA模型中,进行参数拟合,得到自回归模型的阶数 、差分度 ,移动平均模型的阶数
[0061] S43 将需要预测的特征值序号 输入至ARIMA模型中,即可得到预测的特征值,公式如下
[0062]
[0063] S5 若 不等于 ,说明时间序列 是充分随机的,使用正态分布预测未来特征值
[0064] S51 计算特征值均值 公式如下:
[0065]
[0066] S52 计算特征值方差 ,公式如下:
[0067]
[0068] S53 从高斯分布中随机抽取随机样本,生成满足 的随机数,作为未来特征值
[0069]
[0070] 其中, 为从给定的均值、方差构成的正态分布中,返回一个抽取的随机样本。
[0071] 本发明通过提取正在传输的网络流的特征值、特征值时间序列,根据特征值时间序列随机程度来选择预测方法,不充分随机则选择ARIMA模型,充分随机则选择正态分布,从而得到预测的特征值,以进行下一步工作的开展,为如网络流长度预测、网络流变形等工作提供帮助。
[0072] 在目前的网络流分析方法中,大关注于网络流非有效负载的特征,即由需要传输的数据之外的数据所推导出来的。这种经过推导出来的特征值可以称为原始特征,如PDU到达间时间的平均值、最大值、最小值和标准差是由数据包之间的到达间时间序列推导出来的。
[0073] 本发明通过提取正在传输的网络流的特征值、特征值时间序列,判断特征值时间序列是否为充分随机,如果为不充分随机,则使用ARIMA模型对其进行预测;如果为充分随机,则使用正态分布对其进行预测,从而更好地进行下一步工作,为如网络流长度预测、网络流变形等工作提供帮助。
[0074] 以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。