基于深度学习的TCP拥塞控制版本识别方法和装置转让专利
申请号 : CN201811594006.0
文献号 : CN111371689B
文献日 : 2022-03-18
发明人 : 陈晓宇 , 徐树公 , 陈旭东 , 曹姗 , 张舜卿
申请人 : 上海大学
摘要 :
权利要求 :
1.一种基于深度学习的TCP拥塞控制版本识别方法,其特征在于,在TCP数据流传输过程中,以被动方式采集不同条件下的各种TCP拥塞控制机制的相关信息,用于对深度学习模型进行离线训练,将训练后的特征模型在线识别各种类型的拥塞控制机制;
所述的被动方式采集是指:在基站侧和中间节点构成的服务端侧采集或在终端侧采集;
所述的TCP相关信息包括:基站侧或中间节点构成的服务端侧的状态信息、终端侧的TCP数据流信息;
所述的状态信息包括:在无线网络中,基站侧的无线链路控制层的缓冲区尺寸状态信息、分组数据汇聚协议层的延迟信息;在有线网络中,中间节点的空中数据包变化信息;
所述的TCP数据流信息包括:连接的单向延迟和吞吐量;
所述的深度学习模型为两层长短时记忆网络和两层Dense layer连接的模型,能够结合输入序列的上下文信息,检测输入序列时序变化特征,进而识别TCP拥塞控制机制版本。
2.根据权利要求1所述的方法,其特征是,所述的空中数据包的确定方法为:Numinflight=SendSN‑ACKSN,其中:Numinflight就是空中数据的数量情况,SendSN为TCP数据包头部的发送字段序号,ACKSN是TCP数据包头部的确认接收的字段序号。
3.根据权利要求1所述的方法,其特征是,所述的单向时延通过开启TCP timestamps选项进行测定:发送端会将TCP数据包的发送时间添加在TCP数据包头部,在终端接收时候就可以进行检测,进而计算链路的单向时延;
所述的吞吐量 其中:Tputi为终端收到第i个TCP数据包时的吞吐量,Sizei为终端接收到的第i个TCP数据包的尺寸信息,Δti为第i个TCP数据包和第i‑1个数据包的到达时间差。
4.根据权利要求1所述的方法,其特征是,所述的训练后的特征模型是指:使用各种TCP拥塞控制机制在不同条件下的采集信息对深度学习模型进行训练,构建了不同TCP拥塞控制机制的特征模型以识别各种类型的拥塞控制机制。
5.一种实现权利要求1~4中任一所述方法的装置,其特征在于,包括:部署在终端侧的第一信息采集单元和用于监听上行链路空闲状态的终端上报单元、部署在服务端侧的第二信息采集单元、包含深度学习模型的识别处理单元和反馈处理单元,其中:第一和第二信息采集单元分别采集TCP连接持续阶段终端侧的TCP数据流信息和服务端侧状态信息,并添加时间戳标记;终端上报单元将TCP数据流信息上报到基站侧识别处理单元;识别处理单元根据状态信息和TCP数据流信息进行时域对齐,利用深度学习模型进行TCP拥塞控制机制的识别;
所述的服务端侧包括基站和中间节点,即在无线网络中,位于基站的第二信息采集单元采集RLC buffer变化情况和pdcp层时延;在有线网络中,位于中间节点的第二信息采集单元采集TCP数据流并分析inflight变化情况。
6.根据权利要求5所述的装置,其特征是,所述的识别处理单元中设有用于时域对齐的缓冲区,该缓冲区采用环形缓冲区设计,对若干组数据进行缓冲,当缓冲长度满足识别模型需求时则将其输入深度学习模型进行识别。
7.根据权利要求5所述的装置,其特征是,所述的时域对齐是指:将时间戳标记在允许范围内的TCP数据流信息和状态信息,通过均匀抽样的方法构成一组信息。
8.根据权利要求5所述的装置,其特征是,所述的监听上行链路是指:终端上报单元向基站节点发送请求信息,若基站反馈信息没有分配上行资源,表明上行链路被占用,终端上报单元采用类载波监听多路访问/碰撞避免(CSMA/CA)的退避方式重新发送请求,退避的次数小于等于3次,否则将数据丢弃以减小对识别结果实时性的影响。
9.根据权利要求5所述的装置,其特征是,在服务端侧进一步设有反馈处理模块,该反馈处理模块根据识别处理模块的识别结果做出服务端侧针对不同TCP拥塞控制版本作出优化配置操作,以提高TCP链路的性能。
10.根据权利要求9所述的装置,其特征是,所述的优化配置操作包括:排队策略的更改,缓冲队列尺寸调整。
说明书 :
基于深度学习的TCP拥塞控制版本识别方法和装置
技术领域
背景技术
(congestion control)机制来避免网络拥塞,以及应对无线信道导致的丢包。从现有研究
情况来看,拥塞控制机制能够有效提高终端用户吞吐量,降低时延,是现代网络避免网络拥
塞的重要保障。
集TCP数据包进而提取拥塞控制机制的乘减因子和窗口增长函数两个特征,然后通过K近邻
(KNN)的方法在训练模板中匹配相近版本完成14种TCP拥塞控制机制的识别。后者通过在靠
近服务器侧的中间节点采集TCP数据包流并分析TCP链接的byte‑in‑flight值(即inflight
值)后预测服务器端的发送窗口(cwnd)大小和回退因子(back‑off factor)。
于特征提取的准确性(回退因子)且只能适用于有线链路网络。此外上述两种方式都需要消
耗较大的计算资源,引入额外的延迟,降低识别算法的速度。
发明内容
控制机制版本进行识别。通过分析在服务端侧和终端侧收集的TCP数据信息直接进行识别,
避免特征提取带来的人为误差。此外本发明采用深度学习的方式建立识别模型,可以同时
应用在有线和无线环境、联合服务端侧以及终端侧的采集信息进行识别,同时对各种类型
的拥塞控制机制,如基于延迟,基于丢包和新型拥塞控制机制等,都有很高的识别准确率。
用于对深度学习模型进行离线训练,将训练后的特征模型在线识别各种类型的拥塞控制机
制。
控制机制版本的需求。
的拥塞控制机制。
Convergence Protocol layer,PDCP层)的延迟信息;在有线网络中,中间节点的空中数据
包(inflight)变化信息。
确认接收的字段序号。
时延。
包的到达时间差。
含深度学习模型的识别处理单元和反馈处理单元,其中:第一和第二信息采集单元分别采
集TCP连接持续阶段终端侧的TCP数据流信息和服务端侧状态信息,并添加时间戳标记;终
端上报单元将TCP数据流信息上报到基站侧识别处理单元;识别处理单元根据状态信息和
TCP数据流信息进行时域对齐,利用深度学习模型进行TCP拥塞控制机制的识别。
采集单元采集TCP数据流并分析inflight变化情况。
撞避免(CSMA/CA)的退避方式重新发送请求,优选退避的次数小于等于3次,否则将数据丢
弃以减小对识别结果实时性的影响。
型进行识别。
列尺寸调整等,针对不同TCP拥塞控制版本作出优化配置操作,以提高TCP链路的性能。
引入的人为误差,本发明识别准确性能够达到98.2%。本发明采集多个维度的数据信息进
行训练,避免了单一维度采集信息对可识别拥塞控制机制种类的影响,通过与深度学习模
型相结合,充分考虑采集信息在时序和空间上的相关性,可以很好识别各种类型的拥塞控
制机制,包括最新的拥塞控制机制。此外,本发明仅需在服务端侧部署,对终端侧微小改动
即可实现于无线和有线并存的异构网络。
附图说明
具体实施方式
法代表不同类型拥塞控制机制,分别是基于丢包的Cubic、NewReno和Hybla算法,基于时延
的Vegas和Westwood算法,以及新提出的基于最小带宽延迟积的BBR算法。其中Westwood算
法由于在无线环境工作正常,仅用于在无线环境下进行测试。
PDCP层的延迟,以及有线环境下TCP连接的相关数据信息。在终端侧,则收集TCP数据流信
息。
数据包经历的链路单向延迟。
达时间差。
为TCP数据包头部的发送字段序号,ACKSN是确认接收的字段序号。
终端上报单元采用类载波监听多路访问/碰撞避免(CSMA/CA)的退避方式重新发送请求,优
选退避的次数小于等于3次,否则将数据丢弃以减小对识别结果实时性的影响。
节点)采集的状态信息采用均匀抽样的方法对这组信息进行时域对齐,即构成一组信息。
时间长度可变,但应在训练和测试时保持一致,输入样本的标签为,采集训练数据时候使用
的TCP拥塞控制机制版本。
息,用于模型训练。其中有线网络的TCP拥塞控制机制包括:Cubic、NewReno、Hybla、Vegas、
BBR,有线链路的总往返时延范围设置为40至100ms,带宽设置为5‑10Mbps,缓冲区延迟带宽
积(BDP)设置为1‑10,参数选取符合均匀分布,训练集和测试集数量分别为16800和900;无
线网络的拥塞控制机制包括:Cubic、NewReno、Hybla、Vegas、Westwood和BBR,上下行链路的
资源块数设置范围为6,15和25,核心网的延迟设置为5至45ms,基站RLC层的buffer最大尺
寸设置为100‑700packets,最大传输单元设置为1500Bytes,参数选取符合均匀分布,训练
集和测试集的数目分别是4320和1440。
分布。
和无线的环境中都实现了较高的识别准确率,其中有线的总识别准确率为99.8%,无线环
境的总识别准确率为98.2%,高于现有技术95%的准确率。
等。
Cubic 0 179 1 0 0
NewReno 0 0 180 0 0
Hybla 0 0 0 180 0
Vegas 0 0 0 0 180
Cubic 0 227 13 0 0 0
NewReno 0 0 238 0 0 0
Hybla 0 0 0 229 0 0
Vegas 0 0 0 0 240 0
Westwood 0 0 0 0 0 240
BBR 1.000 1.000 1.000 240
Cubic 0.991 0.996 0.968 240
NewReno 0.915 0.992 0.952 240
Hybla 1.000 0.954 0.976 240
Vegas 0.992 1.000 0.996 240
Westwood 1.000 1.000 1.000 240
平均/总计 0.983 0.982 0.982 1440
准确率 0.982
限,在其范围内的各个实现方案均受本发明之约束。