流量分类方法、装置、计算机设备及存储介质转让专利

申请号 : CN202210982546.6

文献号 : CN115378880B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 谈敏陈宇麟

申请人 : 平安科技(深圳)有限公司

摘要 :

本申请涉及计算机技术领域,具体涉及一种流量分类方法、装置、计算机设备及存储介质,本申请的流量分类方法包括:获取待分类的流量,以及流量分类场景信息;将所述流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,所述分类关键词包括:分类属性,和分类属性值;将所述分类属性和所述流量输入属性匹配模型,得到与所述分类属性匹配的流量属性值,其中,所述流量属性值从所述流量中提取;获取所述分类属性值和所述流量属性值的相似度;根据所述相似度对所述流量进行分类,得到分类后的流量组。本申请实施例旨在提高流量分类的精准性。

权利要求 :

1.一种流量分类方法,其特征在于,所述流量分类方法包括:获取待分类的流量,以及流量分类场景信息;

将所述流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,所述分类关键词包括:分类属性,和分类属性值;

将所述分类属性和所述流量输入属性匹配模型,得到与所述分类属性匹配的流量属性值,其中,所述流量属性值从所述流量中提取;

获取所述分类属性值和所述流量属性值的相似度;

根据所述相似度对所述流量进行分类,得到分类后的流量组。

2.根据权利要求1所述的流量分类方法,其特征在于,所述将所述流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,包括:将所述流量分类场景信息输入所述分类场景关键词提取模型中的候选词提取模块,得到分类候选词;

将所述分类候选词输入所述分类场景关键词提取模型中的关键词筛选模块,得到分类关键词。

3.根据权利要求2所述的流量分类方法,其特征在于,所述关键词筛选模块包括训练好的关键词提取分类器;

所述将所述分类候选词输入所述分类场景关键词提取模型中的关键词筛选模块,得到分类关键词,包括:通过所述关键词提取分类器对所述分类候选词进行分类标注;

将标注为关键词的分类候选词作为分类关键词。

4.根据权利要求2所述的流量分类方法,其特征在于,所述将所述分类候选词输入所述分类场景关键词提取模型中的关键词筛选模块,得到分类关键词,包括:通过所述关键词筛选模块获取预设的分类关键词的个数N,其中,所述N为正整数;

通过所述关键词筛选模块对各分类候选词进行评分,得到各分类候选词的分值;

按照所述各分类候选词的分值大小对所述各候选词进行排序;

在排序后的分类候选词中,按照分值从大到小的顺序筛选前N个分类候选词作为分类关键词。

5.根据权利要求1至4中任一项所述的流量分类方法,其特征在于,在所述根据所述相似度,对所述流量进行分类之后,所述方法还包括:在所述流量分类场景信息包括:进行软件测试的流量分类场景的情况下,根据分类后的流量组对流量进行录制,得到流量录制文件;

将所述流量录制文件传输至用于进行软件测试的计算机设备。

6.根据权利要求5所述的流量分类方法,其特征在于,所述根据分类后的流量组,对流量进行录制,得到流量录制文件,包括:对所述流量组中的流量进行去重处理,得到去重后的流量组;

对所述去重后的流量组进行录制,得到流量录制文件。

7.根据权利要求1至4中任一项所述的流量分类方法,其特征在于,在所述根据所述相似度对所述流量进行分类之后,所述方法还包括:在所述流量分类场景信息包括:进行优先级处理判断的流量分类场景的情况下,获取分类关键词匹配的流量处理优先级;

根据所述流量组和所述分类关键词的对应关系,确定所述流量组对应的流量处理优先级。

8.一种流量分类装置,其特征在于,包括:

获取模块,用于获取待分类的流量,以及流量分类场景信息;

提取模块,用于将所述流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,所述分类关键词包括:分类属性,和分类属性值;

匹配模块,用于将所述分类属性和所述流量输入属性匹配模型,得到与所述分类属性匹配的流量属性值,其中,所述流量属性值从所述流量中提取;

分类模块,用于获取所述分类属性值和所述流量属性值的相似度;根据所述相似度对所述流量进行分类,得到分类后的流量组。

9.一种计算机设备,其特征在于,所述计算机设备包括:一个或多个处理器;

存储器;以及

一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现权利要求1至7中任一项所述的流量分类方法。

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至7任一项所述的流量分类方法中的步骤。

说明书 :

流量分类方法、装置、计算机设备及存储介质

技术领域

[0001] 本申请涉及计算机技术领域,具体涉及一种流量分类方法、装置、计算机设备及存储介质。

背景技术

[0002] 如今,信息科技和生活水准都在不断进步,网络购物、网络理财等互联网金融业务也随之发展,面对急速发展的互联网金融业务,网络流量数据也呈现爆炸式增长。
[0003] 为了管理好爆炸式的流量数据,需要针对网络资源进行优化。作为管理和优化各网络资源的关键技术,网络流量分类广泛应用于网络安全、服务质量管理等领域。传统的流
量分类技术都是针对流量端口号进行分类,例如通过UDP或TCP端口号、Mac地址进行分类。
[0004] 然而,上述流量分类方法仅针对端口号无法针对于不同的分类需求,致使流量分类的精准性较低。

发明内容

[0005] 本申请实施例提供一种流量分类方法、装置、计算机设备及存储介质,旨在提高流量分类的精准性。
[0006] 一方面,本申请提供一种流量分类方法,所述流量分类方法包括:
[0007] 获取待分类的流量,以及流量分类场景信息;
[0008] 将所述流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,所述分类关键词包括:分类属性,和分类属性值;
[0009] 将所述分类属性和所述流量输入属性匹配模型,得到与所述分类属性匹配的流量属性值,其中,所述流量属性值从所述流量中提取;
[0010] 获取所述分类属性值和所述流量属性值的相似度;
[0011] 根据所述相似度对所述流量进行分类,得到分类后的流量组。
[0012] 另一方面,本申请提供一种流量分类装置,所述流量分类装置包括:
[0013] 获取模块,用于获取待分类的流量,以及流量分类场景信息;
[0014] 提取模块,用于将所述流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,所述分类关键词包括:分类属性,和分类属性值;
[0015] 匹配模块,用于将所述分类属性和所述流量输入属性匹配模型,得到与所述分类属性匹配的流量属性值,其中,所述流量属性值从所述流量中提取;
[0016] 分类模块,用于获取所述分类属性值和所述流量属性值的相似度;根据所述相似度对所述流量进行分类,得到分类后的流量组。
[0017] 另一方面,本申请还提供一种计算机设备,所述计算机设备包括:
[0018] 一个或多个处理器;
[0019] 存储器;以及
[0020] 一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现第一方面中任一项所述的流量分类方法。
[0021] 第四方面,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行第一方面任一项所述的流量分类方法中的步骤。
[0022] 本申请实施例能够基于流量分类场景信息确定作为分类依据的分类关键词,通过分类关键词进行分类,从而能够针对于不同业务场景实现流量分类,提高不同场景下流量
分类的精准性。

附图说明

[0023] 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于
本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附
图。
[0024] 图1是本申请实施例提供的流量分类系统的场景示意图;
[0025] 图2是本申请实施例中提供的流量分类方法的一个实施例流程示意图;
[0026] 图3是本申请实施例中获取流量录制文件的一个实施例流程示意图;
[0027] 图4是本申请实施例中提供的流量分类装置的一个实施例结构示意图;
[0028] 图5是本申请实施例中提供的计算机设备的一个实施例结构示意图。

具体实施方式

[0029] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于
本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施
例,都属于本申请保护的范围。
[0030] 在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,
因此不能理解为对本申请的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解
为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、
“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中,“多
个”的含义是两个或两个以上,除非另有明确具体的限定。
[0031] 在本申请中,“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任
何技术人员能够实现和使用本申请,给出了以下描述。在以下描述中,为了解释的目的而列
出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况
下也可以实现本申请。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必
要的细节使本申请的描述变得晦涩。因此,本申请并非旨在限于所示的实施例,而是与符合
本申请所公开的原理和特征的最广范围相一致。
[0032] 需要说明的是,本申请实施例方法由于是在计算机设,如中执行,各计算机设备的处理对象均以数据或信息的形式存在,例如时间,实质为时间信息,可以理解的是,后续实
施例中若提及尺寸、数量、位置等,均为对应的数据存在,以便电子设备进行处理,具体此处
不作赘述。
[0033] 本申请实施例提供一种流量分类方法、装置、计算机设备及存储介质,以下分别进行详细说明。
[0034] 请参阅图1,图1为本申请实施例所提供的流量分类系统的场景示意图,该流量分类系统可以包括计算机设备100,计算机设备100中集成有流量分类装置,如图1中的计算机
设备。
[0035] 本申请实施例中计算机设备100主要用于获取待分类的流量,以及流量分类场景信息;
[0036] 将流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,分类关键词包括:分类属性,和分类属性值;
[0037] 将分类属性和流量输入属性匹配模型,得到与分类属性匹配的流量属性值,其中,流量属性值从流量中提取;
[0038] 获取分类属性值和流量属性值的相似度;
[0039] 根据相似度对流量进行分类,得到分类后的流量组。
[0040] 本申请实施例中,该计算机设备100可以是独立的服务器,也可以是服务器组成的服务器网络或服务器集群,例如,本申请实施例中所描述的计算机设备100,其包括但不限
于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。
其中,云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。
[0041] 本领域技术人员可以理解,图1中示出的应用环境,仅仅是与本申请方案一种应用场景,并不构成对本申请方案应用场景的限定,其他的应用环境还可以包括比图1中所示更
多或更少的计算机设备,例如图1中仅示出1个计算机设备,可以理解的,该流量分类系统还
可以包括一个或多个其他服务,具体此处不作限定。
[0042] 另外,如图1所示,该流量分类系统还可以包括存储器200,用于存储数据,如存储流量相关数据,流量分类场景信息等。
[0043] 需要说明的是,图1所示的流量分类系统的场景示意图仅仅是一个示例,本申请实施例描述的流量分类系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不
构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着流量分类
系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同
样适用。
[0044] 首先,本申请实施例中提供一种流量分类方法,该流量分类方法的执行主体为流量分类装置,该流量分类装置应用于计算机设备,该流量分类方法包括:
[0045] 获取待分类的流量,以及流量分类场景信息;
[0046] 将流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,分类关键词包括:分类属性,和分类属性值;
[0047] 将分类属性和流量输入属性匹配模型,得到与分类属性匹配的流量属性值,其中,流量属性值从流量中提取;
[0048] 获取分类属性值和流量属性值的相似度;
[0049] 根据相似度对流量进行分类,得到分类后的流量组。
[0050] 相较于仅通过流量端口进行分类,本申请实施例能够基于流量分类场景信息确定作为分类依据的分类关键词,通过分类关键词进行分类,从而能够针对于不同业务场景实
现流量分类,提高不同场景下流量分类的精准性。
[0051] 如图2所示,为本申请实施例中流量分类方法的一个实施例流程示意图,下面结合图2对本申请实施例的流量方法的实现细节进行具体的说明,以下内容仅为方便理解提供
的实现细节,并非实施本方案的必须。
[0052] 本申请实施例的流量分类方法包括:
[0053] 步骤201,获取待分类的流量,以及流量分类场景信息。
[0054] 本申请实施例中的流量具体为网络流量。
[0055] 流量分类场景信息至少包括:流量分类后,每个类别的流量共有的流量特征,流量特征可表征流量的分类依据信息。
[0056] 流量分类场景信息还可包括:分类后的流量的用途。
[0057] 例如:分类后的流量用于进行软件测试,如性能测试、功能测试,以提高软件健壮性,又例如,分类后的流量用于确定该类流量的优先级,以按照优先级进行处理等。
[0058] 步骤202,将流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词。
[0059] 分类关键词包括:分类属性,和分类属性值。
[0060] 具体地,可从流量分类场景信息中的流量特征确定分类依据的分类关键词。
[0061] 分类关键词为一系列作为分类依据的键值对的统称,其中,键为分类属性,值为分类属性值。
[0062] 分类关键词中包括至少一个分类属性,其中分类属性可包括技术类属性,也可包括业务类属性,但不限于此,例如:技术类属性可包括传输协议、接口号、时延需求、并发需
求等,业务类属性可包括:流量的业务场景,其中,流量的业务场景可通过场景码进行标识,
流量的业务场景包括支付业务、登录业务、或注册业务、贷款业务等,但不下限于此。
[0063] 分类属性值可以是一个值,也可以是一个集合,本申请实施例不对此进行限定。
[0064] 在提取到分类关键词之后,可对分类关键词进行编号,一个分类对关键词对应一个类别号。
[0065] 示例性的,请参照下表1所示,表格为提取的分类关键词的示意图,类别号为001的分类关键词的分类属性为端口,分类属性值为一个集合,集合中包括端口A、端口B、端口C;
类别号为002的分类关键词中分类属性分别为协议、场景码,协议对应的分类属性值为协议
A,场景码对应的分类属性值为注册、登录,以此类推。
[0066] 表一
[0067]
[0068] 值得一提的是,为便于理解,上述表格中的分类属性值、分类属性以中文文字表示,在实际应用中,为便于数据传输,可对上述分类属性以及分类属性值进行编码表示,例
如,场景码的分类属性值可用具体的数字编码进行表示,也可使用字符编码等其他编码方
式表示,本申请实施例对上述信息的在应用过程中的具体的表示方式不进行限定。
[0069] 上文列举了若干分类关键词,以下列举若干提取分类关键词的方式。
[0070] 在一些实施例中,将流量分类场景信息输入分类场景关键词提取模型中的候选词提取模块,得到分类候选词;
[0071] 将所述分类候选词输入所述分类场景关键词提取模型中的关键词筛选模块,得到分类关键词。
[0072] 本申请实施例先提取分类的候选词,再提取分类关键词,通过候选词,缩小分类关键词的筛选范围,有利于提高分类关键词提取的效率。
[0073] 在一些实施例中,关键词筛选模块包括训练好的关键词提取分类器,将分类候选词输入分类场景关键词提取模型中的关键词筛选模块,得到分类关键词,包括:
[0074] 通过所述关键词提取分类器对所述分类候选词进行分类标注;
[0075] 将标注为关键词的分类候选词作为分类关键词。
[0076] 其中,训练关键词提取分类器的步骤包括:
[0077] 获取从流量样本中提取的候选词样本,其中每个候选词样本具有对应分类标注,每个候选词的分类标签为:该候选词为分类关键词,或者该候选词不为候选关键词;
[0078] 将候选词样本,以及候选词样本的分类标注输入关键词提取分类器,直至关键词提取分类器的损失函数收敛。
[0079] 本申请实施例的关键词提取分类器是通过机器学习实现的,因此,该关键词提取分类器在训练过程中可综合考虑多种因素对判断候选词是否为分类关键词的影响程度,从
而通过训练好的关键词提取分类器能够使得分类关键词的筛选结果更加精准,进而提高分
类的准确性。
[0080] 在另一些实施例中,将分类候选词输入分类场景关键词提取模型中的关键词筛选模块,得到分类关键词,包括:
[0081] 通过关键词筛选模块获取预设的分类关键词的个数N,其中,所述N为正整数;
[0082] 通过所述关键词筛选模块对各分类候选词进行评分,得到各分类候选词的分值;
[0083] 按照所述各分类候选词的分值大小对所述各候选词进行排序;
[0084] 在排序后的分类候选词中,按照分值从大到小的顺序筛选前N个分类候选词作为分类关键词。
[0085] 在一些实施例中,通过所述关键词筛选模块对各分类候选词进行评分,得到各分类候选词的分值,包括:基于统计特征的关键词提取,如TF,TF‑IDF,基于词图模型的关键词
提取,如PageRank,TextRank,基于主题模型的关键词提取如LDA等。
[0086] 其中,基于统计特征的关键词提取算法是通过流量分类场景信息中词语的统计信息抽取文档的关键词;
[0087] 基于词图模型的关键词提取首先要构建流量分类场景信息的语言网络图,然后对语言网络图进行网络图分析,以此,在语言网络图上寻找具有重要作用的词或者短语,这些
短语就是流量分类场景信息的关键词;
[0088] 基于主题关键词提取算法主要通过主题模型中关于主题分布的性质进行关键词提取。
[0089] 本申请实施例列举了若干种打分策略,但不限于上述几种,实际应用种可根据需求选取设置。本实施例通过打分进行关键词的提取,无需训练关键词提取分类器,从而无需
标注分类样本,使得关键词的提取更加快捷。
[0090] 在另一些实施例中,还可供用户选择关键词提取方式。
[0091] 例如:可提供用户界面,用户界面中包括关键词提取方式,关键词提取方式包括:有监督关键词提取,和无监督关键词提取,若接收到用户指示,用户指示使用有监督关键词
提取,则可通过第一种方式,即通过训练好的关键词提取分类器,得到分类关键词这一方式
提取关键词,若用户选择无监督关键词提取,则可通过第二种方式,即通过打分的方式提取
关键词。
[0092] 在提取到关键词之后,可执行步骤203。
[0093] 步骤203,将分类属性和流量输入属性匹配模型,得到与分类属性匹配的流量属性值。
[0094] 其中,流量属性值从流量中提取。
[0095] 属性匹配模型用于在流量中查找与分类属性对应的值。
[0096] 例如,分类属性中包括:场景码,该流量对应的流量场景码表征注册,则分类属性匹配的流量属性值即为注册。
[0097] 流量具有其对应的数据包格式,例如,例如五元组格式等,属性匹配模型中集成有各流量的格式,属性匹配模型能够确定流量数据包中各部分的含义。
[0098] 从流量中得到与分类属性匹配的流量属性值后,可执行步骤204。
[0099] 步骤204,获取分类属性值和流量属性值的相似度。
[0100] 在一些实施例中,可将分类属性值,和流量属性值进行向量化,通过杰卡德相似系数、余弦相似度等方式计算向量化的分类属性和流量属性值的相似度。
[0101] 另一些实施例中,可将分类属性值和流量属性值进行比较,判断分类属性值是否与分类属性值集合中的元素相同,根据元素是否相同得到相似度,其中,相同元素越高,相
似度越高,若在分类属性值集合中,均能查找到与流量属性值相同的元素,则表征相似度为
100%。
[0102] 例如,流量属性值分别为协议A、注册,根据上表一可知,流量属性值的协议A与类别号002的协议对应的分类属性值相同,流量属性值的注册与类别号002的场景码对应的分
类属性值集合中的注册相同,则该流量的流量属性值与该分类属性值的相似度为100%。
[0103] 而且,该流量属性值与004的分类属性值的相似也为100%。
[0104] 步骤205,根据相似度对流量进行分类,得到分类后的流量组。
[0105] 在一些实施例中,可设置相似度阈值,若高于阈值,则将流量划分至该关键词对应的流量组,其中,相似度阈值可根据实际应用需求设置。
[0106] 例如,若相似度阈值设置为100%,流量属性值分别为协议A、注册,则将该流量属性值对应的流量分至类别号002对应的流量组,同时,也将该流量分至类别号004对应的流
量组。
[0107] 在根据所述相似度,对所述流量进行分类之后,在所述流量分类场景信息包括:进行软件测试的流量分类场景的情况下,还可根据分类后的流量组,对流量进行录制,得到流
量录制文件;将所述流量录制文件传输至用于进行软件测试的计算机设备。
[0108] 在一些实施例中,参考图3所示,上述根据分类后的流量组对流量进行录制,得到流量录制文件,包括步骤301至304:
[0109] 步骤301,获取软件测试需求。
[0110] 软件测试需求信息可携带在流量分类场景信息中,也可通过其他消息获取。
[0111] 软件测试需求信息可包括:测试的功能,或者测试的性能等,如测试注册功能。
[0112] 步骤302,根据软件测试需求匹配目标分类号。
[0113] 例如,在分类关键词中查找与软件测试需求信息一致的目标分类关键词,确定目标分类关键词对应的目标分类号。
[0114] 例如软件测试需求需要测试注册功能,则包括注册的分类关键词为目标分类关键词。
[0115] 步骤303,根据目标分类号确定目标流量组。
[0116] 即,目标分类号对应的流量组即为目标流量组。例如软件测试需求为测试注册功能,则可确定004号对应的流量组为目标流量组。
[0117] 在一些实施例中,确定目标流量组后,对目标流量组中的流量进行去重处理,得到去重后的目标流量组。
[0118] 步骤304,对目标流量组进行录制,得到流量录制文件。
[0119] 在一些实施例中,对去重后的目标流量组进行录制,得到流量录制文件。本实施例对流量组进行去重,减少软件测试时的冗余数据。
[0120] 在一些实施例中,还可获取流量录制配置信息,根据流量录制配置信息对目标流量进行录制。流量录制配置信息中可包括:将流量复制N遍进行录制等信息,本实施例不对
此进行限定。
[0121] 在一些实施例中,根据所述相似度对所述流量进行分类之后,所述方法还包括:
[0122] 在所述流量分类场景信息包括:进行优先级处理判断的流量分类场景的情况下,获取分类关键词匹配的流量处理优先级;
[0123] 根据所述流量组和所述分类关键词的对应关系,确定所述流量组对应的流量处理优先级。
[0124] 例如,某个流量数据包发送的地址对应VIP用户,或者某个流量数据包为紧急处理事项,则可该流量组可设为高优先级,优先处理该流量数据组。本实施例能够按照优先级对
流量进行处理,提高流量处理效率。
[0125] 本申请实施例能够基于流量分类场景信息确定作为分类依据的分类关键词,通过分类关键词进行分类,从而能够针对于不同业务场景实现流量分类,提高不同场景下流量
分类的精准性,另外,在流量分类后,针对不同的流量分类场景下对分类后的流量组进行处
理,能够提高流量的处理的灵活性。
[0126] 本申请实施例还提供一种流量分类装置,可参考图4所示,包括:
[0127] 获取模块401,用于获取待分类的流量,以及流量分类场景信息;
[0128] 提取模块402,用于将所述流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,所述分类关键词包括:分类属性,和分类属性值;
[0129] 匹配模块403,用于将所述分类属性和所述流量输入属性匹配模型,得到与所述分类属性匹配的流量属性值,其中,所述流量属性值从所述流量中提取;
[0130] 分类模块404,用于获取所述分类属性值和所述流量属性值的相似度;根据所述相似度对所述流量进行分类,得到分类后的流量组。
[0131] 在本申请一些实施方案中,提取模块402进一步用于将所述流量分类场景信息输入所述分类场景关键词提取模型中的候选词提取模块,得到分类候选词;将所述分类候选
词输入所述分类场景关键词提取模型中的关键词筛选模块,得到分类关键词。
[0132] 在本申请一些实施方案中,提取模块402中的所述关键词筛选模块包括训练好的关键词提取分类器,提取模块402进一步用于通过所述关键词提取分类器对所述分类候选
词进行分类标注;将标注为关键词的分类候选词作为分类关键词。
[0133] 在本申请一些实施方案中,提取模块402进一步用于通过所述关键词筛选模块获取预设的分类关键词的个数N,其中,所述N为正整数;
[0134] 通过所述关键词筛选模块对各分类候选词进行评分,得到各分类候选词的分值;
[0135] 按照所述各分类候选词的分值大小对所述各候选词进行排序;
[0136] 在排序后的分类候选词中,按照分值从大到小的顺序筛选前N个分类候选词作为分类关键词。
[0137] 在本申请一些实施方案中,分类模块404进一步用于在所述流量分类场景信息包括:进行软件测试的流量分类场景的情况下,根据分类后的流量组对流量进行录制,得到流
量录制文件;将所述流量录制文件传输至用于进行软件测试的计算机设备。
[0138] 在本申请一些实施方案中,分类模块404进一步用于对所述流量组中的流量进行去重处理,得到去重后的流量组;对所述去重后的流量组进行录制,得到流量录制文件。
[0139] 在本申请一些实施方案中,分类模块404进一步用于在所述流量分类场景信息包括:进行优先级处理判断的流量分类场景的情况下,获取分类关键词匹配的流量处理优先
级;根据所述流量组和所述分类关键词的对应关系,确定所述流量组对应的流量处理优先
级。
[0140] 本申请实施例还提供一种计算机设备,其集成了本申请实施例所提供的任一种流量分类装置,所述计算机设备包括:
[0141] 一个或多个处理器;
[0142] 存储器;以及
[0143] 一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行上述流量分类方法实施例中任一实施例中所述的流量分类方法
中的步骤。
[0144] 本申请实施例还提供一种计算机设备,其集成了本申请实施例所提供的任一种流量分类装置。如图5所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体
来讲:
[0145] 该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以
理解,图5中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或
更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0146] 处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储
在存储器502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整
体监控。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处
理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调
制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处
理器501中。
[0147] 存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程
序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比
如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的
数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如
至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以
包括存储器控制器,以提供处理器501对存储器502的访问。
[0148] 计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理
等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检
测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0149] 该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信
号输入。
[0150] 尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对
应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程
序,从而实现各种功能,如下:
[0151] 获取待分类的流量,以及流量分类场景信息;
[0152] 将流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,分类关键词包括:分类属性,和分类属性值;
[0153] 将分类属性和流量输入属性匹配模型,得到与分类属性匹配的流量属性值,其中,流量属性值从流量中提取;
[0154] 获取分类属性值和流量属性值的相似度;
[0155] 根据相似度对流量进行分类,得到分类后的流量组。
[0156] 本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存
储介质中,并由处理器进行加载和执行。
[0157] 为此,本申请实施例提供一种计算机可读存储介质,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光
盘等。其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行本申请实施例所
提供的任一种流量分类方法中的步骤。例如,所述计算机程序被处理器进行加载可以执行
如下步骤:
[0158] 获取待分类的流量,以及流量分类场景信息;
[0159] 将流量分类场景信息输入分类场景关键词提取模型,得到作为分类依据的分类关键词,分类关键词包括:分类属性,和分类属性值;
[0160] 将分类属性和流量输入属性匹配模型,得到与分类属性匹配的流量属性值,其中,流量属性值从流量中提取;
[0161] 获取分类属性值和流量属性值的相似度;
[0162] 根据相似度对流量进行分类,得到分类后的流量组。
[0163] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对其他实施例的详细描述,此处不再赘述。
[0164] 具体实施时,以上各个单元或结构可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元或结构的具体实施可参见前面的方法
实施例,在此不再赘述。
[0165] 以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0166] 以上对本申请实施例所提供的一种流量分类方法、装置、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实
施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,
依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内
容不应理解为对本申请的限制。