一种话务量预测方法及系统、话务量预测装置转让专利

申请号 : CN202111579888.5

文献号 : CN113973156B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 嵇望张一驰梁青陈默

申请人 : 杭州远传新业科技有限公司

摘要 :

本发明公开了一种数据处理领域的一种话务量预测方法及系统、话务量预测装置,包括输入连续时间序列的话务数据,以卷积神经网络提取话务数据特征向量;将数据特征向量输入BiLSTM模型得到第三特征向量矩阵,以激活函数转化输出预测时间话务量数据;第三特征向量矩阵计算方法包括:以预测时间节点为基准,将连续时间序列的话务数据分为正向话务数据和反向话务数据,以正向LSTM网络拟合正向话务数据输出第一特征向量矩阵,以反向LSTM网络拟合反向话务数据输出第二特征向量矩阵;合并第一特征向量矩阵和第二特征向量矩阵,并计算权重,得到第三特征向量矩阵。其解决了现有话务量预测算法对于各种话务领域的特征识别不够精确,预测精准度偏低的问题。

权利要求 :

1.一种话务量预测方法,其特征在于,包括以下步骤:输入连续时间序列的话务数据,以卷积神经网络提取话务数据特征向量; 将所述数据特征向量输入BiLSTM模型得到第三特征向量矩阵,以激活函数转化输出预测时间话务量数据;

第三特征向量矩阵计算方法包括:以预测时间节点为基准,将所述连续时间序列的话务数据分为正向话务数据和反向话务数据,以正向LSTM网络拟合所述正向话务数据输出第一特征向量矩阵,以反向LSTM网络拟合所述反向话务数据输出第二特征向量矩阵;合并所述第一特征向量矩阵和所述第二特征向量矩阵,并计算权重,得到第三特征向量矩阵;

其中,所述话务数据包括日期和话务量。

2.根据权利要求1所述的一种话务量预测方法,其特征在于,所述第一特征向量矩阵和所述第二特征向量矩阵的计算方法包括:预设时间步长和时间周期,将所述时间周期内的连续时间序列的话务数据输入所述BiLSTM模型,其中,所述正向LSTM网络取周期内预测时间节点之前的连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第一特征向量矩阵;

所述反向LSTM网络取周期内预测时间节点之后连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第二特征向量矩阵。

3.根据权利要求1所述的一种话务量预测方法,其特征在于,计算权重的方法包括:根据输入权重参数矩阵,和合并的第一特征向量矩阵和所述第二特征向量矩阵,计算第三特征向量矩阵;或,

根据多层感知机权重算法对合并的第一特征向量矩阵和所述第二特征向量矩阵执行加权计算。

4.根据权利要求1‑3任一所述的一种话务量预测方法,其特征在于,还包括输入特征参数,将所述输入特征参数转化为输入特征向量,与所述话务数据特征向量合并后输入BiLSTM模型。

5.根据权利要求1‑3任一所述的一种话务量预测方法,其特征在于,还包括步骤:预处理所述话务数据,并将预处理后的话务数据以特征工程提取泛化特征向量。

6.根据权利要求1‑3任一所述的一种话务量预测方法,其特征在于,还包括步骤:以卷积神经网络提取话务数据特征向量后输入第一Dropout层,合并所述第一特征向量矩阵和所述第二特征向量矩阵后输入第二Dropout层。

7.根据权利要求1‑3任一所述的一种话务量预测方法,其特征在于,所述话务数据还包括时间。

8.一种话务预测系统,其特征在于,包括:数据输入接口,用于接收连续时间序列的话务数据;

一维卷积层,用于以卷积神经网络提取话务数据特征向量;

BiLSTM层,用于以正向LSTM网络拟合正时序的话务数据输出第一特征向量矩阵,以反向LSTM网络拟合反向时序的话务数据输出第二特征向量矩阵;合并所述第一特征向量矩阵和所述第二特征向量矩阵;

Attention层,用于对合并所述第一特征向量矩阵和所述第二特征向量矩阵执行加权计算;

全连接层,用于以激活函数转化输出预测时间节点的话务量数据;

数据输出接口,输出预测时间节点的话务量数据;

所述数据输入接口、一维卷积层、BiLSTM层、Attention层、全连接层和数据输出接口顺次通信连接。

9.根据权利要求8所述的一种话务预测系统,其特征在于,还包括:第一Dropout层,连接所述一维卷积层; 第二Dropout层,连接所述BiLSTM层。

10.一种话务量预测装置,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器调用实现权利要求1‑7任一所述的话务量预测方法。

说明书 :

一种话务量预测方法及系统、话务量预测装置

技术领域

[0001] 本方案设计数据处理领域,尤其涉及一种话务数据的预测方法及系统、话务预测装置。

背景技术

[0002] 话务量是电信业务流量的简称,也称为电信负载量。它既表示电信设备承受的负载,也表示用户对通信需求的程度。话务量的大小与用户数量、用户通信的频繁程度、每次
用户通信占用的时长及所考察的时长有关。话务量预测有两大目的:一是为呼入现场的排
班做支持,二是为人力资源部门的招聘和培训做决策参考。没有良好的话务量预测,对人员
的需求测算就无从谈起,更加实现不了科学的排班和管理,通常不是造成客户满意率下降
就是造成人员冗余,严重干扰了客户服务中心的科学决策。
[0003] 然而当前呼叫中心均面临话务量预测的不准确问题,或者说话务量的预测没能给排班做出很好的支持,一方面是误差过大,另一方面是没有体系化支撑,对异常情况反映不
灵敏,话务量预测停留在简单的序列模型和手工计算上。并且话务量预测无法对于特征进
行自动化分析,需要手工对于特征进行分类打标,因此无法通过一套算法对多个领域的呼
叫中心话务量进行预测。
[0004] 现在主流的话务量预测算法集中在BP(back propagation)神经网络、时间序列、人为设计逻辑算法等。其中人为设计的逻辑算法拥有很强的可修改性,可是设计模型的复
杂程度以及无法自动化的繁琐程度会浪费大量时间,再者,若是要特征出现了增加、减少或
者修改,会很大程度增加设计与编写代码的时间。目前有通过时间序列中的ARIMA针对业务
量进行分析预测,然而ARIMA要求时序数据是稳定的,或者是通过差分化后是稳定的,同时
其本质上只能捕捉线性关系,而不能捕捉非线性关系,对于一些领域的特征,ARIMA会显得
相对薄弱。

发明内容

[0005] 本发明针对现有技术中的缺点,提供了一种基于BiLSTM模型的话务数据的预测方法,解决了现在的话务量预测算法对于各种话务领域的特征识别不够精确,预测精准度偏
低的问题。
[0006] 为了解决上述技术问题,本发明通过下述技术方案得以解决:
[0007] 一种话务量预测方法,包括以下步骤:
[0008] 输入连续时间序列的话务数据,以卷积神经网络提取话务数据特征向量; 将所述数据特征向量输入BiLSTM模型得到第三特征向量矩阵,以激活函数转化输出预测时间话务
量数据;
[0009] 第三特征向量矩阵计算方法包括:以预测时间节点为基准,将所述连续时间序列的话务数据分为正向话务数据和反向话务数据,以正向LSTM网络拟合所述正向话务数据输
出第一特征向量矩阵,以反向LSTM网络拟合所述反向话务数据输出第二特征向量矩阵;合
并所述第一特征向量矩阵和所述第二特征向量矩阵,并计算权重,得到第三特征向量矩阵。
[0010] 其中一种实施方式中,所述第一特征向量矩阵和所述第二特征向量矩阵的计算方法包括:
[0011] 预设时间步长和时间周期,将所述时间周期内的连续时间序列的话务数据输入所述BiLSTM模型,其中,所述正向LSTM网络取周期内预测时间节点之前的连续时间序列的话
务数据,拟合该时间段的话务数据特征向量,得到第一特征向量矩阵;
[0012] 所述反向LSTM网络取周期内预测时间节点之后连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第二特征向量矩阵。
[0013] 其中一种实施方式中,计算权重的方法包括:
[0014] 根据输入权重参数矩阵,和合并的第一特征向量矩阵和所述第二特征向量矩阵,计算第三特征向量矩阵;或,
[0015] 根据多层感知机权重算法对合并的第一特征向量矩阵和所述第二特征向量矩阵执行加权计算。
[0016] 其中一种实施方式中,还包括输入特征参数,将所述输入特征参数转化为输入特征向量,与所述话务数据特征向量合并后输入BiLSTM模型。
[0017] 其中一种实施方式中,还包括步骤:预处理所述话务数据,并将预处理后的话务数据以特征工程提取泛化特征向量。
[0018] 其中一种实施方式中,还包括步骤:
[0019] 以卷积神经网络提取话务数据特征向量后输入第一Dropout层,合并所述第一特征向量矩阵和所述第二特征向量矩阵后输入第二Dropout层。
[0020] 其中一种实施方式中,所述话务数据包括日期、时间和话务量。
[0021] 本发明还基于上述方法公开一种话务预测系统, 包括:数据输入接口,用于接收连续时间序列的话务数据;
[0022] 一维卷积层,用于以卷积神经网络提取话务数据特征向量;
[0023] BiLSTM层,用于以正向LSTM网络拟合正时序的话务数据输出第一特征向量矩阵,以反向LSTM网络拟合反向时序的话务数据输出第二特征向量矩阵;合并所述第一特征向量
矩阵和所述第二特征向量矩阵;
[0024] Attention层,用于对合并所述第一特征向量矩阵和所述第二特征向量矩阵执行加权计算;
[0025] 全连接层,用于以激活函数转化输出预测时间节点的话务量数据;
[0026] 数据输出接口,输出预测时间节点的话务量数据;
[0027] 所述数据输入接口、一维卷积层、BiLSTM层、Attention层、全连接层和数据输出接口顺次通信连接。
[0028] 本发明的有益效果:采用双向LSTM技术实现话务数据的特征自动化。话务数据作为时间序列数据,通过考虑时间的连续性这一属性来预测某一时段的话务量能更好、更全
面的预测话务量。

附图说明

[0029] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可
以根据这些附图获得其他的附图。
[0030] 图1是实施例1公开的话务量预测方法;
[0031] 图2是实施例1公开的BiLSTM模型的运算方法示意图;
[0032] 图3是实施例2公开的话务量预测方法;
[0033] 图4是实施例3公开的话务量预测系统。

具体实施方式

[0034] 下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
[0035] 实施例1
[0036] 一种话务量预测方法,如图1,包括以下步骤:
[0037] 输入连续时间序列的话务数据,以卷积神经网络提取话务数据特征向量; 将所述数据特征向量输入BiLSTM模型得到第三特征向量矩阵,以激活函数转化输出预测时间话务
量数据;
[0038] 第三特征向量矩阵计算方法包括:以预测时间节点为基准,将所述连续时间序列的话务数据分为正向话务数据和反向话务数据,以正向LSTM网络拟合所述正向话务数据输
出第一特征向量矩阵,以反向LSTM网络拟合所述反向话务数据输出第二特征向量矩阵;合
并所述第一特征向量矩阵和所述第二特征向量矩阵,并计算权重,得到第三特征向量矩阵。
[0039] 如图2,所述第一特征向量矩阵和所述第二特征向量矩阵的计算方法包括:
[0040] 预设时间步长和时间周期,将所述时间周期内的连续时间序列的话务数据输入所述BiLSTM模型,其中,所述正向LSTM网络取周期内预测时间节点之前的连续时间序列的话
务数据,拟合该时间段的话务数据特征向量,得到第一特征向量矩阵;
[0041] 所述反向LSTM网络取周期内预测时间节点之后连续时间序列的话务数据,拟合该时间段的话务数据特征向量,得到第二特征向量矩阵。
[0042] 以话务数据为例, T为8,K为下午5:00,预设时间步长为30分钟,则提取下午1:00‑下午4:30的8组数据输入到正向LSTM网络中进行训练,直到拟合下午5:00的数据值。同理,
逆向LSTM网络取下午5:30到下午9:00的8组数据进行训练拟合。
[0043] 预测话务量时,正向LSTM网络通过历史数据预测下个时段的所述话务量数据,逆向LSTM网络则通过正向LSTM网络预测出来的话务量数据和历史数据来反推,然后合并得到
最终结果。以上述方法话务量预测方法实现未来时间段的话务数据预测。当正向LSTM网络
通过输入的话务数据历史数据得到预测结果后,逆向LSTM网络在经过历史数据训练后,根
据预测结果从预测日期的最后一日开始倒着往前预测。
[0044] 计算权重的方法包括:
[0045] 根据输入权重参数矩阵,和合并的第一特征向量矩阵和所述第二特征向量矩阵,计算第三特征向量矩阵;
[0046] 在其他实施方式中,采用自动加权计算方法,即根据多层感知机权重算法对合并的第一特征向量矩阵和所述第二特征向量矩阵执行加权计算。
[0047] 即,BiLSTM模型输出若干特征向量Vi,输入Attention模型和预设的权重矩阵Ai求乘积或者采用自主学习的权重矩阵A’i通过多层感知机方法进行加权组合,输入通过全连
接层输出最终预测时间节点的话务量结果。
[0048] 实施例2
[0049] 基于实施例1公开的一种话务量预测方法,还提出了一种话务量预测方法,如图3所示,除了实施例1公开的方案还包括处理步骤:
[0050] (1)输入话务数据集,对输入的话务数据集进行数据预处理,包括有:数据空值检测、数据空值补充、异常值检测和异常值处理。输入话务数据集,空值分为0或者空白,遍历
话务数据表格,执行控制检测。数据空值补充方法为,对于检测的空值以当月该时段除空值
外的平均值做补充。
[0051] 其中,异常值检测设有两层,一层为DBSCAN聚类异常值检测,另一层为3sigma(拉伊达准则)。异常值处理为被检测到异常值使用当月该时段除异常值外的平均值做补充。
[0052] (2)数据特征工程处理方法,经过步骤(1)处理后的话务数据集执行数据特征工程,该步骤在采用卷积神经网络提取话务数据特征向量之前,提取换泛化性特征,例如时
间、日期参数。基于输入的话务数据集为一段时间序列的连续数据集,在输入卷积神经网络
前先提取时间段、年、月、日、是否为节假日、季度、调休等特征参数。并将提取的特征参数输
入卷积神经网络。
[0053] (3)还包括外部输入特征参数处理,在输入话务数据集时,同时将该组话务数据集的相关特征参数作为外部输入数据输入,输入特征参数,将所述输入特征参数转化为输入
特征向量,与所述话务数据特征向量合并后输出。
[0054] 进一步的,以卷积神经网络提取话务数据特征向量后输入第一Dropout层,合并所述第一特征向量矩阵和所述第二特征向量矩阵后输入第二Dropout层。在两个步骤之后加
入Dropout层防止模型过拟合。
[0055] 以上,实施例1所述话务数据,以及实施例2中所阐述的话务数据集包括日期、时间和话务量。外部输入特征参数包括用户在意的其他特征参数,如天气、当日特殊事件等参
数。
[0056] 实施例3
[0057] 一种话务预测系统,如图4,包括:数据输入接口,用于接收连续时间序列的话务数据;
[0058] 一维卷积层,用于以卷积神经网络提取话务数据特征向量;
[0059] 第一Dropout层,用于防止过拟合;
[0060] BiLSTM层,用于以正向LSTM网络拟合正时序的话务数据输出第一特征向量矩阵,以反向LSTM网络拟合反向时序的话务数据输出第二特征向量矩阵;合并所述第一特征向量
矩阵和所述第二特征向量矩阵;
[0061] 第二Dropout层,用于防止过拟合;
[0062] Attention层,用于对合并所述第一特征向量矩阵和所述第二特征向量矩阵执行加权计算;
[0063] 全连接层,用于以激活函数转化输出预测时间节点的话务量数据;
[0064] 数据输出接口,输出预测时间节点的话务量数据;
[0065] 所述数据输入接口、一维卷积层、第一Dropout层、BiLSTM层、第二Dropout层、Attention层、全连接层和数据输出接口顺次通信连接。
[0066] 进一步的,BiLSTM层包括正向LSTM网络和反向LSTM网络,所述正向LSTM网络用于拟合待预测时间节点之前时间周期的话务数据,反向LSTM网络用于拟合待预测时间节点之
后的时间周期的话务数据。
[0067] 还公开一种话务量预测装置,包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序可以被所述处理器调用用于实现实施例1和实施例2所述的话务量预
测方法。
[0068] 在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的
划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件
可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。
[0069] 所述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根
据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0070] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单
元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0071] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质(存储器)中。基于这样的理解,本发明实施例的技术方
案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产
品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备
(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或
部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read‑Only Memory,ROM)、
随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的
介质。
[0072] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发
明的保护范围应以所述权利要求的保护范围为准。