物流实体来电的预测方法、装置、计算机设备及存储介质转让专利

申请号 : CN202110806853.4

文献号 : CN115700620A

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 李鹏程莫磊黄则鸣聂荣华宋晨川崔子玲孟路遥崔啸霆

申请人 : 顺丰科技有限公司

摘要 :

本申请提供一种物流实体来电的预测方法、装置、计算机设备及存储介质,该物流实体来电的预测方法包括:获取待预测运单的运单静态数据和动态时序数据,其中,运单静态数据是待预测运单在配送过程中保持不变的数据,动态时序数据是待预测运单在配送过程中动态变化的数据;分别对动态时序数据和运单静态数据进行编码,得到动态时序数据对应的动态时序特征向量和运单静态数据对应的运单静态特征向量;将动态时序特征向量和运单静态特征向量拼接,得到运单特征向量;根据运单特征向量确定待预测运单的实体来电概率。本申请能够提高物流实体来电的预测准确度。

权利要求 :

1.一种物流实体来电的预测方法,其特征在于,所述物流实体来电的预测方法包括:获取待预测运单的运单静态数据和动态时序数据,其中,所述运单静态数据是所述待预测运单在配送过程中保持不变的数据,所述动态时序数据是所述待预测运单在配送过程中动态变化的数据;

分别对所述动态时序数据和所述运单静态数据进行编码,得到所述动态时序数据对应的动态时序特征向量和所述运单静态数据对应的运单静态特征向量;

将所述动态时序特征向量和所述运单静态特征向量拼接,得到运单特征向量;

根据所述运单特征向量确定所述待预测运单的实体来电概率。

2.根据权利要求1所述的物流实体来电的预测方法,其特征在于,所述将所述动态时序特征向量和所述运单静态特征向量拼接,得到运单特征向量,包括:获取多个实体之间进行收寄件的收寄件知识图谱,其中,所述多个实体中包含所述待预测运单的寄件实体和收件实体;

对所述收寄件知识图谱进行编码,得到所述寄件实体的寄件实体特征向量和所述收件实体的收件实体特征向量;

将所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量拼接,得到所述运单特征向量。

3.根据权利要求2所述的物流实体来电的预测方法,其特征在于,所述获取多个实体之间进行收寄件的收寄件知识图谱,包括:获取多个实体中各个实体的实体标识、所述多个实体中各个实体的实体属性特征信息以及所述多个实体中任意两个实体之间的运单信息;

以所述多个实体中各个实体的实体标识为节点,以所述多个实体中各个实体的实体属性特征信息为节点属性,以所述多个实体中任意两个实体之间的运单信息为边属性,构建所述收寄件知识图谱。

4.根据权利要求1所述的物流实体来电的预测方法,其特征在于,所述动态时序数据包括配送过程中各个时间点的时序单位数据,所述时序单位数据为路由信息、实体来电信息、实体投诉信息或者实体微信查单信息中的任意一种;

所述分别对所述动态时序数据和所述运单静态数据进行编码,得到所述动态时序数据对应的动态时序特征向量和所述运单静态数据对应的运单静态特征向量,包括:对所述动态时序数据按时间先后排序,得到排序后的动态时序数据;

对排序后的动态时序数据进行标准化处理,得到标准化的动态时序数据;

将标准化的动态时序数据输入训练过的双向长短时记忆模型,得到所述动态时序特征向量。

5.根据权利要求2所述的物流实体来电的预测方法,其特征在于,所述将所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量拼接,得到所述运单特征向量,包括:获取所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量的特征权重系数;

根据所述特征权重系数对所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量进行加权拼接,得到所述运单特征向量。

6.根据权利要求5所述的物流实体来电的预测方法,其特征在于,所述寄件实体特征向量的特征权重系数小于所述收件实体特征向量的特征权重系数。

7.根据权利要求2所述的物流实体来电的预测方法,其特征在于,所述预测方法还包括:获取预设的多个规则权重计算策略,所述多个规则权重计算策略包括实体维度规则权重计算策略、路由维度规则权重计算策略、运单维度规则权重计算策略以及来电维度规则权重计算策略中的至少一个;

基于所述多个规则权重计算策略确定所述待预测运单在多个维度的规则权重;

基于所述待预测运单在多个维度的规则权重确定概率修正系数;

根据所述概率修正系数对所述待预测运单的所述实体来电概率修正,得到修正后的实体来电概率,其中,在所述实体来电概率为定值时,修正后的实体来电概率随着所述概率修正系数的增大而增大。

8.一种物流实体来电的预测装置,其特征在于,所述物流实体来电的预测装置包括:获取单元,用于获取待预测运单的运单静态数据和动态时序数据,其中,所述运单静态数据是所述待预测运单在配送过程中保持不变的数据,所述动态时序数据是所述待预测运单在配送过程中动态变化的数据;

向量构建单元,用于分别对所述动态时序数据和所述运单静态数据进行编码,得到所述动态时序数据对应的动态时序特征向量和所述运单静态数据对应的运单静态特征向量;

向量拼接单元,用于将所述动态时序特征向量和所述运单静态特征向量拼接,得到运单特征向量;

预测单元,用于根据所述运单特征向量确定所述待预测运单的实体来电概率。

9.一种计算机设备,其特征在于,所述计算机设备包括:

一个或多个处理器;

存储器;以及

一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现权利要求1至7中任一项所述的物流实体来电的预测方法。

10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至7任一项所述的物流实体来电的预测方法中的步骤。

说明书 :

物流实体来电的预测方法、装置、计算机设备及存储介质

技术领域

[0001] 本申请主要涉及实体来电预测技术领域,具体涉及一种物流实体来电的预测方法、装置、计算机设备及存储介质。

背景技术

[0002] 随着互联网技术的飞速发展和人民生活水平的逐步提高,快递物流行业规模不断扩大,快递业务量逐年快速增长,在2020年我国快递业务量突破800亿件。在这庞大的快递
件量背后,离不开物流信息化技术的有力支撑。对于快递行业而言,以实体为中心,关注实
体的各种需求,降低实体投诉率,提升实体的满意度是日常运营工作的重点内容。随着社会
生活水平质量的提高,实体对物流服务质量的要求也在日益提高。实体对物流服务进行来
电投诉的数量和频次逐渐升高,物流运营商的服务质量和效率面临挑战。
[0003] 在物流领域,常见的实体来电预测算法只考虑了运单的静态特征,导致物流实体来电预测准确度较低。
[0004] 也即,现有技术中物流实体来电预测准确度较低。

发明内容

[0005] 本申请提供一种物流实体来电的预测方法、装置、计算机设备及存储介质,旨在解决现有技术中物流实体来电预测准确度较低的问题。
[0006] 第一方面,本申请提供一种物流实体来电的预测方法,所述物流实体来电的预测方法包括:
[0007] 获取待预测运单的运单静态数据和动态时序数据,其中,所述运单静态数据是所述待预测运单在配送过程中保持不变的数据,所述动态时序数据是所述待预测运单在配送
过程中动态变化的数据;
[0008] 分别对所述动态时序数据和所述运单静态数据进行编码,得到所述动态时序数据对应的动态时序特征向量和所述运单静态数据对应的运单静态特征向量;
[0009] 将所述动态时序特征向量和所述运单静态特征向量拼接,得到运单特征向量;
[0010] 根据所述运单特征向量确定所述待预测运单的实体来电概率。
[0011] 可选地,所述将所述动态时序特征向量和所述运单静态特征向量拼接,得到运单特征向量,包括:
[0012] 获取多个实体之间进行收寄件的收寄件知识图谱,其中,所述多个实体中包含所述待预测运单的寄件实体和收件实体;
[0013] 对所述收寄件知识图谱进行编码,得到所述寄件实体的寄件实体特征向量和所述收件实体的收件实体特征向量;
[0014] 将所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量拼接,得到所述运单特征向量。
[0015] 可选地,所述获取多个实体之间进行收寄件的收寄件知识图谱,包括:
[0016] 获取多个实体中各个实体的实体标识、所述多个实体中各个实体的实体属性特征信息以及所述多个实体中任意两个实体之间的运单信息;
[0017] 以所述多个实体中各个实体的实体标识为节点,以所述多个实体中各个实体的实体属性特征信息为节点属性,以所述多个实体中任意两个实体之间的运单信息为边属性,
构建所述收寄件知识图谱。
[0018] 可选地,所述动态时序数据包括配送过程中各个时间点的时序单位数据,所述时序单位数据为路由信息、实体来电信息、实体投诉信息或者实体微信查单信息中的任意一
种;
[0019] 所述分别对所述动态时序数据和所述运单静态数据进行编码,得到所述动态时序数据对应的动态时序特征向量和所述运单静态数据对应的运单静态特征向量,包括:
[0020] 对所述动态时序数据按时间先后排序,得到排序后的动态时序数据;
[0021] 对排序后的动态时序数据进行标准化处理,得到标准化的动态时序数据;
[0022] 将标准化的动态时序数据输入训练过的双向长短时记忆模型,得到所述动态时序特征向量。
[0023] 可选地,所述将所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量拼接,得到所述运单特征向量,包括:
[0024] 获取所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量的特征权重系数;
[0025] 根据所述特征权重系数对所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量进行加权拼接,得到所述运单特征向量。
[0026] 可选地,所述寄件实体特征向量的特征权重系数小于所述收件实体特征向量的特征权重系数。
[0027] 可选地,所述预测方法还包括:
[0028] 获取预设的多个规则权重计算策略,所述多个规则权重计算策略包括实体维度规则权重计算策略、路由维度规则权重计算策略、运单维度规则权重计算策略以及来电维度
规则权重计算策略中的至少一个;
[0029] 基于所述多个规则权重计算策略确定所述待预测运单在多个维度的规则权重;
[0030] 基于所述待预测运单在多个维度的规则权重确定概率修正系数;
[0031] 根据所述概率修正系数对所述待预测运单的所述实体来电概率修正,得到修正后的实体来电概率,其中,在所述实体来电概率为定值时,修正后的实体来电概率随着所述概
率修正系数的增大而增大。
[0032] 第二方面,本申请提供一种物流实体来电的预测装置,所述物流实体来电的预测装置包括:
[0033] 获取单元,用于获取待预测运单的运单静态数据和动态时序数据,其中,所述运单静态数据是所述待预测运单在配送过程中保持不变的数据,所述动态时序数据是所述待预
测运单在配送过程中动态变化的数据;
[0034] 向量构建单元,用于分别对所述动态时序数据和所述运单静态数据进行编码,得到所述动态时序数据对应的动态时序特征向量和所述运单静态数据对应的运单静态特征
向量;
[0035] 向量拼接单元,用于将所述动态时序特征向量和所述运单静态特征向量拼接,得到运单特征向量;
[0036] 预测单元,用于根据所述运单特征向量确定所述待预测运单的实体来电概率。
[0037] 可选地,所述向量拼接单元,用于:
[0038] 获取多个实体之间进行收寄件的收寄件知识图谱,其中,所述多个实体中包含所述待预测运单的寄件实体和收件实体;
[0039] 对所述收寄件知识图谱进行编码,得到所述寄件实体的寄件实体特征向量和所述收件实体的收件实体特征向量;
[0040] 将所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量拼接,得到所述运单特征向量。
[0041] 可选地,所述向量拼接单元,用于:
[0042] 获取多个实体中各个实体的实体标识、所述多个实体中各个实体的实体属性特征信息以及所述多个实体中任意两个实体之间的运单信息;
[0043] 以所述多个实体中各个实体的实体标识为节点,以所述多个实体中各个实体的实体属性特征信息为节点属性,以所述多个实体中任意两个实体之间的运单信息为边属性,
构建所述收寄件知识图谱。
[0044] 可选地,所述动态时序数据包括配送过程中各个时间点的时序单位数据,所述时序单位数据为路由信息、实体来电信息、实体投诉信息或者实体微信查单信息中的任意一
种;
[0045] 所述向量构建单元,用于:
[0046] 对所述动态时序数据按时间先后排序,得到排序后的动态时序数据;
[0047] 对排序后的动态时序数据进行标准化处理,得到标准化的动态时序数据;
[0048] 将标准化的动态时序数据输入训练过的双向长短时记忆模型,得到所述动态时序特征向量。
[0049] 可选地,所述向量拼接单元,用于:
[0050] 获取所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量的特征权重系数;
[0051] 根据所述特征权重系数对所述动态时序特征向量、所述运单静态特征向量、所述寄件实体特征向量以及所述收件实体特征向量进行加权拼接,得到所述运单特征向量。
[0052] 可选地,所述寄件实体特征向量的特征权重系数小于所述收件实体特征向量的特征权重系数。
[0053] 可选地,所述预测单元,用于:
[0054] 获取预设的多个规则权重计算策略,所述多个规则权重计算策略包括实体维度规则权重计算策略、路由维度规则权重计算策略、运单维度规则权重计算策略以及来电维度
规则权重计算策略中的至少一个;
[0055] 基于所述多个规则权重计算策略确定所述待预测运单在多个维度的规则权重;
[0056] 基于所述待预测运单在多个维度的规则权重确定概率修正系数;
[0057] 根据所述概率修正系数对所述待预测运单的所述实体来电概率修正,得到修正后的实体来电概率,其中,在所述实体来电概率为定值时,修正后的实体来电概率随着所述概
率修正系数的增大而增大。
[0058] 第三方面,本申请提供一种计算机设备,所述计算机设备包括:
[0059] 一个或多个处理器;
[0060] 存储器;以及
[0061] 一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现第一方面中任一项所述的物流实体来电的预测方法。
[0062] 第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行第一方面中任一项所述的物流实体来
电的预测方法中的步骤。
[0063] 本申请提供一种物流实体来电的预测方法、装置、计算机设备及存储介质,该物流实体来电的预测方法包括:获取待预测运单的运单静态数据和动态时序数据,其中,运单静
态数据是待预测运单在配送过程中保持不变的数据,动态时序数据是待预测运单在配送过
程中动态变化的数据;分别对动态时序数据和运单静态数据进行编码,得到动态时序数据
对应的动态时序特征向量和运单静态数据对应的运单静态特征向量;将动态时序特征向量
和运单静态特征向量拼接,得到运单特征向量;根据运单特征向量确定待预测运单的实体
来电概率。本申请获取运单静态数据和动态时序数据,对运单静态数据和动态时序数据的
特征向量进行拼接,然后根据拼接后的特征向量预测实体来电概率,综合考虑了运单在运
输过程中的时序数据和静态数据,相比较传统的基于全静态特征的实体来电预测模型具有
更高的预测准确率,从而能够提高物流实体来电的预测准确度。

附图说明

[0064] 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于
本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附
图。
[0065] 图1是本申请实施例提供的物流实体来电的预测系统的场景示意图;
[0066] 图2是本申请实施例中提供的物流实体来电的预测方法的一个实施例流程示意图;
[0067] 图3是本申请实施例中对动态时序数据标准化的一实施例示意图;
[0068] 图4是本申请实施例中S203的一个实施例流程示意图;
[0069] 图5是本申请实施例中提供的多个规则权重计算策略的一个实施例示意图;
[0070] 图6是本申请实施例中提供的物流实体来电的预测装置的一个实施例结构示意图;
[0071] 图7是本申请实施例中提供的计算机设备的一个实施例结构示意图。

具体实施方式

[0072] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于
本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施
例,都属于本申请保护的范围。
[0073] 在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,
因此不能理解为对本申请的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解
为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、
“第二”的特征可以明示或者隐含地包括一个或者更多个特征。在本申请的描述中,“多个”
的含义是两个或两个以上,除非另有明确具体的限定。
[0074] 在本申请中,“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任
何技术人员能够实现和使用本申请,给出了以下描述。在以下描述中,为了解释的目的而列
出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况
下也可以实现本申请。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必
要的细节使本申请的描述变得晦涩。因此,本申请并非旨在限于所示的实施例,而是与符合
本申请所公开的原理和特征的最广范围相一致。
[0075] 本申请实施例提供一种物流实体来电的预测方法、装置、计算机设备及存储介质,以下分别进行详细说明。
[0076] 请参阅图1,图1为本申请实施例所提供的物流实体来电的预测系统的场景示意图,该物流实体来电的预测系统可以包括计算机设备100,计算机设备100中集成有物流实
体来电的预测装置。
[0077] 本申请实施例中,该计算机设备100可以是独立的服务器,也可以是服务器组成的服务器网络或服务器集群,例如,本申请实施例中所描述的计算机设备100,其包括但不限
于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。
其中,云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。
[0078] 本申请实施例中,上述的计算机设备100可以是一个通用计算机设备或者是一个专用计算机设备。在具体实现中计算机设备100可以是台式机、便携式电脑、网络服务器、掌
上电脑(Personal Digital Assistant,PDA)、移动手机、平板电脑、无线终端设备、通信设
备、嵌入式设备等,本实施例不限定计算机设备100的类型。
[0079] 本领域技术人员可以理解,图1中示出的应用环境,仅仅是本申请方案的一种应用场景,并不构成对本申请方案应用场景的限定,其他的应用环境还可以包括比图1中所示更
多或更少的计算机设备,例如图1中仅示出1个计算机设备,可以理解的,该物流实体来电的
预测系统还可以包括一个或多个可处理数据的其他计算机设备,具体此处不作限定。
[0080] 另外,如图1所示,该物流实体来电的预测系统还可以包括存储器200,用于存储数据。
[0081] 需要说明的是,图1所示的物流实体来电的预测系统的场景示意图仅仅是一个示例,本申请实施例描述的物流实体来电的预测系统以及场景是为了更加清楚的说明本申请
实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术
人员可知,随着物流实体来电的预测系统的演变和新业务场景的出现,本申请实施例提供
的技术方案对于类似的技术问题,同样适用。
[0082] 首先,本申请实施例中提供一种物流实体来电的预测方法,物流实体来电的预测方法包括:获取待预测运单的运单静态数据和动态时序数据,其中,运单静态数据是待预测
运单在配送过程中保持不变的数据,动态时序数据是待预测运单在配送过程中动态变化的
数据;分别对动态时序数据和运单静态数据进行编码,得到动态时序数据对应的动态时序
特征向量和运单静态数据对应的运单静态特征向量;将动态时序特征向量和运单静态特征
向量拼接,得到运单特征向量;根据运单特征向量确定待预测运单的实体来电概率。
[0083] 如图2所示,图2是本申请实施例中物流实体来电的预测方法的一个实施例流程示意图,该物流实体来电的预测方法包括如下步骤S201~S204:
[0084] S201、获取待预测运单的运单静态数据和动态时序数据。
[0085] 本申请实施例中,待预测运单可以是物流系统中任一个处于配送过程中的物流运单。其中,配送过程指的是运单寄件开始至运单签收结束的过程。
[0086] 其中,运单静态数据是待预测运单在配送过程中保持不变的数据。具体的,运单静态数据可以包括:收寄件城市、收寄方城市经纬度、寄件时间、运费、是否保价、保价金额、托
寄物分类、增值服务类型以及是否空运中的至少一种。
[0087] 动态时序数据是待预测运单在配送过程中动态变化的数据。动态时序数据可以包括配送过程中各个时间点的时序单位数据,时序单位数据为路由信息、实体来电信息、实体
投诉信息或者实体微信查单信息中的任意一种。时序单位数据包括数据类型,操作类型、运
单位置、异常状态等。其中,数据类型为路由信息、实体来电信息、实体投诉信息或者实体微
信查单信息中的任意一种。例如,动态时序数据为:寄件、路由1、路由2、微信查单1……等多
个时序单位数据组成的序列。
[0088] 例如,2021年4月1日12点的时序单位数据是路由信息:待预测运单2021年4月1日12点,在深圳XXX营业点,进行寄件操作,操作类型为路由。实体来电信息可以是:待预测运
单在2021年4月2日12点,在广州XXX中转场,进行来电操作,操作类型为来电。
[0089] S202、分别对动态时序数据和运单静态数据进行编码,得到动态时序数据对应的动态时序特征向量和运单静态数据对应的运单静态特征向量。
[0090] 本申请实施例中,分别对动态时序数据和运单静态数据进行编码,得到动态时序数据对应的动态时序特征向量和运单静态数据对应的运单静态特征向量,包括:
[0091] (1)对动态时序数据按时间先后排序,得到排序后的动态时序数据。
[0092] (2)对排序后的动态时序数据进行标准化处理,得到标准化的动态时序数据。
[0093] 参阅图3,具体的,根据预定字段数字对应关系对排序后的动态时序数据进行标准化处理,得到标准化的动态时序数据。例如,动态时序数据中的操作类型为“寄件”时,记为
数字“0”。
[0094] 例如,2021年4月1日12点的时序单位数据是路由信息:待预测运单2021年4月1日12点,在深圳XXX营业点,进行寄件操作,操作类型为路由。标准化的时序单位数据为[0,0,
0,0,0,]。当然,预定字段数字对应关系可以根据具体情况设定。
[0095] (3)将标准化的动态时序数据输入训练过的双向长短时记忆模型,得到动态时序特征向量。
[0096] LSTM的全称是Long Short‑Term Memory(长短记忆网络),它是RNN(Recurrent Neural Network)的一种。LSTM由于其设计的特点,非常适合用于对时序数据的建模,如文
本数据。双向长短记忆网络(BiLSTM,Bi‑directional Long Short‑Term Memory)是由前向
LSTM与后向LSTM组合而成。两者在自然语言处理任务中都常被用来建模上下文信息。双向
长短记忆网络可以看成是两层神经网络,第一层从左边作为系列的起始输入,在文本处理
上可以理解成从句子的开头开始输入,而第二层则是从右边作为系列的起始输入,在文本
处理上可以理解成从句子的最后一个词语作为输入,反向做与第一层一样的处理处理。最
后对得到的两个结果进行处理。因此,双向长短记忆网络的输出向量包含前向与后向的所
有信息。
[0097] 本申请实施例中,将标准化的动态时序数据输入训练过的双向长短时记忆模型,得到动态时序特征向量。双向长短记忆网络的输出向量包含前向与后向的所有信息。动态
时序特征向量包含前向与后向的所有信息,考虑了运单正/反向的路由信息、实体来电信息
以及实体微信查单信息等实时的时序数据,能够提高预测准确度。
[0098] S203、将动态时序特征向量和运单静态特征向量拼接,得到运单特征向量。
[0099] 在一个具体的实施例中,获取动态时序特征向量、运单静态特征向量的特征权重系数;根据特征权重系数对动态时序特征向量、运单静态特征向量进行加权拼接,得到运单
特征向量。
[0100] 如图4所示,为了进一步提高预测准确率,在另一个具体的实施例中,将动态时序特征向量和运单静态特征向量拼接,得到运单特征向量,可以包括:
[0101] S301、获取多个实体之间进行收寄件的收寄件知识图谱,其中,多个实体中包含待预测运单的寄件实体和收件实体。
[0102] 本申请实施例中,多个实体包含待预测运单的寄件实体和收件实体。多个实体可以是物流网络中的所有物流实体。
[0103] 知识图谱本质上是语义网络(Semantic Network)的知识库。换个角度,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi‑relational Graph)。图
是由节点(Vertex)和边(Edge)来构成,但这些图通常只包含一种类型的节点和边。但相反,
多关系图一般包含多种类型的节点和多种类型的边。在知识图谱里,我们通常用“实体
(Entity)”来表达图里的节点、用“关系(Relation)”来表达图里的“边”。实体指的是现实世
界中的事物比如人、地名、概念、药物、公司等,关系则用来表达不同实体之间的某种联系,
比如人‑“居住在”‑北京、张三和李四是“朋友”、逻辑回归是深度学习的“先导知识”等等。现
实世界中的很多场景非常适合用知识图谱来表达。比如一个社交网络图谱里,我们既可以
有“人”的实体,也可以包含“公司”实体。人和人之间的关系可以是“朋友”,也可以是“同事”
关系。人和公司之间的关系可以是“现任职”或者“曾任职”的关系。类似的,一个风控知识图
谱可以包含“电话”、“公司”的实体,电话和电话之间的关系可以是“通话”关系,而且每个公
司它也会有固定的电话。
[0104] 本申请实施例中,获取多个实体之间进行收寄件的收寄件知识图谱,包括:
[0105] (1)获取多个实体中各个实体的实体标识、多个实体中各个实体的实体属性特征信息以及多个实体中任意两个实体之间的运单信息。
[0106] 具体的,获取预设历史时间段内多个实体中各个实体的实体标识、多个实体中各个实体的实体属性特征信息以及多个实体中任意两个实体之间的运单信息。其中,预设历
史时间段可以是历史一个月、历史两个月等,根据具体情况设定即可。实体标识可以是实体
的姓名、联系电话等。实体属性特征信息可以包括是否高散以及是否VIP等。运单信息可以
是任意两个实体之间的寄件量、运费总额、运单来电次数等。
[0107] (2)以多个实体中各个实体的实体标识为节点,以多个实体中各个实体的实体属性特征信息为节点属性,以多个实体中任意两个实体之间的运单信息为边属性,构建收寄
件知识图谱。
[0108] S302、对收寄件知识图谱进行编码,得到寄件实体的寄件实体特征向量和收件实体的收件实体特征向量。
[0109] 本申请实施例中,将构建好的收寄件知识图谱使用节点嵌入(Node Embedding)的方式编码,输出各个节点实体特征向量,得到寄件实体的寄件实体特征向量和收件实体的
收件实体特征向量。
[0110] 其中,节点嵌入(Node Embedding)的方式可以是DeepWalk、Node2vec以及SDNE等。DeepWalk通过随机游走(truncated random walk)学习出一个网络的表示,在网络标注顶
点很少的情况也能得到比较好的效果。Node2vec是DeepWalk的改进版,定义了一个bias 
random walk的策略生成序列,仍然用skip gram去训练。该算法引入了参数P和Q,参数Q关
注随机游走中未发现部分的可能性,即控制着游走是向外还是向内:若Q>1,随机游走倾向
于访问接近的顶点(偏向BFS);若Q<1,倾向于访问远离的顶点(偏向DFS)。SDNE没有采用随
机游走的方法而是使用自动编码器来同时优化一阶和二阶相似度,学习得到的向量表示保
留局部和全局结构,并且对稀疏网络具有鲁棒性。根据需求采用适当的节点嵌入算法即可。
[0111] S303、将动态时序特征向量、运单静态特征向量、寄件实体特征向量以及收件实体特征向量拼接,得到运单特征向量。
[0112] 本申请实施例中,将动态时序特征向量、运单静态特征向量、寄件实体特征向量以及收件实体特征向量拼接,得到运单特征向量,包括:
[0113] (1)获取动态时序特征向量、运单静态特征向量、寄件实体特征向量以及收件实体特征向量的特征权重系数。
[0114] 本申请实施例中,动态时序特征向量Vd的特征权重系数为1、运单静态特征向量V1的特征权重系数为1、寄件实体特征向量Vj的特征权重系数为α、以及收件实体特征向量Vs的
特征权重系数为β,系数α和β用于调整收寄方的实体特征权重。
[0115] 由于收件方来电的占比较高,在一个优选地实施例中,寄件实体特征向量Vj的特征权重系数α小于收件实体特征向量Vs的特征权重系数β。例如,寄件实体特征向量Vj的特征
权重系数α取0.4~0.6,收件实体特征向量Vs的特征权重系数β取0.8~1.0。通过提高收件
实体特征向量的特征权重系数,能够使得预测过程中更多考虑收件方的特征,从而提高预
测准确度。在其他实施例中,系数α和β根据具体设定即可。
[0116] (2)根据特征权重系数对动态时序特征向量、运单静态特征向量、寄件实体特征向量以及收件实体特征向量进行加权拼接,得到运单特征向量。
[0117] 在一个具体的实施例中,根据公式(1)对运单静态特征向量V1、动态时序特征向量Vd、寄件实体特征向量Vj以及收件实体特征向量Vs进行加权拼接,最终输出运单特征向量V,
[0118] V=V1∪Vd∪(Vj*α)∪(Vs*β)   (1)
[0119] 其中,α为寄件实体特征向量Vj的特征权重系数,β为收件实体特征向量Vs的特征权重系数。
[0120] 本申请基于知识图谱联合Node Embedding(节点嵌入)算法构建了实体特征向量。相比较传统算法的只考虑独立个体的实体特征,本申请增加了实体之间(例如亲属之间、企
业之间、高频来电实体之间)的收寄件和来电行为,预测准确率有了大幅度的提升。
[0121] S204、根据运单特征向量确定待预测运单的实体来电概率。
[0122] 本申请实施例中,将运单特征向量V输入训练过的二分类树模型,得到待预测运单的实体来电概率P。二分类树模型可以是GBDT、LightGBM、Xgboost等。训练过的二分类树模
型是以运单特征向量样本和对应的标签为输入进行训练得到的。
[0123] 鉴于机器学习模型预测的方式可能会出现误判,为了避免该情况,进一步的,物流实体来电的预测方法还包括:
[0124] (1)获取预设的多个规则权重计算策略,多个规则权重计算策略包括实体维度规则权重计算策略、路由维度规则权重计算策略、运单维度规则权重计算策略以及来电维度
规则权重计算策略中的至少一个。
[0125] 其中,各个规则权重计算策略可以根据具体情况设定。
[0126] 如图5所示,实体维度规则权重计算策略可以包括多个实体维度子规则。路由维度规则权重计算策略可以包括多个路由维度子规则。运单维度规则权重计算策略可以包括多
个运单维度子规则。
[0127] 实体维度子规则可以是:获取收寄方时效客诉的最大运单占比,根据最大运单占比确定规则子权重。例如,最大运单占比是0‑20%,则规则子权重为0;最大运单占比是
20%‑40%,则规则子权重为1。实体维度子规则可以是:判断寄方实体是否为高频来电实
体,若是,则规则子权重为1;若否,则规则子权重为0。来电维度规则权重计算策略可以是:
根据待预测运单当前的来电数量确定规则子权重。例如,待预测运单当前的来电数量是0,
则规则子权重为0;待预测运单当前的来电数量是1,则规则子权重为1。
[0128] (2)基于多个规则权重计算策略确定待预测运单在多个维度的规则权重。
[0129] 具体的,获取待检测运单的寄方实体和收方实体,获取寄方实体和收方实体的历史行为信息。根据寄方实体和收方实体的历史行为信息使用实体维度规则权重计算策略进
行各个规则子权重的计算,得到实体维度规则权重计算策略下的各个规则子权重组成的实
体维度规则子权重集,将实体维度规则子权重集中最大的权重确定为实体维度的规则权
重。历史行为信息可以包括收寄方时效客诉的最大运单占比、收方是否为高频来电客户、寄
方是否为高频来电客户、寄方会员等级等。当然,在其他实施例中,也可以将实体维度规则
子权重集中最大的权重确定为实体维度的规则权重。
[0130] 根据同样的原理,分别计算实体维度的规则权重、路由维度的规则权重、运单维度的规则权重以及来电维度的规则权重,得到待预测运单在多个维度的规则权重。
[0131] (3)基于待预测运单在多个维度的规则权重确定概率修正系数。
[0132] 在一个具体的实施例中,将各个维度的规则子权重集中最大的权重确定为各个维度的规则权重;将各个维度的规则权重之和确定为运单规则总权重;使用多个配送中运单
的规则总权重对待预测运单的运单规则总权重进行归一化,得到概率修正系数。
[0133] 具体的,根据公式(2)计算概率修正系数S*,
[0134]
[0135] 其中,Wu为实体维度规则权重计算策略下的各个规则子权重组成的实体维度规则子权重集;
[0136] Wf为路由维度规则权重计算策略下的各个规则子权重组成的路由维度规则子权重集;
[0137] Wy为运单维度规则权重计算策略下的各个规则子权重组成的运单维度规则子权重集;
[0138] Wc为来电维度规则权重计算策略下的各个规则子权重组成的来电维度规则子权重集;
[0139] S是待预测运单的运单规则总权重;
[0140] min(S)是多个配送中运单的多个规则总权重中的最小值;
[0141] max(S)是多个配送中运单的多个规则总权重中的最大值。
[0142] (4)根据概率修正系数对待预测运单的实体来电概率修正,得到修正后的实体来电概率。
[0143] 其中,在待预测运单的实体来电概率为一定值时,修正后的实体来电概率随着概率修正系数的增大而增大。当概率修正系数越大时,表明待预测运单命中各个规则权重计
算策略中各个规则的数量和级别越高,表明待预测运单更有可能出现实体来电。使用概率
修正系数对机器学习模型预测的结果进行修正,能够避免机器学习模型误判,提高预测准
确度。
[0144] 在一个具体的实施例中,根据公式(3)确定修正后的实体来电概率P*,
[0145]
[0146] 本申请实施例中,φ为中间系数,P为根据运单特征向量确定的实体来电概率P,P*为修正后的实体来电概率。
[0147] 进一步的,判断修正后的实体来电概率P*是否小于预设值Pt,若修正后的实体来电* t
概率P是小于预设值P ,则输出实体将在预设时间内来电的预测结果R;若修正后的实体来
* t t
电概率P不小于预设值P,则输出实体将在预设时间内来电的预测结果R。其中,P可根据具
t
体情况设置,例如,P为0.5。具体根据公式(4)输出预测结果R,
[0148]
[0149] 为了更好实施本申请实施例中物流实体来电的预测方法,在物流实体来电的预测方法基础之上,本申请实施例中还提供一种物流实体来电的预测装置,如图6所示,物流实
体来电的预测装置400包括:
[0150] 获取单元401,用于获取待预测运单的运单静态数据和动态时序数据,其中,运单静态数据是待预测运单在配送过程中保持不变的数据,动态时序数据是待预测运单在配送
过程中动态变化的数据;
[0151] 向量构建单元402,用于分别对动态时序数据和运单静态数据进行编码,得到动态时序数据对应的动态时序特征向量和运单静态数据对应的运单静态特征向量;
[0152] 向量拼接单元403,用于将动态时序特征向量和运单静态特征向量拼接,得到运单特征向量;
[0153] 预测单元404,用于根据运单特征向量确定待预测运单的实体来电概率。
[0154] 可选地,向量拼接单元403,用于:
[0155] 获取多个实体之间进行收寄件的收寄件知识图谱,其中,多个实体中包含待预测运单的寄件实体和收件实体;
[0156] 对收寄件知识图谱进行编码,得到寄件实体的寄件实体特征向量和收件实体的收件实体特征向量;
[0157] 将动态时序特征向量、运单静态特征向量、寄件实体特征向量以及收件实体特征向量拼接,得到运单特征向量。
[0158] 可选地,向量拼接单元403,用于:
[0159] 获取多个实体中各个实体的实体标识、多个实体中各个实体的实体属性特征信息以及多个实体中任意两个实体之间的运单信息;
[0160] 以多个实体中各个实体的实体标识为节点,以多个实体中各个实体的实体属性特征信息为节点属性,以多个实体中任意两个实体之间的运单信息为边属性,构建收寄件知
识图谱。
[0161] 可选地,动态时序数据包括配送过程中各个时间点的时序单位数据,时序单位数据为路由信息、实体来电信息、实体投诉信息或者实体微信查单信息中的任意一种;
[0162] 向量构建单元402,用于:
[0163] 对动态时序数据按时间先后排序,得到排序后的动态时序数据;
[0164] 对排序后的动态时序数据进行标准化处理,得到标准化的动态时序数据;
[0165] 将标准化的动态时序数据输入训练过的双向长短时记忆模型,得到动态时序特征向量。
[0166] 可选地,向量拼接单元403,用于:
[0167] 获取动态时序特征向量、运单静态特征向量、寄件实体特征向量以及收件实体特征向量的特征权重系数;
[0168] 根据特征权重系数对动态时序特征向量、运单静态特征向量、寄件实体特征向量以及收件实体特征向量进行加权拼接,得到运单特征向量。
[0169] 可选地,寄件实体特征向量的特征权重系数小于收件实体特征向量的特征权重系数。
[0170] 可选地,预测单元404,用于:
[0171] 获取预设的多个规则权重计算策略,多个规则权重计算策略包括实体维度规则权重计算策略、路由维度规则权重计算策略、运单维度规则权重计算策略以及来电维度规则
权重计算策略中的至少一个;
[0172] 基于多个规则权重计算策略确定待预测运单在多个维度的规则权重;
[0173] 基于待预测运单在多个维度的规则权重确定概率修正系数;
[0174] 根据概率修正系数对待预测运单的实体来电概率修正,得到修正后的实体来电概率,其中,在实体来电概率为定值时,修正后的实体来电概率随着概率修正系数的增大而增
大。
[0175] 本申请实施例还提供一种计算机设备,其集成了本申请实施例所提供的任一种物流实体来电的预测装置,计算机设备包括:
[0176] 一个或多个处理器;
[0177] 存储器;以及
[0178] 一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并配置为由处理器执行上述物流实体来电的预测方法实施例中任一实施例中的物流实体来电的预测
方法中的步骤。
[0179] 如图7所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
[0180] 该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以
理解,图中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或
更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0181] 处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储
在存储器502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整
体监控。可选的,处理器501可包括一个或多个处理核心;处理器501可以是中央处理单元
(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital 
Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,
ASIC)、现成可编程门阵列(Field‑Programmable Gate Array,FPGA)或者其他可编程逻辑
器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处
理器也可以是任何常规的处理器等,优选的,处理器501可集成应用处理器和调制解调处理
器,其中,应用处理器主要处理操作系统、实体界面和应用程序等,调制解调处理器主要处
理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。
[0182] 存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程
序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比
如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的
数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如
至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以
包括存储器控制器,以提供处理器501对存储器502的访问。
[0183] 计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理
等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检
测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0184] 该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与实体设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信
号输入。
[0185] 尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对
应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程
序,从而实现各种功能,如下:
[0186] 获取待预测运单的运单静态数据和动态时序数据,其中,运单静态数据是待预测运单在配送过程中保持不变的数据,动态时序数据是待预测运单在配送过程中动态变化的
数据;分别对动态时序数据和运单静态数据进行编码,得到动态时序数据对应的动态时序
特征向量和运单静态数据对应的运单静态特征向量;将动态时序特征向量和运单静态特征
向量拼接,得到运单特征向量;根据运单特征向量确定待预测运单的实体来电概率。
[0187] 本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存
储介质中,并由处理器进行加载和执行。
[0188] 为此,本申请实施例提供一种计算机可读存储介质,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光
盘等。其上存储有计算机程序,计算机程序被处理器进行加载,以执行本申请实施例所提供
的任一种物流实体来电的预测方法中的步骤。例如,计算机程序被处理器进行加载可以执
行如下步骤:
[0189] 获取待预测运单的运单静态数据和动态时序数据,其中,运单静态数据是待预测运单在配送过程中保持不变的数据,动态时序数据是待预测运单在配送过程中动态变化的
数据;分别对动态时序数据和运单静态数据进行编码,得到动态时序数据对应的动态时序
特征向量和运单静态数据对应的运单静态特征向量;将动态时序特征向量和运单静态特征
向量拼接,得到运单特征向量;根据运单特征向量确定待预测运单的实体来电概率。
[0190] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对其他实施例的详细描述,此处不再赘述。
[0191] 具体实施时,以上各个单元或结构可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元或结构的具体实施可参见前面的方法
实施例,在此不再赘述。
[0192] 以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0193] 以上对本申请实施例所提供的一种物流实体来电的预测方法、装置、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐
述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的
技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,
本说明书内容不应理解为对本申请的限制。