数据处理方法、装置、计算机可读介质及电子设备转让专利

申请号 : CN201910307427.9

文献号 : CN110070391B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 孙承露

申请人 : 同盾控股有限公司

摘要 :

本公开涉及数据处理技术领域,具体而言,涉及一种数据处理方法、装置、计算机可读存储介质及电子设备。其中,上述方法包括:获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定;根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值;根据所述兴趣分值确定对所述第一目标用户的处理策略。本技术方案基于大数据进行预测有利于提高预测准确性,预测结果贴合实际,有利于提升营销响应率和营销转化率。

权利要求 :

1.一种数据处理方法,其特征在于,应用于分别与多个信贷客户通讯连接的第三方平台,包括:获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定,其中所述第一数据接口对应于第一信贷客户,所述第二数据接口对应于第二信贷客户;

根据所述第一信贷客户的预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;

基于关于信贷产品的兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值,其中,所述兴趣分值预测模型是根据多业务场景、多种信贷产品的目标样本数据训练得到的;

根据所述兴趣分值确定对所述第一目标用户的处理策略;

根据所述兴趣分值预测模型的输出结果确定所述第一目标用户的用户画像,所述用户画像包括多个用户标签;

根据所述用户标签匹配来自所述第二信贷客户的预测需求,以从所述第一目标用户中确定第二目标用户,以将所述第二目标用户推荐给所述第二信贷客户。

2.根据权利要求1所述的数据处理方法,其特征在于,根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据,包括:基于所述第一目标用户的身份标识,根据所述预测需求中目标产品的特征,在所述用户数据库中匹配数据,得到所述第一目标用户的行为数据。

3.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:获取样本数据并训练机器学习模型得到所述兴趣分值预测模型。

4.根据权利要求3所述的数据处理方法,其特征在于,获取样本数据并训练机器学习模型得到所述兴趣分值预测模型,包括:从所述用户数据库获取多维候选变量对应的候选样本数据;

针对至少一种产品,将在预设时间内产生响应数据的候选样本数据作为正样本数据,以及,将在预设时间内未产出响应的候选样本数据作为负样本数据;

针对至少一种产品,筛选所述多维候选变量得到目标变量对应的目标样本数据;

基于所述目标样本数据训练逻辑回归模型,得到关于至少一种产品的兴趣分值预测模型。

5.根据权利要求4所述的数据处理方法,其特征在于,筛选所述多维候选变量得到目标变量对应的目标样本数据,包括:根据所述候选样本数据获取每一维候选变量的预测能力值;

将符合预设条件的预测能力值对应的候选变量作为所述目标变量,以得到所述目标变量对应的目标样本数据。

6.根据权利要求4或5所述的数据处理方法,其特征在于,所述多维候选变量包括:用户关于至少一种产品的行为数据、用户互联网行为数据、用户关于不同产品的偏好数据、用户社交关系数据中的一种或几种。

7.根据权利要求1所述的数据处理方法,其特征在于,基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值,包括:根据所述行为数据,确定N种产品对应的目标变量,其中,N为大于等于1的正整数;

将所述目标变量输入至所述兴趣分值预测模型,得到输出结果;

根据所述输出结果,确定所述第一目标用户关于所述N种产品的兴趣分值。

8.根据权利要求7所述的数据处理方法,其特征在于,根据所述兴趣分值确定对所述第一目标用户的处理策略,包括:对于所述N种产品中的第i种产品:

根据关于所述第i种产品的兴趣分值,将所述第一目标用户分层;

针对不同层的第一目标用户,确定关于所述第i种产品的不同处理策略,其中,i大于等于1小于等于N。

9.根据权利要求4或5或权利要求7或8所述的数据处理方法,其特征在于,所述目标变量包括:用户关于至少一种产品的行为数据、用户互联网行为数据、用户关于不同产品的偏好数据、用户社交关系数据中的一种或几种。

10.根据权利要求9所述的数据处理方法,其特征在于,在根据所述兴趣分值确定对所述第一目标用户的处理策略之后,所述方法还包括:根据所述兴趣分值预测模型的输出结果更新所述用户数据库。

11.一种数据处理装置,其特征在于,应用于分别与多个信贷客户通讯连接的第三方平台,包括:数据库获取模块,用于获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定,其中所述第一数据接口对应于第一信贷客户,所述第二数据接口对应于第二信贷客户;

行为数据获取模块,用于根据所述第一信贷客户的预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;

兴趣分值确定模块,用于基于关于信贷产品的兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值,其中,所述兴趣分值预测模型是根据多业务场景、多种信贷产品的目标样本数据训练得到的;

策略确定模块,用于根据所述兴趣分值确定对所述第一目标用户的处理策略;

用户画像确定模块,用于根据所述兴趣分值预测模型的输出结果确定所述第一目标用户的用户画像,所述用户画像包括多个用户标签;

目标用于推荐模块用于根据所述用户标签匹配来自所述第二信贷客户的预测需求,以从所述第一目标用户中确定第二目标用户,以将所述第二目标用户推荐给所述第二信贷客户。

12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至10中任一项所述的数据处理方法。

13.一种电子设备,其特征在于,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至10中任一项所述的数据处理方法。

说明书 :

数据处理方法、装置、计算机可读介质及电子设备

技术领域

[0001] 本公开涉及数据处理技术领域,具体而言,涉及一种数据处理方法、数据处理装置,以及实现所述数据处理方法的计算机可读存储介质及电子设备。

背景技术

[0002] 现在的营销产品的方法一般是随机挑选用户,然后通过向挑选的用户拨打电话和发送短信来进行营销。例如,信贷机构随机挑选用户,向用户拨打电话或发送短信向其营销信贷产品。又例如,保险公司随机挑选用户,向用户拨打电话或发送短信向其营销保险产品等。
[0003] 然而,现有的营销方式成本高,不仅造成了人力物力的浪费,而且被营销人员的响应率低。
[0004] 需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

[0005] 本公开实施例的目的在于提供一种数据处理方法、数据处理装置,以及实现所述数据处理方法的计算机可读存储介质及电子设备,进而至少在一定程度上节省了营销成本,并提高营销响应率。
[0006] 本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007] 根据本公开实施例的第一方面,提供了一种数据处理方法,包括:
[0008] 获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定;
[0009] 根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;
[0010] 基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值;
[0011] 根据所述兴趣分值确定对所述第一目标用户的处理策略。
[0012] 根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据,包括:
[0013] 基于所述第一目标用户的身份标识,根据所述预测需求中目标产品的特征,在所述用户数据库中匹配数据,得到所述第一目标用户的行为数据。
[0014] 在本公开的一些实施例中,基于前述方案,所述数据处理方法还包括:
[0015] 获取样本数据并训练机器学习模型得到所述兴趣分值预测模型。
[0016] 在本公开的一些实施例中,基于前述方案,获取样本数据并训练机器学习模型得到所述兴趣分值预测模型,包括:
[0017] 从所述用户数据库获取多维候选变量对应的候选样本数据;
[0018] 针对至少一种产品,将在预设时间内产生响应数据的候选样本数据作为正样本数据,以及,将在预设时间内未产出响应的候选样本数据作为负样本数据;
[0019] 针对至少一种产品,筛选所述多维候选变量得到目标变量对应的目标样本数据;
[0020] 基于所述目标样本数据训练逻辑回归模型,得到关于至少一种产品的兴趣分值预测模型。
[0021] 在本公开的一些实施例中,基于前述方案,筛选所述多维候选变量得到目标变量对应的目标样本数据,包括:
[0022] 根据所述候选样本数据获取每一维候选变量的预测能力值;
[0023] 将符合预设条件的预测能力值对应的候选变量作为所述目标变量,以得到所述目标变量对应的目标样本数据。
[0024] 在本公开的一些实施例中,基于前述方案,所述多维候选变量包括:用户关于至少一种产品的行为数据、用户互联网行为数据、用户关于不同产品的偏好数据、用户社交关系数据中的一种或几种。
[0025] 在本公开的一些实施例中,基于前述方案,基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值,包括:
[0026] 根据所述行为数据,确定N种产品对应的目标变量,其中,N为大于等于1的正整数;
[0027] 将所述目标变量输入至所述兴趣分值预测模型,得到输出结果;
[0028] 根据所述输出结果,确定所述第一目标用户关于所述N种产品的兴趣分值。
[0029] 在本公开的一些实施例中,基于前述方案,根据所述兴趣分值确定对所述第一目标用户的营销策略,包括:
[0030] 对于所述N种产品中的第i种产品:
[0031] 根据关于所述第i种信贷产品的兴趣分值,将所述第一目标用户分层;
[0032] 针对不同层的第一目标用户,确定关于所述第i种产品的不同处理策略,其中,i大于等于1小于等于N。
[0033] 在本公开的一些实施例中,基于前述方案,所述目标变量包括:用户关于至少一种产品的行为数据、用户互联网行为数据、用户关于不同产品的偏好数据、用户社交关系数据中的一种或几种。
[0034] 在本公开的一些实施例中,基于前述方案,在根据所述兴趣分值确定对所述第一目标用户的处理策略之后,所述方法还包括:
[0035] 根据所述兴趣分值预测模型的输出结果更新所述用户数据库。
[0036] 在本公开的一些实施例中,基于前述方案,所述数据处理方法还包括:
[0037] 根据所述兴趣分值预测模型的输出结果确定所述第一目标用户的用户画像,所述用户画像包括多个用户标签;
[0038] 根据所述用户标签匹配来自第二接口的预测需求,以从所述第一目标用户中确定第二目标用户,以将所述第二目标用户推荐给所述第二接口。
[0039] 根据本公开实施例的第二方面,提供了一种数据处理装置,包括:
[0040] 数据库获取模块,用于获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定;
[0041] 行为数据获取模块,用于根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;
[0042] 兴趣分值确定模块,用于基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值;
[0043] 策略确定模块,用于根据所述兴趣分值确定对所述第一目标用户的处理策略。
[0044] 根据本公开实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的数据处理方法。
[0045] 根据本公开实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的数据处理方法。
[0046] 本公开实施例提供的技术方案可以包括以下有益效果:
[0047] 一方面,在本公开的一些实施例所提供的技术方案中,通过多渠道(而不局限于当前客户)获取数据信息来确定用户数据库,并根据来自第一数据接口的当前客户(即上述第一客户)的预测需求在此用户数据库中匹配数据,以获取其目标用户的行为数据,进而为当前客户提供更为全面的目标用户信息。同时,全面的行为数据有利于丰富目标用户的用户画像,进而有利于提高兴趣分值的预测准确性,从而提高营销针对性以及营销效率。
[0048] 另一方面,在本公开的一些实施例所提供的技术方案中,通过训练后的机器学习模型预测目标用户对营销产品的兴趣分值,基于大数据进行预测有利于提高预测准确性,预测结果贴合实际,有利于提升相关产品的营销响应率和营销转化率。
[0049] 再一方面,在本公开的一些实施例所提供的技术方案中,为不同兴趣分值的第一目标用户确定不同的处理策略(如对目标产品的营销策略),能够有效筛选高意向和符合资质的目标用户,有利于进一步提升营销响应率和营销转化率。同时,根据兴趣峰值对目标用户分层处理,能够避免对无意向用户的打扰,从而提升用户体验。
[0050] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

[0051] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0052] 图1示出了根据本公开实施例的数据处理方法的流程示意图;
[0053] 图2示出了根据本公开实施例的兴趣分值预测模型的确定方法的流程示意图;
[0054] 图3示出了根据本公开实施例的目标样本数据的确定方法的流程示意图;
[0055] 图4示出了根据本公开实施例的第一目标用户的兴趣分值的确定方法;
[0056] 图5示出根据本公开实施例的营销策略的确定方法的流程示意图;
[0057] 图6示出了根据本公开的实施例的数据处理装置的结构示意图;
[0058] 图7示意性示出一种用于实现上述数据处理方法的计算机可读存储介质;以及,[0059] 图8示意性示出一种用于实现上述数据处理方法的电子设备示例框图。

具体实施方式

[0060] 现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
[0061] 此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
[0062] 附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0063] 附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0064] 现有的相关技术中,通过随机挑选用户展开营销,不考虑其是否需要信贷产品,均进行发短信或者打电话营销。这种针对性差的营销方式营销效率低,且将打扰无借贷意愿用户,甚至会接到很多用户投诉并引起用户反感。同时,营销成本高,很多人并没有借贷需求,但是广发短信和打电话,本身就需要一定的营销成本,不仅效果甚微,还浪费人力资源。
[0065] 图1示出了根据本公开实施例的数据处理方法的流程示意图,可以至少在一定程度上节省了营销成本,并提高营销响应率。
[0066] 其中,本实施例提供的数据处理方法的执行主体可以是具有计算处理功能的设备,比如信贷产品第三方平台的服务器,其中,信贷产品第三方平台能够为不同信贷公司提供营销策略。
[0067] 参考图1,该实施例提供的数据处理方法,包括:
[0068] 步骤S110,获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定;
[0069] 步骤S120,根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;
[0070] 步骤S130,基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值;以及
[0071] 步骤S140,根据所述兴趣分值确定对所述第一目标用户的处理策略。
[0072] 在图1所示实施例所提供的技术方案中,一方面,通过多渠道(而不局限于当前客户)获取数据信息来确定用户数据库,并根据来自第一数据接口的当前客户(即上述第一客户)的预测需求在此用户数据库中匹配数据,以获取其目标用户的行为数据,进而为当前客户提供更为全面的目标用户信息,同时,全面的行为数据有利于丰富目标用户的用户画像,进而有利于提高兴趣分值的预测准确性,从而提高营销针对性以及营销效率。
[0073] 另一方面,通过训练后的机器学习模型预测目标用户对营销产品的兴趣分值,基于大数据进行预测有利于提高预测准确性,预测结果贴合实际,有利于提升相关产品的营销响应率和营销转化率。
[0074] 再一方面,为不同兴趣分值的第一目标用户确定不同的营销策略,能够有效筛选高意向和符合资质的目标用户,有利于进一步提升营销响应率和营销转化率。同时,根据兴趣峰值对目标用户分层处理,能够避免对无意向用户的打扰,从而提升用户体验。
[0075] 以下对图1所示实施例中的各个步骤的具体实施方式进行详细阐述。
[0076] 在示例性的实施例中,信贷产品第三方平台接收不同信贷公司的预测需求。本实施例中,为不同信贷公司设置不同的数据接口,则来自第一数据接口的预测需求是来自第一信贷公司(第一客户)的预测需求。
[0077] 其中,上述第一客户可以用于表示当前客户,而上述第二客户可以用于表示除了当前客户之外其他一个或多个客户。本实施例中,根据多个客户的用户数据确定上述用户数据库。进而,在用户数据库中确定与当前客户的预测需求相匹配的数据。以获取对应于当前客户的第一目标用户的行为数据。例如,A信贷机构(当前客户)将s用户作为其目标用户,但是,s用户并没有与A信贷机构有个信息往来。本实施例中通过扩大数据库中的数据来源,避免了当前客户对其目标客户了解匮乏的问题。
[0078] 在示例性的实施例中,在上述用户数据库中,通过用户身份标识来区分用户特征。进一步地,步骤S110中根据第一客户的预测需求在上述用户数据库中匹配数据的具体实施方式,可以是:基于第一目标用户的身份标识,根据所述预测需求中营销产品的特征,在所述用户数据库中匹配数据,得到所述第一目标用户的行为数据。示例性的,第一客户打算营销产品的特征包括:小额短期贷款、分期还款制等,目标用户的身份标识是ID1。则将用户数据库中关于ID1的数据以及对应的时间点作为上述第一目标客户的行为数据。通过身份标识对用户数据库中的数据进行标记与区分,有利于获取目标用户整个信贷生命周期内的全部数据,进而塑造较为全面的用户画像。进而使得基于行为数据的兴趣分值预测更加准确、更具有说服性。
[0079] 在示例性的实施例中,上述用户数据库是实时更新的,例如将当前客户提供的用户数据实时更新至用户数据库中,以使用户数据库中的数据全面丰富,从而融合多维数据建立了更全面的客户画像标签体系,基于不同身份标识构建用户的自然属性、金融资产、信贷属性、生活方式、兴趣偏好等特征标签,为营销活动提供更多支持。
[0080] 在示例性的实施例中,上述第一目标用户的行为数据,可以是从用户数据库中获取的历史行为数据。也可以是,当前营销过程中产生的数据。例如,用户当前在信贷机构完成了注册,则获取用户在未来一段时间内是否会出现申请借贷等数据等,也可以作为用户的行为数据。
[0081] 在示例性的实施例中,步骤S130中兴趣分值预测模型是通过获取样本数据并训练机器学习模型得到的。在示例性的实施例中,上述机器学习模型可以是逻辑回归模型、决策树模型、人工神经网络ANN等。示例性的,以逻辑回归模型为例,在图2示出了根据本公开实施例的兴趣分值预测模型的确定方法的流程示意图。参考图2,该实施例提供的方法包括步骤S210-步骤S240。
[0082] 在步骤S210中,从所述用户数据库获取多维候选变量对应的候选样本数据。
[0083] 在示例性的实施例中,在上述用户数据库中获取机器学习所需样本。另外,多维候选向量为与机器学习模型的输出(兴趣分值)可能有影响关系的变量,是对机器学习模型的输出有影响的变量。假如机器学习模型的输出为对信贷产品的兴趣分值,则上述多维候选变量可以包括:用户借贷行为数据、用户互联网行为数据、金融属性数据、个人借贷偏好数据、社交关系数据、用户年龄段、用户性别、用户工作类型、以及是否有过购买过信贷产品等。
[0084] 对于上述多维候选变量对应的候选样本数据,需通过步骤S220进行进一步地标记处理。具体的:
[0085] 在步骤S220中,针对至少一种产品,将在预设时间内产生响应数据的候选样本数据作为正样本数据,以及,将在预设时间内未产出响应的候选样本数据作为负样本数据。
[0086] 在示例性的实施例中,对于上述候选样本数据,将在预设时间内(例如一个月)产生相应数据的标记为正样本。反之,在预设时间内未产出响应的候选样本数据作为负样本数据。例如,在信贷机构的营销过程中,对于年龄段为30-35岁的候选变量,去为注册未申请借贷的用户,可选取注册时间为观测时间起点,观察其在之后的一个月内是否有申请借贷。若发生申请借贷则将此样本为确定用户年龄段(候选变量)对应的正样本;若未发生申请借贷则将此样本为确定用户年龄段(候选变量)对应的负样本。并根据此标记处理方法,将其与候选变量对应的候选样本数据进行处理。
[0087] 在示例性的实施例中,本技术方案提供的兴趣分值预测模型对不限于一种信贷产品的兴趣分值进行预测。示例性的,信贷产品L的特征包括:小额短期贷款、分期还款制;信贷产品M的特征包括:大额长期贷款、分期还款制;信贷产品N的特征包括:大额长期贷款、非分期还款制。也就是说,根据用户对不同特征类型的信贷产品的响应数据,确定对不同特征的信贷产品的兴趣分值处理模型。从而满足客户(信贷机构)对不同信贷产品的预测需求,有利于提高客户的预测体验。
[0088] 在示例性的实施例中,对每一种信贷产品,设置有不同的业务场景,包括:潜在新用户场景、注册未申请借贷场景、申请借贷未支用业务场景、结清未复贷场景中的一种或几种。针对每一信贷产品的不同的场景,将多维候选特征对应的候选样本数据标记为正样本、负样本。可见,在确定候选样本数据后,通过数据处理转换和/或特征衍生,实现多信贷产品、多业务场景的设置,进而能够从多维度预测目标用户的兴趣分值。模型的场景丰富,业务理解深刻,业务结合场景的新营销方式,给信贷行业带来了新的互联网营销方式。例如,可以预测用户q对不同信贷产品的兴趣分值,从而推断属于用户q的用户标签,进而丰富用户q的用户画像,有利于根据用户标签为用户q匹配高意愿信贷产品。再例如,通过统计不同业务场景中用户行为数据,有利于客户(信贷机构)发现潜在用户,从而有利于将潜在客户发展为存量客户等。
[0089] 在步骤S230中,针对至少一种产品,筛选所述多维候选变量得到目标变量对应的目标样本数据。
[0090] 在示例性的实施例中,图3示出了根据本公开实施例的目标样本数据的确定方法的流程示意图,具体可用于解释步骤S230的一种具体实施方式。参考图3,该方法包括:
[0091] 在步骤S310中,根据所述候选样本数据获取每一维候选变量的预测能力值。
[0092] 对于标记处理之后的候选样本数据,进行特征筛选处理。具体通过信息价值(Information Value,简称:IV)衡量候选变量的预测能力,然后根据IV的高低对候选特征进行筛选。通过对变量的筛选处理,挑选出优质稳定的模型变量,使兴趣分值模型在后期的运用中,具有更强的稳定性和可解释性。
[0093] 在示例性的实施例中,(1)将一候选变量WOE编码,具体地:将候选变量对应的候选样本数据进行分组处理(也叫离散化处理或分箱处理)。然后,对于第i组,通过公式一计算WOEi;
[0094]
[0095] 公式一中,pyi是此候选变量的第i组候选样本中被标记为正样本占所有样本中所有响应客户的比例,pni是此候选变量的第i组候选样本中被标记为负样本占所有样本中所有响应客户的比例,#yi是此候选变量的第i组候选样本中被标记为正样本的数量,#ni是此候选变量的第i组候选样本中被标记为负样本的数量,#yT是此候选变量对应的候选样本中被标记为正样本的总数量,#nT此候选变量对应的候选样本中被标记为负样本的总数量。
[0096] (2)根据WOEi编码计算候选变量的IVi,具体地:对于第i组,通过公式二计算IVi;
[0097] IVi=(pyi-pni)*WOEi   公式二
[0098] (3)将此候选变量所有组的IVi求和得到此候选变量对应的IV。进一步地,计算所有候选变量的IV。
[0099] 在步骤S320中,将符合预设条件的预测能力值对应的候选变量作为所述目标变量,以得到所述目标变量对应的目标样本数据。
[0100] 将IV值大于预设阈值的候选变量作为目标变量,并将目标变量对应的样本数据作为目标样本数据。或者,还可以将所有候选变量的IV由高至低排列,将前X个IV对应的候选变量作为目标变量。其中,X为正整数。
[0101] 继续参考图2,在步骤S240中,基于所述目标样本数据训练逻辑回归模型,得到关于至少一种产品的兴趣分值预测模型。
[0102] 在示例性的实施例中,可以将目标样本分为实验组和对照组,进一步地以准确率、召回率、AUC作为模型训练的测试指标衡量训练后的模型。并可以当上述测试指标达到预设阈值时停止对模型的训练,得到兴趣分值预测模型。
[0103] 在图2和图3所示实施例提供的技术方案中,设置包含多业务场景、多种信贷产品的目标样本数据,训练关于信贷产品的兴趣分值预测模型。基于此大数据训练的机器学习模型,可以有效识预测用户对不同信贷产品的兴趣分数,从而为客户(信贷机构)获取高意向低风险客群。由于信贷机构对已沉默客户没有任何信息,所以无法有效识别假流失客户。基于兴趣分值的预测模型可以识别潜在用户、激活沉默用户,可以有效分辨出那些是假流失客户,并评估其激活响应概率,有效挖掘沉默客户价值,持续提高复购率。从而避免信贷机构误失潜在用户或沉默用户的同时,进一步提高营销响应率。
[0104] 图4示出了根据本公开实施例的第一目标用户的兴趣分值的确定方法,具体提供了步骤S130的一种具体实施方式。参考图4,该方法包括步骤S410-步骤S430。
[0105] 在步骤S410中,根据所述行为数据,确定N种产品对应的目标变量,其中,N为大于等于1的正整数。
[0106] 在示例性的实施例中,根据第一客户提供的营销产品E的特征,在第一目标用户的行为数据中确定关于信贷产品E的目标变量,可以包括:用户关于至少一种产品的行为数据、用户互联网行为数据、用户关于不同产品的偏好数据、用户社交关系数据中的一种或几种。从而,根据此方法确定的目标向量可以得到用户对信贷产品E的兴趣分值。
[0107] 在示例性的实施例中,还可以根据第一客户提供的目标用户的身份标识,确定第一目标用户关于多种信贷产品的行为数据,从而在关于多种信贷产品的行为数据确定每一种信贷产品的目标变量。例如,信贷产品W对应的目标变量为变量w1、变量w2,信贷产品W’对应的目标变量为变量w1’、变量w2’。从而,根据此方法确定的目标向量可以分别得到用户对信贷产品W的兴趣分值和对信贷产品W’的兴趣分值。进而为客户(信贷机构)提供了关于用户意向的信息,有利于客户展开进一步的营销。
[0108] 在步骤S420中,将所述目标变量输入至所述兴趣分值预测模型,得到输出结果。
[0109] 在示例性的实施例中,兴趣分值预测模型的输出结果可以设置为:0-100的分数,兴趣分值越高,反映用户借贷意愿强。比如:将分数十等分,90-100分数段的借贷响应人群肯定高于80-90分数段的借贷响应人群,以此类推,每个分数段应该呈现递减趋势。
[0110] 在示例性的实施例中,通过柯尔莫可洛夫-斯米洛夫检验(Kolmogorov-Smirnov test,简称:KS-检验)对上述兴趣分值模型的风险区分能力进行评估,KS指标衡量的是好坏样本累计分部之间的差值。好坏样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。KS的计算步骤如下:
[0111] 1.计算每个评分区间的好坏账户数;
[0112] 2.计算每个评分区间的累计好账户数占总好账户数比率(good%)和累计坏账户数占总坏账户数比率(bad%);
[0113] 3.计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值(累计good%-累计bad%),然后对这些绝对值取最大值即得此评分卡的KS值。
[0114] 在示例性的实施例中,随着用户数据库中营销反馈数据的逐步累积,加入更多特征变量训练迭代上述兴趣分值预测模型,以提高预测准确率。
[0115] 在步骤S430中,根据所述输出结果,确定所述第一目标用户关于所述N种产品的兴趣分值。
[0116] 在示例性的实施例中,图5示出了根据本公开实施例的营销策略的确定方法的流程示意图,具体提供了步骤S140的一种具体实施方式。参考图5,该方法包括步骤S510和步骤S520。
[0117] 对于所述N种信贷产品中的第i种产品:
[0118] 在步骤S510中,根据关于所述第i种产品的兴趣分值,将所述第一目标用户分层。以及,在步骤S520中。针对不同层的第一目标用户,确定关于所述第i种产品的不同营销策略,其中,i大于等于1小于等于N。
[0119] 在示例性的实施例中,关于某一信贷产品,对处于兴趣分值较高的分层中的第一目标用户,展开关于此信贷产品的营销活动。而对处于兴趣分值较低的分层中的第一目标用户,暂不展开关于此信贷产品营销活动。对处于兴趣分值较低的分层中的第一目标用户,可以进一步统计其对其他信贷产品的兴趣分值,以向这些用户营销其他产品。从而,对于高意向用户主动营销,对低意向用户不进行触达,在提升转化成功率降低营销成本的同时,避免对无意向用户的打扰。有利于大大提高营销借贷人群的响应率,不仅节约了成本,也提高了信贷机构的注册率、进件率和放款率。
[0120] 在示例性的实施例中,根据所述兴趣分值预测模型的输出结果确定所述第一目标用户的用户画像,所述用户画像包括多个用户标签。例如:用户a偏好小额分期借贷,用户b偏好大额长期借贷等。进一步地,根据用户标签匹配第二客户(其他信贷机构)的预测需求,以从所述第一目标用户中确定第二目标用户,并将所述第二目标用户推荐给所述第二客户。通过用户画像,可以让客户更了解其用户来源、兴趣。通过甄别目标召回用户,优化信贷机构的营销活动。通过对输出结果的进一步分析,提供额度调整、营销手段、营销时间等策略建议,以满足不同信贷机构的营销需求。
[0121] 本实施例提供的技术方案为信贷机构的新客获取阶段、存客运营阶段提供的一整套用户借贷需求分析服务,以助力信贷机构更高效的营销和更精细的运营。
[0122] 需要说明的是,上述各实施例是以信贷产品的兴趣分值进行预测,以及基于兴趣分值对信贷产品进行营销为例进行说明的。另外,本技术方案还可以是对保险公司的保险产品的兴趣分值进行预测,以及基于兴趣分值对保险产品进行营销等。
[0123] 以下介绍本公开的装置实施例,可以用于执行本公开上述的数据处理方法。
[0124] 图6示意性示出了根据本公开的实施例的数据处理装置的结构示意图。参考图6,上述数据处理装置600,包括:数据库获取模块601、行为数据获取模块602、兴趣分值确定模块603,以及策略确定模块604。
[0125] 其中,上述数据库获取模块601,用于获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定;
[0126] 上述行为数据获取模块602,用于根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;
[0127] 上述兴趣分值确定模块603,用于基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值;
[0128] 上述策略确定模块604,用于根据所述兴趣分值确定对所述第一目标用户的处理策略。
[0129] 在示例性的实施例中,基于前述方案,上述行为数据获取模块602,具体用于:基于所述第一目标用户的身份标识,根据所述预测需求中目标产品的特征,在所述用户数据库中匹配数据,得到所述第一目标用户的行为数据。
[0130] 在示例性的实施例中,基于前述方案,上述数据处理装置600还包括:机器学习模型训练模块。
[0131] 其中,上述机器学习模型训练模块用于:获取样本数据并训练机器学习模型得到所述兴趣分值预测模型。
[0132] 在示例性的实施例中,基于前述方案,上述机器学习模型训练模块,包括:获取单元、标注单元、筛选单元和训练单元。
[0133] 其中,上述获取单元用于:从所述用户数据库获取多维候选变量对应的候选样本数据;
[0134] 上述标注单元用于:针对至少一种产品,将在预设时间内产生响应数据的候选样本数据作为正样本数据,以及,将在预设时间内未产出响应的候选样本数据作为负样本数据;
[0135] 上述筛选单元用于:针对至少一种产品,筛选所述多维候选变量得到目标变量对应的目标样本数据;
[0136] 上述训练单元用于:基于所述目标样本数据训练逻辑回归模型,得到关于至少一种产品的兴趣分值预测模型。
[0137] 在示例性的实施例中,基于前述方案,上述筛选单元,具体用于:根据所述候选样本数据获取每一维候选变量的预测能力值;以及,将符合预设条件的预测能力值对应的候选变量作为所述目标变量,以得到所述目标变量对应的目标样本数据。
[0138] 在示例性的实施例中,基于前述方案,所述多维候选变量包括:用户关于至少一种产品的借贷行为数据、用户互联网行为数据、用户关于不同产品的偏好数据、用户社交关系数据中的一种或几种。
[0139] 在示例性的实施例中,基于前述方案,上述兴趣分值确定模块603,具体用于:根据所述行为数据,确定N种产品对应的目标变量,其中,N为大于等于1的正整数;将所述目标变量输入至所述兴趣分值预测模型,得到输出结果;以及,根据所述输出结果,确定所述第一目标用户关于所述N种产品的兴趣分值。
[0140] 在示例性的实施例中,基于前述方案,上述策略确定模块604,具体用于:对于所述N种信贷产品中的第i种信贷产品:根据关于所述第i种信贷产品的兴趣分值,将所述第一目标用户分层;以及,针对不同层的第一目标用户,确定关于所述第i种目标信贷产品的不同营销策略,其中,i大于等于1小于等于N。
[0141] 在示例性的实施例中,基于前述方案,所述目标变量包括:用户关于至少一种产品的行为数据、用户互联网行为数据、用户关于不同产品的偏好数据、用户社交关系数据中的一种或几种。
[0142] 在示例性的实施例中,基于前述方案,上述数据处理装置600还包括:数据库更新模块。
[0143] 其中,在上述策略确定模块604根据所述兴趣分值确定对所述第一目标用户的营销策略之后,上述数据库更新模块,用于:根据所述兴趣分值预测模型的输出结果更新所述用户数据库。
[0144] 在示例性的实施例中,基于前述方案,上述数据处理装置600还包括:用户画像确定模块和目标用户推荐模块。
[0145] 其中,上述用户画像确定模块用于:根据所述兴趣分值预测模型的输出结果确定所述第一目标用户的用户画像,所述用户画像包括多个用户标签;
[0146] 上述目标用于推荐模块用于:根据所述用户标签匹配来自第二接口的预测需求,以从所述第一目标用户中确定第二目标用户,以将所述第二目标用户推荐给所述第二接口。
[0147] 由于本公开的示例实施例的数据处理装置的各个功能模块与上述数据处理方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的索引的实施例。
[0148] 此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0149] 通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的数据处理方法。
[0150] 所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0151] 在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
[0152] 参考图7所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0153] 所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0154] 计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于:电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0155] 可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0156] 可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0157] 在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
[0158] 下面参照图8来描述根据本公开的这种实施方式的电子设备900。图8显示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0159] 如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830。
[0160] 其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元810可以执行如图1中所示的:步骤S110,获取用户数据库和第一数据接口的预测需求,其中,所述用户数据库根据来自第二数据接口的数据信息和/或所述第一数据接口的数据信息确定;步骤S120,根据所述预测需求在所述用户数据库中匹配数据,以获取第一目标用户的行为数据;步骤S130,基于兴趣分值预测模型,根据所述行为数据确定所述第一目标用户关于目标产品的兴趣分值;以及步骤S140,根据所述兴趣分值确定对所述第一目标用户的处理策略。
[0161] 存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(ROM)8203。
[0162] 存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0163] 总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0164] 电子设备800也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0165] 通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
[0166] 此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0167] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。