一种基于图挖掘的银行卡归属的确定方法及装置转让专利

申请号 : CN201611116545.4

文献号 : CN106815290B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘为怀何东杰唐桂明

申请人 : 中国银联股份有限公司

摘要 :

本发明涉及计算机技术领域,尤其涉及一种基于图挖掘的银行卡归属的确定方法及装置,用以基于实际交易数据确定银行卡的归属,包括:根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,针对交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。本发明实施例,给出了一种基于实际交易数据确定银行卡的归属的方法,提升了确定银行卡的归属的效率,具有较好的实际应用价值。

权利要求 :

1.一种基于图挖掘的银行卡归属的确定方法,其特征在于,包括:

根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性;

针对所述交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;

根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属;

根据下列方式确定每个银行卡的相似度:

针对预先划分的多个交易金额区间中的每个交易金额区间,根据交易有向图中每个银行卡在所述交易金额区间下交易金额及交易时间,确定每个银行卡在所述交易金额区间的交易曲线,所述交易有向图是根据银行卡的交易记录确定的,所述交易有向图与所述交易无向图中的银行卡相同;以及分别将每个银行卡在所述交易金额区间的交易曲线与总体交易曲线进行比较,得到每个银行卡在所述交易金额区间的相似度;

根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,包括:将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,作为所述两个银行卡之间的边权值;或者将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,与所述两个银行卡之间的交易数量的比值,作为所述两个银行卡之间的边权值。

2.根据权利要求1所述的方法,其特征在于,根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属,包括:若所述交易无向图中商户边的数量的占比大于第一比例阈值,则确定所述交易无向图中所有银行卡的归属均为商户银行卡;

若所述交易无向图中个人边的数量的占比大于第二比例阈值,则确定所述交易无向图中所有银行卡的归属均为个人银行卡。

3.根据权利要求1或2任一项所述的方法,其特征在于,确定所述交易无向图中的银行卡的归属之后,还包括:针对所述交易无向图中任意具有交易关系的两个银行卡,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度;若所述连接强度不小于连接强度阈值,则将所述两个银行卡确定为同一归属。

4.根据权利要求3所述的方法,其特征在于,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度,包括:将所述两个银行卡之间的交易数量,作为所述两个银行卡之间的连接强度;或者将所述两个银行卡之间的交易数量与所述交易无向图中银行卡交易总数量的比值,作为所述两个银行卡之间的连接强度。

5.一种基于图挖掘的银行卡归属的确定装置,其特征在于,包括:

边权值确定单元,用于根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性;

边归属确定单元,用于针对所述交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;

银行卡归属确定单元,用于根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属;

所述边权值确定单元,还用于根据下列方式确定每个银行卡的相似度:

针对预先划分的多个交易金额区间中的每个交易金额区间,根据交易有向图中每个银行卡在所述交易金额区间下交易金额及交易时间,确定每个银行卡在所述交易金额区间的交易曲线,所述交易有向图是根据银行卡的交易记录确定的,所述交易有向图与所述交易无向图中的银行卡相同;以及分别将每个银行卡在所述交易金额区间的交易曲线与总体交易曲线进行比较,得到每个银行卡在所述交易金额区间的相似度;

所述边权值确定单元,具体用于:

将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,作为所述两个银行卡之间的边权值;或者将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,与所述两个银行卡之间的交易数量的比值,作为所述两个银行卡之间的边权值。

6.根据权利要求5所述的装置,其特征在于,所述银行卡归属确定单元,具体用于:若所述交易无向图中商户边的数量的占比大于第一比例阈值,则确定所述交易无向图中所有银行卡的归属均为商户银行卡;

若所述交易无向图中个人边的数量的占比大于第二比例阈值,则确定所述交易无向图中所有银行卡的归属均为个人银行卡。

7.根据权利要求5或6任一项所述的装置,其特征在于,所述银行卡归属确定单元,还用于在确定所述交易无向图中的银行卡的归属之后,针对所述交易无向图中任意具有交易关系的两个银行卡,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度;若所述连接强度不小于连接强度阈值,则将所述两个银行卡确定为同一归属。

8.根据权利要求7所述的装置,其特征在于,所述银行卡归属确定单元,具体用于:将所述两个银行卡之间的交易数量,作为所述两个银行卡之间的连接强度;或者将所述两个银行卡之间的交易数量与所述交易无向图中银行卡交易总数量的比值,作为所述两个银行卡之间的连接强度。

说明书 :

一种基于图挖掘的银行卡归属的确定方法及装置

技术领域

[0001] 本发明涉及计算机技术领域,尤其涉及一种基于图挖掘的银行卡归属的确定方法及装置。

背景技术

[0002] 如今一个人可能会拥有多张不同的银行卡,而商业机构亦会通过多个银行卡来进行资金操作,为了分析一个人和商业机构的资金运作行为,需要全面考察其所拥有银行卡的交易行为,为此划分银行卡的归属是十分必要的,即确定银行卡是个人银行卡还是商户银行卡。
[0003] 目前,并没有一种可以基于实际交易数据来确定银行卡归属的方法。

发明内容

[0004] 本发明提供一种基于图挖掘的银行卡归属的确定方法及装置,用以基于实际交易数据确定银行卡的归属。
[0005] 一方面,本发明实施例提供一种基于图挖掘的银行卡归属的确定方法,包括:
[0006] 根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性;
[0007] 针对所述交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;
[0008] 根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。
[0009] 可选地,根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属,包括:
[0010] 若所述交易无向图中商户边的数量的占比大于第一比例阈值,则确定所述交易无向图中所有银行卡的归属均为商户银行卡;
[0011] 若所述交易无向图中个人边的数量的占比大于第二比例阈值,则确定所述交易无向图中所有银行卡的归属均为个人银行卡。
[0012] 可选地,根据下列方式确定每个银行卡的相似度:
[0013] 针对预先划分的多个交易金额区间中的每个交易金额区间,根据交易有向图中每个银行卡在所述交易金额区间下交易金额及交易时间,确定每个银行卡在所述交易金额区间的交易曲线,所述交易有向图是根据银行卡的交易记录确定的,所述交易有向图与所述交易无向图中的银行卡相同;以及分别将每个银行卡在所述交易金额区间的交易曲线与所述总体交易曲线进行比较,得到每个银行卡在所述交易金额区间的相似度。
[0014] 可选地,根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,包括:
[0015] 将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,作为所述两个银行卡之间的边权值;或者
[0016] 将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,与所述两个银行卡之间的交易数量的比值,作为所述两个银行卡之间的边权值。
[0017] 可选地,确定所述交易无向图中的银行卡的归属之后,还包括:
[0018] 针对所述交易无向图中任意具有交易关系的两个银行卡,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度;若所述连接强度不小于连接强度阈值,则将所述两个银行卡确定为同一归属。
[0019] 可选地,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度,包括:
[0020] 将所述两个银行卡之间的交易数量,作为所述两个银行卡之间的连接强度;或者[0021] 将所述两个银行卡之间的交易数量与所述交易无向图中银行卡交易总数量的比值,作为所述两个银行卡之间的连接强度。
[0022] 另一方面,本发明实施例提供一种基于图挖掘的银行卡归属的确定装置,包括:
[0023] 边权值确定单元,用于根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性;
[0024] 边归属确定单元,用于针对所述交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;
[0025] 银行卡归属确定单元,用于根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。
[0026] 可选地,所述银行卡归属确定单元,具体用于:
[0027] 若所述交易无向图中商户边的数量的占比大于第一比例阈值,则确定所述交易无向图中所有银行卡的归属均为商户银行卡;
[0028] 若所述交易无向图中个人边的数量的占比大于第二比例阈值,则确定所述交易无向图中所有银行卡的归属均为个人银行卡。
[0029] 可选地,所述边权值确定单元,还用于根据下列方式确定每个银行卡的相似度:
[0030] 针对预先划分的多个交易金额区间中的每个交易金额区间,根据交易有向图中每个银行卡在所述交易金额区间下交易金额及交易时间,确定每个银行卡在所述交易金额区间的交易曲线,所述交易有向图是根据银行卡的交易记录确定的,所述交易有向图与所述交易无向图中的银行卡相同;以及分别将每个银行卡在所述交易金额区间的交易曲线与所述总体交易曲线进行比较,得到每个银行卡在所述交易金额区间的相似度。
[0031] 可选地,所述边权值确定单元,具体用于:
[0032] 将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,作为所述两个银行卡之间的边权值;或者
[0033] 将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,与所述两个银行卡之间的交易数量的比值,作为所述两个银行卡之间的边权值。
[0034] 可选地,所述银行卡归属确定单元,还用于在确定所述交易无向图中的银行卡的归属之后,针对所述交易无向图中任意具有交易关系的两个银行卡,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度;若所述连接强度不小于连接强度阈值,则将所述两个银行卡确定为同一归属。
[0035] 可选地,所述银行卡归属确定单元,具体用于:将所述两个银行卡之间的交易数量,作为所述两个银行卡之间的连接强度;或者将所述两个银行卡之间的交易数量与所述交易无向图中银行卡交易总数量的比值,作为所述两个银行卡之间的连接强度。
[0036] 本发明实施例,根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性,针对交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。本发明实施例,给出了一种基于实际交易数据确定银行卡归属的方法,提升了确定银行卡归属的效率,具有较好的实际应用价值。

附图说明

[0037] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0038] 图1为本发明实施例提供的基于图挖掘的银行卡归属的确定方法流程图;
[0039] 图2为本发明实施例提供的交易无向图;
[0040] 图3为本发明实施例提供的交易数量与时间的曲线图;
[0041] 图4为本发明实施例提供的总体交易数量与时间的曲线图;
[0042] 图5为本发明实施例提供的交易有向图;
[0043] 图6为本发明实施例提供的基于图挖掘的银行卡归属的确定方法详细流程图;
[0044] 图7为本发明实施例提供的基于图挖掘的银行卡归属的确定装置示意图。

具体实施方式

[0045] 为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0046] 本发明实施例,通过对银行卡的交易信息的分析,可实现判别每个银行卡的归属,即判定一张银行卡的是商户银行卡,还是个人银行卡,同时,还可以识别出属于同一用户(商户或个人)的两张或两张以上的银行卡。
[0047] 下面结合说明书附图对本发明实施例作进一步详细描述。
[0048] 如图1所示,本发明实施例提供的一种基于图挖掘的银行卡归属的确定方法,包括:
[0049] 步骤101、根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性;
[0050] 步骤102、针对所述交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;
[0051] 步骤103、根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。
[0052] 上述步骤101中,首先可以获取有关每张银行卡的交易信息,例如交易信息可以包含有银行卡号,交易时间,交易类型(即转入还是转出),关联银行卡号,交易金额等信息,例如获取的交易信息如表1所示。
[0053]编号 银行卡号 交易时间 交易类型 关联银行卡号 交易金额
1 A 2016-11-1 转出 B 100
2 B 2016-11-1 转出 D 120
3 C 2016-11-1 转出 B 55
4 B 2016-11-2 转出 E 55
5 B 2016-11-2 转出 C 66
6 A 2016-11-2 转出 E 99
7 E 2016-11-3 转出 C 10000
8 E 2016-11-3 转出 D 10000
9 D 2016-11-3 转出 C 10000
……          
[0054] 根据上述交易信息,可以得到交易无向图,如图2所示,为本发明实施例提供的交易无向图示意图,为方便计算,本发明实施例中,将两张银行卡之间的两笔交易记录合并为一笔进行处理,例如,参照表1,第一条交易记录,是银行卡A转出到银行卡B的一笔交易,实际上,还有一条相对应的交易记录,即银行卡B的转入来自银行卡A的交易,本发明实施例中,将这两条记录合并为一条,因此,本发明实施例中,只考虑转出的每笔交易,当然,实际应用中,也可以对对应的两笔交易都考虑,本发明实施例对比不做限定。
[0055] 根据表1及图2所示的交易无向图,可以确定每个银行卡的相似度,其中,银行卡的相似度是用于表示在同一个时间段内银行卡的交易数量与银行卡集合的交易数量的相似性。
[0056] 举例来说,假设针对银行卡A,得到其交易数量与时间的曲线图如图3所示,其中,时间可以是以天为单位,即统计银行卡A在每天的交易数量,当然也可以是以小时为单位,统计银行卡A每小时的交易数量,对此本发明不做限定。
[0057] 如图4所示,为总体交易曲线示意图,其中,总体交易曲线示意图表示全国或者某个地区的所有银行卡的交易数量随时间的变化关系。
[0058] 接下来,将银行卡A的交易曲线与总体交易曲线进行比较,得到银行卡A的交易曲线与总体交易曲线的相似度,例如,计算出图3所示的银行卡A的交易曲线与图4所示的总体交易曲线的相似度为0.4,并且,在实际应用中可知,一张银行卡的交易曲线与总体交易曲线的相似度越高,表明该银行卡越有可能是商户银行卡,反之,与总体交易曲线的相似度越低,表明该银行卡越有可能是个人银行卡,因此,相似度可用于表示一张银行卡属于商户银行卡或者个人银行卡的程度。
[0059] 因此,针对每张银行卡,都可以得到该银行卡的交易曲线与总体交易曲线的相似度,或者也可以说是,相似度是用于表示在同一个时间段内银行卡的交易数量与银行卡集合的交易数量的相似性。
[0060] 在实际应用中,为提高银行卡归属的判别精确性,可选地,本发明实施例中,还可以是预先将交易金额进行区间的划分,然后得到每张银行卡在每个交易金额区间的交易曲线与总体交易曲线的相似度,具体地,根据下列方式确定每个银行卡的相似度:
[0061] 针对预先划分的多个交易金额区间中的每个交易金额区间,根据交易有向图中每个银行卡在所述交易金额区间下交易金额及交易时间,确定每个银行卡在所述交易金额区间的交易曲线,所述交易有向图是根据银行卡的交易记录确定的,所述交易有向图与所述交易无向图中的银行卡相同;以及分别将每个银行卡在所述交易金额区间的交易曲线与所述总体交易曲线进行比较,得到每个银行卡在所述交易金额区间的相似度。
[0062] 举例来说,如图5所示,是本发明实施例提供的交易有向图,其与图2所示的交易无向图是相对应的,交易有向图中具体地记录了每笔交易,即通过交易有向图可得到具体交易流向及交易数量。
[0063] 假设预先将交易金额区间划分为5个区间(此处仅是举例说明,实际划分的区间数量可视实际需要而定),分别为[0,1000],(1000,2000],(2000,3000],(3000,4000],(4000,+∞],则针对每张银行卡,在每个交易金额区间内得到一个交易曲线图,并计算得到银行卡在每个交易金额区间内的相似度,例如,针对银行卡B,得到其在每个交易金额区间内的相似度分别为:[0,1000]:0.8;(1000,2000]:0.9;(2000,3000]:0.7;(3000,4000]:0.5;(4000,+∞]:0.4。
[0064] 在得到每张银行卡的相似度之后,可以确定图2所示的交易无向图中任意具有交易关系的两个银行卡之间的边权值,具体有以下两种方法:
[0065] 方法一、将两个银行卡之间的每个交易金额与交易金额所在的交易金额区间的相似度的乘积的总和,作为所述两个银行卡之间的边权值
[0066] 举例来说,参照图2,假设银行卡A与银行卡B之间有4笔交易,第一笔交易为银行卡A向银行卡B转出1000元,第二笔交易为银行卡A向银行卡B转出6000元,第三笔交易为银行卡B向银行卡A转出2000元,第四笔交易为银行卡B向银行卡A转出3000元,并且银行卡A在交易金额区间的相似度分别为:[0,1000]:0.5;(1000,2000]:0.4;(2000,3000]:0.6;(3000,4000]:0.5;(4000,+∞]:0.3;银行卡B在交易金额区间的相似度分别为:[0,1000]:0.5;
(1000,2000]:0.4;(2000,3000]:0.4;(3000,4000]:0.3;(4000,+∞]:0.4,则银行卡A与银行卡B之间的边权值=1000*0.5+6000*0.3+2000*0.4+3000*0.4=4300。
[0067] 方法二、将两个银行卡之间的每个交易金额与交易金额所在的交易金额区间的相似度的乘积的总和,与两个银行卡之间的交易数量的比值,作为两个银行卡之间的边权值。
[0068] 该方法二与上述方法一比较相似,区别在于,在方法一的基础上,还需要对求得的结果除以交易无向图中的总交易数量,例如针对上述方法一的例子,假设交易无向图中的总交易笔数为1000笔,则得到银行卡A与银行卡B之间的边权值为4.3。
[0069] 在上述步骤102中,针对交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;
[0070] 通过该步骤,可以将交易无向图中的每条边,确定为一条商户边或者是一条个人用户边。
[0071] 上述步骤103中,根据交易无向图中商户边的数量及个人边的数量,确定交易无向图中的银行卡的归属。
[0072] 具体,可以有以下方法来确定一个交易无向图中的银行卡的归属:
[0073] 方法一、若商户边的数量大于个人边的数量,则确定交易无向图中所有银行卡的归属均为商户银行卡;否则,确定交易无向图中所有银行卡的归属均为个人银行卡。
[0074] 为提高识别的准确性,还可以使用下列方法。
[0075] 方法二、若交易无向图中商户边的数量的占比大于第一比例阈值,则确定交易无向图中所有银行卡的归属均为商户银行卡;若所述交易无向图中个人边的数量的占比大于第二比例阈值,则确定所述交易无向图中所有银行卡的归属均为个人银行卡。
[0076] 其中,第一比例阈值和第二比例阈值可以相同,也可以不同,例如第一比例阈值和第二比例阈值都取值为90%,或者是第一比例阈值取值为90%,第二比例阈值都取值为88%等。
[0077] 通过上述步骤101~步骤103,可将一个交易无向图中的所有银行卡识别为商户银行卡,或者全部是个人银行卡,从而实现了根据银行卡的交易记录,识别出每个银行卡的归属。
[0078] 可选地,在上述步骤103之后,还可以进一步地识别属于同一个商户或同一个人的银行卡,具体包括:
[0079] 针对交易无向图中任意具有交易关系的两个银行卡,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度;若所述连接强度不小于连接强度阈值,则将所述两个银行卡确定为同一归属。
[0080] 具体地,确定两个银行卡之间的连接强度的方法为:将所述两个银行卡之间的交易数量,作为所述两个银行卡之间的连接强度;或者将所述两个银行卡之间的交易数量与所述交易无向图中银行卡交易总数量的比值,作为所述两个银行卡之间的连接强度。
[0081] 举例来说,针对图2,假设银行卡A与银行卡B之间的连接强度大于连接强度阈值,则将银行卡A与银行卡B确定为同一归属。即,若确定图2所示的交易无向图中的银行卡都是商户银行卡,则确定银行卡A与银行卡B属于同一商户;若确定图2所示的交易无向图中的银行卡都是个人用户银行卡,则确定银行卡A与银行卡B属于同一个人。
[0082] 本发明实施例,根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性,针对交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。本发明实施例,给出了一种基于实际交易数据确定银行卡归属的方法,提升了确定银行卡归属的效率,具有较好的实际应用价值。
[0083] 下面对本发明实施例提供的基于图挖掘的银行卡归属的确定方法做详细描述,如图6所示,包括:
[0084] 步骤601、根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值。
[0085] 步骤602、针对所述交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边。
[0086] 步骤603、根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。
[0087] 具体地,若所述交易无向图中商户边的数量的占比大于第一比例阈值,则确定所述交易无向图中所有银行卡的归属均为商户银行卡;若所述交易无向图中个人边的数量的占比大于第二比例阈值,则确定所述交易无向图中所有银行卡的归属均为个人银行卡。
[0088] 步骤604、针对所述交易无向图中任意具有交易关系的两个银行卡,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度;若所述连接强度不小于连接强度阈值,则将所述两个银行卡确定为同一归属。
[0089] 其中,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度,包括:将所述两个银行卡之间的交易数量,作为所述两个银行卡之间的连接强度;或者将所述两个银行卡之间的交易数量与所述交易无向图中银行卡交易总数量的比值,作为所述两个银行卡之间的连接强度。
[0090] 本发明实施例,根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性,针对交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。本发明实施例,给出了一种基于实际交易数据确定银行卡归属的方法,提升了确定银行卡归属的效率,具有较好的实际应用价值。
[0091] 基于相同的技术构思,本发明实施例还提供一种基于图挖掘的银行卡归属的确定装置,该装置可以是一个处理单元,如中央处理器,或者还可以是一个计算机或服务器等,如图7所示,该装置包括:
[0092] 边权值确定单元701,用于根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性;
[0093] 边归属确定单元702,用于针对所述交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;
[0094] 银行卡归属确定单元703,用于根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。
[0095] 可选地,所述银行卡归属确定单元703,具体用于:
[0096] 若所述交易无向图中商户边的数量的占比大于第一比例阈值,则确定所述交易无向图中所有银行卡的归属均为商户银行卡;
[0097] 若所述交易无向图中个人边的数量的占比大于第二比例阈值,则确定所述交易无向图中所有银行卡的归属均为个人银行卡。
[0098] 可选地,所述边权值确定单元701,还用于根据下列方式确定每个银行卡的相似度:
[0099] 针对预先划分的多个交易金额区间中的每个交易金额区间,根据交易有向图中每个银行卡在所述交易金额区间下交易金额及交易时间,确定每个银行卡在所述交易金额区间的交易曲线,所述交易有向图是根据银行卡的交易记录确定的,所述交易有向图与所述交易无向图中的银行卡相同;以及分别将每个银行卡在所述交易金额区间的交易曲线与所述总体交易曲线进行比较,得到每个银行卡在所述交易金额区间的相似度。
[0100] 可选地,所述边权值确定单元701,具体用于:
[0101] 将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,作为所述两个银行卡之间的边权值;或者
[0102] 将所述两个银行卡之间的每个交易金额与所述交易金额所在的交易金额区间的相似度的乘积的总和,与所述两个银行卡之间的交易数量的比值,作为所述两个银行卡之间的边权值。
[0103] 可选地,所述银行卡归属确定单元703,还用于在确定所述交易无向图中的银行卡的归属之后,针对所述交易无向图中任意具有交易关系的两个银行卡,根据所述两个银行卡之间的交易记录,确定所述两个银行卡之间的连接强度;若所述连接强度不小于连接强度阈值,则将所述两个银行卡确定为同一归属。
[0104] 可选地,所述银行卡归属确定单元703,具体用于:将所述两个银行卡之间的交易数量,作为所述两个银行卡之间的连接强度;或者将所述两个银行卡之间的交易数量与所述交易无向图中银行卡交易总数量的比值,作为所述两个银行卡之间的连接强度。
[0105] 本发明实施例,根据银行卡的交易金额及银行卡的相似度,确定根据银行卡的交易记录确定的交易无向图中任意具有交易关系的两个银行卡之间的边权值,其中所述银行卡的相似度是用于表示在同一个时间段内所述银行卡的交易数量与银行卡集合的交易数量的相似性,针对交易无向图中的每个边,若所述边的边权值大于边权值阈值,则确定所述边为商户边,否则确定所述边为个人用户边;根据所述交易无向图中商户边的数量及个人边的数量,确定所述交易无向图中的银行卡的归属。本发明实施例,给出了一种基于实际交易数据确定银行卡归属的方法,提升了确定银行卡归属的效率,具有较好的实际应用价值。
[0106] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0107] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0108] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0109] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0110] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。