一种强关系分析方法、系统和存储介质转让专利

申请号 : CN202111472424.4

文献号 : CN113901349B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 张广志于笑博成立立杨占军

申请人 : 北京融信数联科技有限公司

摘要 :

本申请提供了一种强关系分析方法、系统和存储介质,针对特定的关系分析领域提取相关的特征信息,可以分析对象的具体关系种类,对于对象行为关联性分析更具有针对性;将特征信息按照时间、空间和行为特征分布,并对特征字段进行数据化,转换成一组坐标数据,可以将对象的行为信息隐藏,避免对象隐私泄露和篡改,满足隐私脱敏的多源异构平台数据相融合;通过分析行为特征曲线的相关性得到关系分析结果,可以将行为特点进行综合考虑,受人口行为多变性的干扰影响小,捕捉强关系社会网络的准确性更高。

权利要求 :

1.一种强关系分析方法,其特征在于,包括如下步骤:获取分析对象的行为数据,所述行为数据包括政务数据、消费数据以及浏览数据,提取流转于分析领域内的特征信息;

将特征信息按照属性进行分区排布,并对每一个分区下的特征字段进行数据化处理,生成坐标信息;

绘制关于特征字段的行为特征曲线,计算不同分析对象行为特征曲线的相关性;

根据相关性大小判断不同分析对象在所述分析领域中的关系强度;

所述提取流转于分析领域内的特征信息具体为:根据行为数据中的字段属性和语义关联定义行为数据的分析领域,所述分析领域包括办公事项、生活事项和娱乐事项;

提取被定义为所属分析领域内的时间特征、空间特征和行为特征;

所述对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:将时间字段顺延、间隔编排,根据停留长短确定间隔距离,生成时间坐标;

将空间字段以常驻地点为中心、散发编排,根据地理位置确定间隔距离,生成空间坐标;

所述对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:提取行为字段的关键词,根据关键词引入不同的赋值运算符;

基于赋值运算符对空间坐标进行赋值,生成行为坐标;

所述绘制关于特征字段的行为特征曲线具体为:以事件为单位、发生时间为顺序将坐标信息进行串联,所述行为特征曲线是关于时间、空间和行为的周期波动曲线;

所述获取分析对象的行为数据之后,提取流转于分析领域内的特征信息之前,还包括:获取行为数据的来源地址,根据通信协议识别是否属于公共性质;

若来源地址属于公共性质,则对行为数据进行剔除。

2.根据权利要求1所述的强关系分析方法,其特征在于,计算不同分析对象行为特征曲线的相关性具体为:

以事件为单位对曲线分区,根据行为属性选择该分区内对应的计算模型,计算同一事件中两个曲线段的相关系数;

对各曲线段的相关系数进行权重分析得到相关性结果。

3.根据权利要求1所述的强关系分析方法,其特征在于,计算不同分析对象行为特征曲线的相关性之后,根据相关性大小判断不同分析对象在所述分析领域中的关系强度之前,还包括:

提取特征信息中的频繁项集,对比不同分析对象的频繁项集的覆盖面;

根据覆盖面大小对行为特征曲线的相关性结果进行校正。

4.根据权利要求1所述的强关系分析方法,其特征在于,还包括:判断行为特征曲线的相关性是否处于预设范围;

若行为特征曲线的相关性在预设范围内,将对应分析对象的特征资源作为推荐内容推送至目标分析对象终端;

若行为特征曲线的相关性不在预设范围内,则判断相关性偏离预设范围的程度是否超过预设值,若超过预设值,将对应分析对象的特征资源作为引导内容推送至目标分析对象终端。

5.一种强关系分析系统,其特征在于,包括存储器和处理器,所述存储器中包括强关系分析程序,所述程序被所述处理器执行时,实现如权利要求1‑4任一项所述方法的步骤。

6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括强关系分析程序,所述程序被处理器执行时,实现如权利要求1‑4任一项所述方法的步骤。

说明书 :

一种强关系分析方法、系统和存储介质

技术领域

[0001] 本申请属于数据分析技术领域,更具体的,涉及一种强关系分析方法、系统和存储介质。

背景技术

[0002] 随着互联网信息技术发展,人们通过线上浏览和执行等动作留下大量的网络操作信息,对这些信息进行分析可以反映各个事件之间的关联性,从而判断人们的行为习惯和
偏好,成为目前互联网聚类分析、侦查示踪、主动营销等实际需求的主要手段。
[0003] 强关系通常是指行动者彼此之间存在高度互动关系,对事件之间进行强关系分析有助于快速掌握事件之间的关联逻辑。但是,受现代城市人口流动性大、人员行为多变以及
磁吸效应影响因素复杂的影响,采用传统的分析方法捕捉强关系社会网络存在准确性偏差
大、数据处理难度大的技术问题。

发明内容

[0004] 有鉴于此,本申请提供了一种强关系分析方法、系统和存储介质,能够适应现代多样化的人口行为模式。
[0005] 本申请的具体技术方案如下:
[0006] 本申请第一方面提供一种强关系分析方法,包括如下步骤:
[0007] 获取分析对象的行为数据,所述行为数据包括政务数据、消费数据以及浏览数据,提取流转于分析领域内的特征信息;
[0008] 将特征信息按照属性进行分区排布,并对每一个分区下的特征字段进行数据化处理,生成坐标信息;
[0009] 绘制关于特征字段的行为特征曲线,计算不同分析对象行为特征曲线的相关性;
[0010] 根据相关性大小判断不同分析对象在所述分析领域中的关系强度。
[0011] 优选地,提取流转于分析领域内的特征信息具体为:
[0012] 根据行为数据中的字段属性和语义关联定义行为数据的分析领域,所述分析领域包括办公事项、生活事项和娱乐事项;
[0013] 提取被定义为所属分析领域内的时间特征、空间特征和行为特征。
[0014] 优选地,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0015] 将时间字段顺延、间隔编排,根据停留长短确定间隔距离,生成时间坐标;
[0016] 将空间字段以常驻地点为中心、散发编排,根据地理位置确定间隔距离,生成空间坐标。
[0017] 优选地,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0018] 提取行为字段的关键词,根据关键词引入不同的赋值运算符;
[0019] 基于赋值运算符对空间坐标进行赋值,生成行为坐标。
[0020] 优选地,绘制关于特征字段的行为特征曲线具体为:
[0021] 以事件为单位、发生时间为顺序将坐标信息进行串联,所述行为特征曲线是关于时间、空间和行为的周期波动曲线。
[0022] 优选地,计算不同分析对象行为特征曲线的相关性具体为:
[0023] 以事件为单位对曲线分区,根据行为属性选择该分区内对应的计算模型,计算同一事件中两个曲线段的相关系数;
[0024] 对各曲线段的相关系数进行权重分析得到相关性结果。
[0025] 优选地,计算不同分析对象行为特征曲线的相关性之后,根据相关性大小判断不同分析对象在所述分析领域中的关系强度之前,还包括:
[0026] 提取特征信息中的频繁项集,对比不同分析对象的频繁项集的覆盖面;
[0027] 根据覆盖面大小对行为特征曲线的相关性结果进行校正。
[0028] 优选地,还包括:
[0029] 判断行为特征曲线的相关性是否处于预设范围;
[0030] 若行为特征曲线的相关性在预设范围内,将对应分析对象的特征资源作为推荐内容推送至目标分析对象终端;
[0031] 若行为特征曲线的相关性不在预设范围内,则判断相关性偏离预设范围的程度是否超过预设值,若超过预设值,将对应分析对象的特征资源作为引导内容推送至目标分析
对象终端。
[0032] 本申请第二方面提供一种强关系分析系统,包括存储器和处理器,所述存储器中包括强关系分析程序,所述程序被所述处理器执行时,实现如下步骤:
[0033] 获取分析对象的行为数据,所述行为数据包括政务数据、消费数据以及浏览数据,提取流转于分析领域内的特征信息;
[0034] 将特征信息按照属性进行分区排布,并对每一个分区下的特征字段进行数据化处理,生成坐标信息;
[0035] 绘制关于特征字段的行为特征曲线,计算不同分析对象行为特征曲线的相关性;
[0036] 根据相关性大小判断不同分析对象在所述分析领域中的关系强度。
[0037] 优选地,提取流转于分析领域内的特征信息具体为:
[0038] 根据行为数据中的字段属性和语义关联定义行为数据的分析领域,所述分析领域包括办公事项、生活事项和娱乐事项;
[0039] 提取被定义为所属分析领域内的时间特征、空间特征和行为特征。
[0040] 优选地,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0041] 将时间字段顺延、间隔编排,根据停留长短确定间隔距离,生成时间坐标;
[0042] 将空间字段以常驻地点为中心、散发编排,根据地理位置确定间隔距离,生成空间坐标。
[0043] 优选地,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0044] 提取行为字段的关键词,根据关键词引入不同的赋值运算符;
[0045] 基于赋值运算符对空间坐标进行赋值,生成行为坐标。
[0046] 优选地,绘制关于特征字段的行为特征曲线具体为:
[0047] 以事件为单位、发生时间为顺序将坐标信息进行串联,所述行为特征曲线是关于时间、空间和行为的周期波动曲线。
[0048] 优选地,计算不同分析对象行为特征曲线的相关性具体为:
[0049] 以事件为单位对曲线分区,根据行为属性选择该分区内对应的计算模型,计算同一事件中两个曲线段的相关系数;
[0050] 对各曲线段的相关系数进行权重分析得到相关性结果。
[0051] 优选地,计算不同分析对象行为特征曲线的相关性之后,根据相关性大小判断不同分析对象在所述分析领域中的关系强度之前,还包括:
[0052] 提取特征信息中的频繁项集,对比不同分析对象的频繁项集的覆盖面;
[0053] 根据覆盖面大小对行为特征曲线的相关性结果进行校正。
[0054] 优选地,还包括:
[0055] 判断行为特征曲线的相关性是否处于预设范围;
[0056] 若行为特征曲线的相关性在预设范围内,将对应分析对象的特征资源作为推荐内容推送至目标分析对象终端;
[0057] 若行为特征曲线的相关性不在预设范围内,则判断相关性偏离预设范围的程度是否超过预设值,若超过预设值,将对应分析对象的特征资源作为引导内容推送至目标分析
对象终端。
[0058] 本申请第三方面体提供一种计算机可读存储介质,所述计算机可读存储介质中包括强关系分析程序,所述程序被处理器执行时,实现所述强关系分析方法的步骤。
[0059] 综上所述,本申请提供了一种强关系分析方法、系统和存储介质,包括:获取分析对象的行为数据,提取流转于分析领域内的特征信息;将特征信息按照属性进行分区排布,
并对每一个分区下的特征字段进行数据化处理,生成坐标信息;绘制关于特征字段的行为
特征曲线,计算不同分析对象行为特征曲线的相关性;根据相关性大小判断不同分析对象
在所述分析领域中的关系强度。针对特定的关系分析领域提取相关的特征信息,可以分析
对象的具体关系种类,对于对象行为关联性分析更具有针对性;将特征信息按照时间、空间
和行为特征分布,并对特征字段进行数据化,转换成一组坐标数据,可以将对象的行为信息
隐藏,避免对象隐私泄露和篡改,满足隐私脱敏的多源异构平台数据相融合;通过分析行为
特征曲线的相关性得到关系分析结果,可以将行为特点进行综合考虑,受人口行为多变性
的干扰影响小,捕捉强关系社会网络的准确性更高。

附图说明

[0060] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本
申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可
以根据这些附图获得其它的附图。
[0061] 图1为本申请一种强关系分析方法的流程图;
[0062] 图2为本申请一种强关系分析系统的框图。

具体实施方式

[0063] 为使得本申请的目的、特征、优点能够更加的明显和易懂,对本申请实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本申请一部分实施例,而
非全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前
提下所获得的所有其它实施例,都属于本申请保护的范围。
[0064] 请参照图1,图1为本申请一种强关系分析方法的流程图。
[0065] 本申请实施例第一方面提供一种强关系分析方法,包括如下步骤:
[0066] S102:获取分析对象的行为数据,所述行为数据包括政务数据、消费数据以及浏览数据,提取流转于分析领域内的特征信息;
[0067] S104:将特征信息按照属性进行分区排布,并对每一个分区下的特征字段进行数据化处理,生成坐标信息;
[0068] S106:绘制关于特征字段的行为特征曲线,计算不同分析对象行为特征曲线的相关性;
[0069] S108:根据相关性大小判断不同分析对象在所述分析领域中的关系强度。
[0070] 需要说明的是,S102中分析对象的行为数据可以来源于政府侧数据、用户通信数据、消费数据以及网络浏览日志等。针对特定的关系分析领域提取相关的特征信息,可以分
析对象的具体关系种类,对于对象行为关联性分析更具有针对性,例如将对象的关系种类
分为同事、朋友或家人。
[0071] S104中可以将特征信息按照时间、空间和行为特征分布,并对特征字段进行数据化,例如将相同的特征字段设定为一个数字编号,并将不同的数字编号按照一定顺序编排,
转换成一组坐标数据,可以将对象的行为信息隐藏,避免对象隐私泄露和篡改,满足隐私脱
敏的多源异构平台数据相融合。
[0072] S106中以事件为单位将特征字段的坐标信息串联绘制行为特征曲线,行为特征曲线可以是关于时间、空间和行为特点的周期变化曲线,反映一定时间范围内的人口行为轨
迹和偏好。计算相关性的方法可以是通过经验函数分析曲线的重叠度,也可以是通过计算
相关系数或者拟合分析得到。
[0073] S108中通过分析行为特征曲线的相关性得到关系分析结果,可以将行为特点进行综合考虑,受人口行为多变性的干扰影响小,捕捉强关系社会网络的准确性更高。同时,除
了判定强关系还可以对关系程度、关系种类、影响力和连带关系进行分析,可以为营销方案
以及政策制定提供有力依据。
[0074] 本申请的强关系分析方法针对特定的关系分析领域提取相关的特征信息,可以分析对象的具体关系种类,对于对象行为关联性分析更具有针对性;将特征信息按照时间、空
间和行为特征分布,并对特征字段进行数据化,转换成一组坐标数据,可以将对象的行为信
息隐藏,避免对象隐私泄露和篡改,满足隐私脱敏的多源异构平台数据相融合;通过分析行
为特征曲线的相关性得到关系分析结果,可以将行为特点进行综合考虑,受人口行为多变
性的干扰影响小,捕捉强关系社会网络的准确性更高。
[0075] 根据本申请实施例,提取流转于分析领域内的特征信息具体为:
[0076] 根据行为数据中的字段属性和语义关联定义行为数据的分析领域,所述分析领域包括办公事项、生活事项和娱乐事项;
[0077] 提取被定义为所属分析领域内的时间特征、空间特征和行为特征。
[0078] 需要说明的是,将行为数据进行属性分类,可以根据行为数据中特征字段的字面属性或默认属性分类,例如消费数据中属于生活开销或娱乐购物消费,或者根据特征字段
的语义关联推测其属性分类,例如地理位置所对应的场所性质。再提取对应分析领域内的
时间特征、空间特征和行为特征,可以将分析领域外的干扰数据剔除。
[0079] 根据本申请实施例,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0080] 将时间字段顺延、间隔编排,根据停留长短确定间隔距离,生成时间坐标;
[0081] 将空间字段以常驻地点为中心、散发编排,根据地理位置确定间隔距离,生成空间坐标。
[0082] 需要说明的是,时间坐标可以按水平方向排列,空间坐标可以按垂直方向排列,时间和空间坐标排布共同构成二维散点。其中,时间坐标的间隔由在该空间下的驻留时间决
定;空间坐标的间隔由偏离常驻地点的地理位置距离决定,常驻地点可以是对象的居住地、
工作地、户口地等,这种排列方式可以使得即使每个对象的常驻地点不同,也具有相同的水
平基准。
[0083] 根据本申请实施例,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0084] 提取行为字段的关键词,根据关键词引入不同的赋值运算符;
[0085] 基于赋值运算符对空间坐标进行赋值,生成行为坐标。
[0086] 需要说明的是,关键词是用于识别行为字段类别的标识性数据,关键词的提取方法可以经过大数据技术测算,也可是语义关联分析得到。根据类别将行为字段进行赋值,例
如在同一个场所内对象可发生的行为类别分为消费、销售、陪同或监管等,对行为字段进行
赋值后可简化行为特征的分析过程,便于后续数据处理。
[0087] 根据本申请实施例,绘制关于特征字段的行为特征曲线具体为:
[0088] 以事件为单位、发生时间为顺序将坐标信息进行串联,所述行为特征曲线是关于时间、空间和行为的周期波动曲线。
[0089] 需要说明的是,行为特征曲线可以是以时间为横坐标,空间位置为纵坐标的二维周期波动曲线,并且在每个峰尖处记录有对象的行为属性和偏好,用于反映对象一定时期
内的行为轨迹。
[0090] 根据本申请实施例,计算不同分析对象行为特征曲线的相关性具体为:
[0091] 以事件为单位对曲线分区,根据行为属性选择该分区内对应的计算模型,计算同一事件中两个曲线段的相关系数;
[0092] 对各曲线段的相关系数进行权重分析得到相关性结果。
[0093] 需要说明的是,对曲线分区可以参照事件的起止时间节点,或者空间转换节点。由于不同行为属性下产生的行为波动具有不同特征,需要针对不同的行为目的建立计算模
型,计算模型的参数可以根据大量对象数据分析的均值来确定。接着将个曲线段的相关系
数加和得到两条曲线的相关性结果。其中,权重分析是指对不同曲线段的相关系数引入比
重系数,例如在对同事关系的分析中,可以分别放大本职事项或者业余事项的权重比计算
相关性,从而判断对象的潜在商业合作模式,获取对象行为中的潜在合作关系。
[0094] 根据本申请实施例,计算不同分析对象行为特征曲线的相关性之后,根据相关性大小判断不同分析对象在所述分析领域中的关系强度之前,还包括:
[0095] 提取特征信息中的频繁项集,对比不同分析对象的频繁项集的覆盖面;
[0096] 根据覆盖面大小对行为特征曲线的相关性结果进行校正。
[0097] 需要说明的是,频繁项集指特征字段中出现频率高于阈值的最小字段集,频繁项集的覆盖面可以通过相似程度判定。若不同分析对象的频繁项集越密集,说明两者关联性
越高,频繁项集的密集程度可以作为固定系数对行为特征曲线相关性进行调整。即行为特
征曲线反映关系频率,频繁项集反映关系强弱,两者同步分析更能准确反映关系程度。
[0098] 根据本申请实施例,还包括:
[0099] 判断行为特征曲线的相关性是否处于预设范围;
[0100] 若行为特征曲线的相关性在预设范围内,将对应分析对象的特征资源作为推荐内容推送至目标分析对象终端;
[0101] 若行为特征曲线的相关性不在预设范围内,则判断相关性偏离预设范围的程度是否超过预设值,若超过预设值,将对应分析对象的特征资源作为引导内容推送至目标分析
对象终端。
[0102] 需要说明的是,相关性处于预设范围的关系属于强关系,具有磁吸效应,适用于同类产品推荐、关联踪迹查询等场合。相关性在预设范围外且低于一定预设值的关系属于弱
关系,两者的信息、资源不容易互通,适用于给予对象新的思路和选择方向,拓宽固有认知。
[0103] 在本申请另一实施例中,获取分析对象的行为数据之后,提取流转于分析领域内的特征信息之前,还包括:
[0104] 获取行为数据的来源地址,根据通信协议识别是否属于公共性质;
[0105] 若来源地址属于公共性质,则对行为数据进行剔除。
[0106] 需要说明的是,当行为数据来源于公共性质地址,例如一些物联网卡,需要将这些非人口行为数据进行识别和剔除。
[0107] 在本申请另一实施例中,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0108] 若一个事件单位中必要特征字段部分不存在,则以现有特征字段为节点调取分析对象在该特征字段下所产生的信令数据;
[0109] 筛选信令数据中与缺失特征字段属性相关联的特征信息,生成模拟特征字段;
[0110] 将模拟特征字段一定顺序排布,生成坐标信息。
[0111] 需要说明的是,若特征字段部分缺失,例如获取时间特征失败,可以调取事件单元下发生于对应空间特征的信令数据,提取信令数据中的时间信息,或者是根据事件单元下
对应的空间特征和行为特征推算理论时间信息得到模拟特征字段,将模拟特征字段按时间
顺序、空间距离或行为偏好等方式排列。
[0112] 请参照图2,图2为本申请一种强关系分析系统的框图。
[0113] 本申请实施例第二方面提供一种强关系分析系统2,包括存储器21和处理器22,所述存储器21中包括强关系分析程序,所述程序被所述处理器22执行时,实现如下步骤:
[0114] 获取分析对象的行为数据,所述行为数据包括政务数据、消费数据以及浏览数据,提取流转于分析领域内的特征信息;
[0115] 将特征信息按照属性进行分区排布,并对每一个分区下的特征字段进行数据化处理,生成坐标信息;
[0116] 绘制关于特征字段的行为特征曲线,计算不同分析对象行为特征曲线的相关性;
[0117] 根据相关性大小判断不同分析对象在所述分析领域中的关系强度。
[0118] 需要说明的是,分析对象的行为数据可以来源于政府侧数据、用户通信数据、消费数据以及网络浏览日志等。针对特定的关系分析领域提取相关的特征信息,可以分析对象
的具体关系种类,对于对象行为关联性分析更具有针对性,例如将对象的关系种类分为同
事、朋友或家人。可以将特征信息按照时间、空间和行为特征分布,并对特征字段进行数据
化,例如将相同的特征字段设定为一个数字编号,并将不同的数字编号按照一定顺序编排,
转换成一组坐标数据,可以将对象的行为信息隐藏,避免对象隐私泄露和篡改,满足隐私脱
敏的多源异构平台数据相融合。以事件为单位将特征字段的坐标信息串联绘制行为特征曲
线,行为特征曲线可以是关于时间、空间和行为特点的周期变化曲线,反映一定时间范围内
的人口行为轨迹和偏好。计算相关性的方法可以是通过经验函数分析曲线的重叠度,也可
以是通过计算相关系数或者拟合分析得到。通过分析行为特征曲线的相关性得到关系分析
结果,可以将行为特点进行综合考虑,受人口行为多变性的干扰影响小,捕捉强关系社会网
络的准确性更高。同时,除了判定强关系还可以对关系程度、关系种类、影响力和连带关系
进行分析,可以为营销方案以及政策制定提供有力依据。
[0119] 本申请的强关系分析系统针对特定的关系分析领域提取相关的特征信息,可以分析对象的具体关系种类,对于对象行为关联性分析更具有针对性;将特征信息按照时间、空
间和行为特征分布,并对特征字段进行数据化,转换成一组坐标数据,可以将对象的行为信
息隐藏,避免对象隐私泄露和篡改,满足隐私脱敏的多源异构平台数据相融合;通过分析行
为特征曲线的相关性得到关系分析结果,可以将行为特点进行综合考虑,受人口行为多变
性的干扰影响小,捕捉强关系社会网络的准确性更高。
[0120] 根据本申请实施例,提取流转于分析领域内的特征信息具体为:
[0121] 根据行为数据中的字段属性和语义关联定义行为数据的分析领域,所述分析领域包括办公事项、生活事项和娱乐事项;
[0122] 提取被定义为所属分析领域内的时间特征、空间特征和行为特征。
[0123] 需要说明的是,将行为数据进行属性分类,可以根据行为数据中特征字段的字面属性或默认属性分类,例如消费数据中属于生活开销或娱乐购物消费,或者根据特征字段
的语义关联推测其属性分类,例如地理位置所对应的场所性质。再提取对应分析领域内的
时间特征、空间特征和行为特征,可以将分析领域外的干扰数据剔除。
[0124] 根据本申请实施例,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0125] 将时间字段顺延、间隔编排,根据停留长短确定间隔距离,生成时间坐标;
[0126] 将空间字段以常驻地点为中心、散发编排,根据地理位置确定间隔距离,生成空间坐标。
[0127] 需要说明的是,时间坐标可以按水平方向排列,空间坐标可以按垂直方向排列,时间和空间坐标排布共同构成二维散点。其中,时间坐标的间隔由在该空间下的驻留时间决
定;空间坐标的间隔由偏离常驻地点的地理位置距离决定,常驻地点可以是对象的居住地、
工作地、户口地等,这种排列方式可以使得即使每个对象的常驻地点不同,也具有相同的水
平基准。
[0128] 根据本申请实施例,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0129] 提取行为字段的关键词,根据关键词引入不同的赋值运算符;
[0130] 基于赋值运算符对空间坐标进行赋值,生成行为坐标。
[0131] 需要说明的是,关键词是用于识别行为字段类别的标识性数据,关键词的提取方法可以经过大数据技术测算,也可是语义关联分析得到。根据类别将行为字段进行赋值,例
如在同一个场所内对象可发生的行为类别分为消费、销售、陪同或监管等,对行为字段进行
赋值后可简化行为特征的分析过程,便于后续数据处理。
[0132] 根据本申请实施例,绘制关于特征字段的行为特征曲线具体为:
[0133] 以事件为单位、发生时间为顺序将坐标信息进行串联,所述行为特征曲线是关于时间、空间和行为的周期波动曲线。
[0134] 需要说明的是,行为特征曲线可以是以时间为横坐标,空间位置为纵坐标的二维周期波动曲线,并且在每个峰尖处记录有对象的行为属性和偏好,用于反映对象一定时期
内的行为轨迹。
[0135] 根据本申请实施例,计算不同分析对象行为特征曲线的相关性具体为:
[0136] 以事件为单位对曲线分区,根据行为属性选择该分区内对应的计算模型,计算同一事件中两个曲线段的相关系数;
[0137] 对各曲线段的相关系数进行权重分析得到相关性结果。
[0138] 需要说明的是,对曲线分区可以参照事件的起止时间节点,或者空间转换节点。由于不同行为属性下产生的行为波动具有不同特征,需要针对不同的行为目的建立计算模
型,计算模型的参数可以根据大量对象数据分析的均值来确定。接着将个曲线段的相关系
数加和得到两条曲线的相关性结果。其中,权重分析是指对不同曲线段的相关系数引入比
重系数,例如在对同事关系的分析中,可以分别放大本职事项或者业余事项的权重比计算
相关性,从而判断对象的潜在商业合作模式,获取对象行为中的潜在合作关系。
[0139] 根据本申请实施例,计算不同分析对象行为特征曲线的相关性之后,根据相关性大小判断不同分析对象在所述分析领域中的关系强度之前,还包括:
[0140] 提取特征信息中的频繁项集,对比不同分析对象的频繁项集的覆盖面;
[0141] 根据覆盖面大小对行为特征曲线的相关性结果进行校正。
[0142] 需要说明的是,频繁项集指特征字段中出现频率高于阈值的最小字段集,频繁项集的覆盖面可以通过相似程度判定。若不同分析对象的频繁项集越密集,说明两者关联性
越高,频繁项集的密集程度可以作为固定系数对行为特征曲线相关性进行调整。即行为特
征曲线反映关系频率,频繁项集反映关系强弱,两者同步分析更能准确反映关系程度。
[0143] 根据本申请实施例,还包括:
[0144] 判断行为特征曲线的相关性是否处于预设范围;
[0145] 若行为特征曲线的相关性在预设范围内,将对应分析对象的特征资源作为推荐内容推送至目标分析对象终端;
[0146] 若行为特征曲线的相关性不在预设范围内,则判断相关性偏离预设范围的程度是否超过预设值,若超过预设值,将对应分析对象的特征资源作为引导内容推送至目标分析
对象终端。
[0147] 需要说明的是,相关性处于预设范围的关系属于强关系,具有磁吸效应,适用于同类产品推荐、关联踪迹查询等场合。相关性在预设范围外且低于一定预设值的关系属于弱
关系,两者的信息、资源不容易互通,适用于给予对象新的思路和选择方向,拓宽固有认知。
[0148] 在本申请另一实施例中,获取分析对象的行为数据之后,提取流转于分析领域内的特征信息之前,还包括:
[0149] 获取行为数据的来源地址,根据通信协议识别是否属于公共性质;
[0150] 若来源地址属于公共性质,则对行为数据进行剔除。
[0151] 需要说明的是,当行为数据来源于公共性质地址,例如一些物联网卡,需要将这些非人口行为数据进行识别和剔除。
[0152] 在本申请另一实施例中,对每一个分区下的特征字段进行数据化处理,生成坐标信息具体为:
[0153] 若一个事件单位中必要特征字段部分不存在,则以现有特征字段为节点调取分析对象在该特征字段下所产生的信令数据;
[0154] 筛选信令数据中与缺失特征字段属性相关联的特征信息,生成模拟特征字段;
[0155] 将模拟特征字段一定顺序排布,生成坐标信息。
[0156] 需要说明的是,若特征字段部分缺失,例如获取时间特征失败,可以调取事件单元下发生于对应空间特征的信令数据,提取信令数据中的时间信息,或者是根据事件单元下
对应的空间特征和行为特征推算理论时间信息得到模拟特征字段,将模拟特征字段按时间
顺序、空间距离或行为偏好等方式排列。
[0157] 本申请实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质中包括强关系分析程序,所述程序被处理器执行时,实现所述强关系分析方法的步骤。
[0158] 上述存储介质对应地执行强关系分析方法中的各步骤,具体参见图1对方法步骤的描述,在此不再赘述。
[0159] 在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为
一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或
可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部
分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合
或通信连接,可以是电性的、机械的或其它形式的。
[0160] 上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单
元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
[0161] 另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述
集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0162] 本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在
执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存
储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者
光盘等各种可以存储程序代码的介质。
[0163] 或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施
例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,
该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以
是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。
而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码
的介质。
[0164] 以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前
述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些
修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。