一种企业关系图谱的构建方法及系统转让专利

申请号 : CN202210989518.7

文献号 : CN115080706B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 邓萌陆嘉耀刘真

申请人 : 京华信息科技股份有限公司

摘要 :

本发明提供了一种企业关系画谱的构建方法及系统,获取待查询企业的企业关系图谱,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵,根据企业关系矩阵,生成深化应用矩阵,根据深化应用矩阵更新企业关系图谱并将其输出。所述方法能够提高企业关系图谱的准确性,充分反映各企业之间的关联程度,在构建过程中强调企业信息变动的权重值,通过协调图谱中所有企业的关联性,有效分析企业间的隐形关系,修正并优化数据库中的企业关系图谱,对分析企业风险传播路径以及企业的经营活动有着行之有效的帮助。

权利要求 :

1.一种企业关系图谱的构建方法,其特征在于,所述方法包括以下步骤:

S100,获取待查询企业的企业关系图谱;

S200,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵;

S300,根据企业关系矩阵,生成深化应用矩阵;

S400,根据深化应用矩阵更新企业关系图谱,并将更新后的企业关系图谱输出;

其中,步骤S300,根据企业关系矩阵,生成深化应用矩阵,具体方法为:记员工人数最多的企业为E,记E中所有员工的人数为st,获取E中每个员工的移动设备的经纬度坐标,依次以E中每个员工的移动设备的经纬度坐标为一行构建数组lal,记lali1j1为二维数组lal中第i1行第j1列的元素,记E的企业位置的经纬度坐标为(eg,et),通过下式计算得到企业中枢测值cpp:;

获取各个企业的经纬度坐标,按照企业编号升序依次以各个企业的经纬度坐标为一行构建数组cc,依次以各个企业中所有员工的移动设备的经纬度坐标的平均值为一行构建数组mdc,记cci2j2为数组cc中第i2行第j2列的元素,记mdci3j3为数组mdc中第i3行第j3列的元素,i2,j2=1,2,…,N,i3,j3=1,2,…,N,设置整数变量p=1,p∈[1,N],依次遍历p,以数组esc储存满足条件con1且满足条件con2的所有p的值,其中,条件con1指数组cc中第p个元素对应企业的企业中枢测值小于或者等于cpp,或者,条件con1指当前企业的企业中枢测值小于或者等于ccGV,条件con2指mdcp1∈[ccp1‑K1, ccp1+K1],并且mdcp2∈[ccp2‑K2, ccp2+K2];ccGV是数组cc中各个企业的企业中枢测值的平均值;K1是KT1和KST1之间的差值;K2是KT2和KST2之间的差值;KT1为数组lal中第1列的各元素的平均值,KST1为当前企业对应的数组mdc的第1列中各元素的平均值;KT2为数组lal中第2列的各元素的平均值,KST2为当前企业对应的数组mdc的第2列中各元素的平均值;

或者,条件con1指mdcp1∈[int1,int2],条件con2指mdcp2∈[int3,int4],int1的值为ccp1‑cpp,int2的值为ccp1+cpp,int3的值为ccp2‑cpp,int4的值为ccp2+cpp;

记esci4为数组esc中的第i4个元素,遍历i4,依次将企业关系矩阵R中第esci4行的所有元素和第esci4列的所有元素更新为0,记企业关系矩阵R为深化应用矩阵DA。

2.根据权利要求1所述的一种企业关系图谱的构建方法,其特征在于,所述企业关系图谱中包括至少两个企业,每个企业包括多个员工,每个员工持有一台移动设备,用以获取员工的定位信息,定位信息包括经纬度坐标。

3.根据权利要求1所述的一种企业关系图谱的构建方法,其特征在于,步骤S200,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵,具体步骤为:在企业关系图谱中筛选出所有企业,记所有企业的数量为N,以N个数字1,2,…,N依次对所有企业进行编号得到企业编号关系,创建N行N列的全零矩阵R,设置整数变量i=1,记i的取值范围为[1,N];

依次遍历i,在企业关系图谱中,记与编号为i的企业存在连接关系的所有企业的编号为r1,r2,…,rn,设置整数变量j,记j的取值依次为r1,r2,…,rn,依次遍历j,更新矩阵R中第i行第j列的元素为1,记R1为R的转置矩阵,更新R为R+R1,记矩阵R为企业关系矩阵。

4.根据权利要求1所述的一种企业关系图谱的构建方法,其特征在于,步骤S400中,根据深化应用矩阵更新企业关系图谱,具体步骤为:S401,记深化应用矩阵中的值为0的元素所在的行为第m1行,所在的列为第n1列,记值为1的元素所在的行为第m2行,所在的列为第n2列,根据企业编号关系,在企业关系图谱中,取消编号为m1的企业和编号为n1的企业之间的连接,连接编号为m2的企业和编号为n2的企业;

S402,循环执行S401,直至遍历完深化应用矩阵中的所有元素;

S403,在企业关系图谱中,删去孤立的企业,所述孤立的企业,即在企业关系图谱中没有与其他企业存在连接关系的企业。

5.根据权利要求1所述的一种企业关系图谱的构建方法,其特征在于,步骤S400中,根据深化应用矩阵更新企业关系图谱,具体步骤为:按照深度优先搜索算法遍历深化应用矩阵中每个元素,在企业关系图谱中,将值为0的元素所对应的两个企业之间的连接断开,将值为1的元素所对应的两个企业进行连接;遍历完成后,在企业关系图谱中,删去孤立的企业,所述孤立的企业,即在企业关系图谱中没有与其他企业存在连接关系的企业。

说明书 :

一种企业关系图谱的构建方法及系统

技术领域

[0001] 本发明涉及知识图谱技术领域,特别涉及一种企业关系图谱的构建方法。

背景技术

[0002] 企业关系图谱有助于人们考察企业之间的组成结构和关联信息。目前主流的企业关系谱图构建方法主要是利用数据挖掘、模式匹配等数据分析方法,通过逻辑关联的方式绘制方便直观展示的企业关系图谱。然而企业与企业之间的关系往往错综复杂,企业的位置信息、员工构成会发生变化,各大小企业之间也会产生新的业务来往,同时,不同企业间还会存在隐性关联,在种种信息的变更下,企业关系图谱会出现信息关联不准确、不全面的现象。
[0003] 针对于此,在现有技术专利申请号为201810685605.7的中国发明专利中,通过构建企业数据知识表,构建知识模板相关表,在企业数据知识表内建立知识模板ID字段以实现知识模板和企业数据知识的一对多关系;构建知识主树图表,在知识模板表内建立所述知识主树图ID字段以实现主树图和所述知识模板的一对多关系;构建知识逻辑树图表,在知识逻辑树图表内建立知识逻辑树图和企业数据知识关系表,保存知识逻辑树图ID字段和企业数据知识ID字段以实现知识逻辑树图节点和所述企业数据知识的多对多关系。

发明内容

[0004] 本发明的目的在于提出一种企业关系图谱的构建方法,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
[0005] 本发明提供了一种企业关系画谱的构建方法及系统,获取待查询企业的企业关系图谱,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵,根据企业关系矩阵,生成深化应用矩阵,根据深化应用矩阵更新企业关系图谱并将其输出。所述方法能够提高企业关系图谱的准确性,充分反映各企业之间的关联程度,在构建过程中强调企业信息变动的权重值,通过协调图谱中所有企业的关联性,有效分析企业间的隐形关系,对分析企业风险传播路径以及企业的经营活动有着行之有效的帮助。
[0006] 为了实现上述目的,根据本发明的一方面,提供一种企业关系图谱的构建方法,所述方法包括以下步骤:
[0007] S100,获取待查询企业的企业关系图谱;
[0008] S200,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵;
[0009] S300,根据企业关系矩阵,生成深化应用矩阵;
[0010] S400,根据深化应用矩阵更新企业关系图谱,并将更新后的企业关系图谱输出;
[0011] 其中,所述企业关系图谱中包括至少两个企业,每个企业包括多个员工,每个员工持有一台移动设备,用以获取员工的定位信息,定位信息包括经纬度坐标。
[0012] 优选地,步骤S100,获取待查询企业的企业关系图谱,具体方法为:通过专利号为CN107229756A的专利中的企业关系图谱生成方法获取到待查询企业的企业关系图谱,或获取企查查网站的数据库中的待查询企业的企业关系图谱。
[0013] 进一步地,步骤S200,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵,具体步骤为:在企业关系图谱中筛选出所有企业,记所有企业的数量为N,以N个数字1,2,…,N依次对所有企业进行编号得到企业编号关系,创建N行N列的全零矩阵R,设置整数变量i=1,记i的取值范围为[1,N];
[0014] 依次遍历i,在企业关系图谱中,记与编号为i的企业存在连接关系的所有企业的编号为r1,r2,…,rn,设置整数变量j,记j的取值依次为r1,r2,…,rn,依次遍历j,更新矩阵R中第i行第j列的元素为1,记R1为R的转置矩阵,更新R为R+R1,记矩阵R为企业关系矩阵。
[0015] 进一步地,步骤S300,根据企业关系矩阵,生成深化应用矩阵,具体方法为:记员工人数最多的企业为E,记E中所有员工的人数为st,获取E中每个员工的移动设备的经纬度坐标,依次以E中每个员工的移动设备的经纬度坐标为一行构建数组lal(数组lal即为二维数组,共st行2列,第1列为每个员工的移动设备的经度坐标,第2列为每个员工的移动设备的纬度坐标),记lali1j1为二维数组lal中第i1行第j1列的元素,记E的企业位置的经纬度坐标为(eg,et),通过下式计算得到E的企业中枢测值(以企业中枢测值作为指标,用以根据员工未知的变化趋势判断企业的关联状态是否存在异常);i1为数组lal中行的序号,j1为数组lal中列的序号;
[0016] 获取各个企业的经纬度坐标,按照企业编号升序依次以各个企业的经纬度坐标为一行构建数组cc(数组cc即为二维数组,共N行2列),依次以各个企业中所有员工的移动设备的经纬度坐标的平均值为一行构建数组mdc(数组mdc即为二维数组,共N行2列),记cci2j2为数组cc中第i2行第j2列的元素,记mdci3j3为数组mdc中第i3行第j3列的元素,i2,j2=1,2,…,N,i3,j3=1,2,…,N,设置整数变量p=1,p∈[1,N],依次遍历p,以数组esc储存满足条件con1且满足条件con2的所有p的值,
[0017] 其中,条件con1指数组cc中第p个元素对应企业的企业中枢测值小于或者等于cpp,或者,条件con1指当前企业的企业中枢测值小于或者等于ccGV,条件con2指mdcp1∈[ccp1‑K1, ccp1+K1],并且mdcp2∈[ccp2‑K2, ccp2+K2];ccGV是数组cc中各个企业的企业中枢测值的平均值;K1是KT1和KST1之间的差值;K2是KT2和KST2之间的差值;KT1为数组lal中第1列的各元素的平均值,KST1为当前企业对应的数组mdc的第1列中各元素的平均值;KT2为数组lal中第2列的各元素的平均值,KST2为当前企业对应的数组mdc的第2列中各元素的平均值;
[0018] 或者,其中,条件con1指mdcp1∈[int1,int2],条件con2指mdcp2∈[int3,int4],int1的值为ccp1‑cpp,int2的值为ccp1+cpp,int3的值为ccp2‑cpp,int4的值为ccp2+cpp;记esci4为数组esc中的第i4个元素,遍历i4的取值范围(i4的取值范围由满足条件的p的数量决定),依次将企业关系矩阵R中第esci4行的所有元素和第esci4列的所有元素更新为0,记矩阵R为深化应用矩阵DA。
[0019] 本步骤的有益效果为:由于企业图谱中会存在空白企业,造成企业图谱的连接关系不准确,本步骤通过以移动设备坐标计算企业中枢测值的方法可以过滤掉空白企业,通过企业的员工人数及位置信息计算得到企业中枢测值,判断该企业是否正常运作,根据判断结果更新矩阵R,在企业关系图谱构建的过程中能够更好地反映出各个企业的连接关系,提高企业图谱的准确性。
[0020] 其中,当前企业的企业中枢测值(和员工人数最多的企业为E企业中枢测值计算方法一样)计算方法为:
[0021] 记当前企业EQ中所有员工的人数为st1,获取当前企业EQ中每个员工的移动设备的经纬度坐标,依次以当前企业EQ中每个员工的移动设备的经纬度坐标为一行构建数组lalC(数组lalC即为二维数组,共st1行2列,第1列为每个员工的移动设备的经度坐标,第2列为每个员工的移动设备的纬度坐标),记lalCi1j1为二维数组lalC中第i1行第j1列的元素,记当前企业EQ的企业位置的经纬度坐标为(EQgC,EQtC),通过下式计算得到当前企业EQ的企业中枢测值: 。
[0022] 由于企业间的关联程度高低不一,部分企业会存在隐形的合作关系(即在企业图谱中表现为不存在连接关系的企业),影响企业关系图谱的准确性,为解决该问题,进一步提高企业关系图谱的可供参考价值,本发明提供了一个更优先的改进矩阵DA的方法,如下:
[0023] 优选地,所述深化应用矩阵DA还需要通过以下步骤进行优化:
[0024] S301,记设备回归测度erd=[ln (|cpp/(1‑cpp)|)],其中,[]是表示向上取整,[ln (|cpp/(1‑cpp)|)]表示对ln(|cpp/(1‑cpp)|)向上取整,|cpp/(1‑cpp)|表示cpp/(1‑cpp)的绝对值,设置整数变量i,i∈[1,N],在i的取值范围内遍历i,在坐标系中依次以(cci1,cci2)为圆心、erd为半径构建N个圆C1,C2,…,CN,记所有企业中所有员工的移动设备的经纬度坐标为待处理坐标,标记落在圆C1,C2,…,CN内部的待处理坐标为稳定坐标,依次计算C1, C2,…, CN内所有稳定坐标的平均值,得到N个载荷点坐标,依次为(x1, y1),(x2, y2),…,(xN, yN),按矩阵DA中的连接关系连接所有载荷点(矩阵DA为邻接矩阵,行列下标分别为各个企业的编号,0代表两个企业之间不连接,1代表两个企业之间连接,矩阵DA存储了所有企业的连接关系,企业位置信息代表了企业,而数组cc储存了企业位置信息,圆C1, C2,…, CN以数组cc中的元素为圆心,同时载荷点落在圆内,因此,按矩阵DA中的企业间的连接关系连接所有载荷坐标,即可反映企业的连接关系);其中,ln指取自然对数;
[0025] S302,设置变量j=1,转至S303;
[0026] S303,设定时间段[0,t],在时间段[0,t]中以每秒为间隔创建数列0,1,…,t,转至S304;
[0027] S304,记(xj0, yj0), (xj1, yj1),…, (xjt, yjt) 分别为载荷点(xj, yj)在0,1,…,t时的坐标值,令j增加1,转至S305;
[0028] S305,若j小于等于N,转至S304,若j大于N,转至S306;
[0029] S306,设置变量p=1,设置变量q=0;
[0030] S307,记第q+1时刻的第p个载荷点的经度和第q时刻的第p个载荷点的经度的差值为hpq,hpq的计算公式为:hpq=xp(q+1)‑xpq,令q 的值增加1,转到S308;
[0031] S308,若q的值小于等于t,转到S307,若q的值大于t,转到S309;
[0032] S309,令q的值为1,转到S310;
[0033] S310,记变量Ap0的值为1,
[0034] 记变量Bp0的值为N*(yp1‑ yp0)/ hp0,
[0035] 记变量Apt的值为0,
[0036] 记变量Bpt的值为N*(ypt‑ yp(t‑1))/ hp(t‑1),
[0037] 记Apq的值为hp(q‑1)/(hp(q‑1)+hp),
[0038] 记Bpq的值为N*(1‑Apq)*( ypq‑ yp(q‑1))/ hp(q‑1)+ N*Apq*( yp(q+1)‑ypq)/ hpq,[0039] 令q的值增加1,转到S311(设置变量Ap0、Bp0、Apt、Bpt以计算后续的apq、bpq);
[0040] S311,若q的值小于t,转到S310,若q的值大于等于t,转到S312;
[0041] S312,令q的值为0,转到S313;
[0042] S313,记变量ap0的值为 (‑ Ap0)/2,记变量bp0的值为 Bp0/2,
[0043] 记变量apq的值为(‑Apq)/((N‑1)+(1‑ Apq)* Ap(q‑1)),
[0044] 记变量bpq的值为(Bpq‑(1‑ Apq)* Bp(q‑1))/((N‑1)+(1‑ Apq)* Ap(q‑1)),[0045] 令q的值增加1,转到S314(设置变量apq、bpq以计算后续的mpq);
[0046] S314,若q的值小于等于t,转到S313,若q的值大于t,转到S315;
[0047] S315,令q的值为t‑1,记mpt的值为bpt,记变量mpq的值为apq*mp(q+1)+bpq,令q的值减1,转到S316;
[0048] S316,若q的值大于等于0,转到S315,若q的值小于0,转到S317;
[0049] S317,令q的值为0,记x为函数Crfpq(x)的自变量,函数Crfpq(x)的计算方式为:
[0050] Crfpq(x)=(1+N*(x‑xp(q+1))/(xpq‑xp(q+1)))*((x‑xpq)/(xp(q+1)‑xpq))2*yp(q+1)+(x‑2
xpq)*(x‑xp(q+1))/(xpq‑ xp(q+1)) *mpq,
[0051] 令q的值增加1,转到S318(计算函数Crfpq(x)的好处是,在区间[0,t]内的每个间隔内,以连续的函数代替离散的经纬度坐标形成的折线,可以提高判断企业关联程度的准确性);
[0052] S318,若q的值小于t,转到S317,若q的值大于等于t,转到S319;
[0053] S319,若p的值小于等于N,令p的值增加1,重置q=0,转到S307,若p的值大于N,转到S320;
[0054] S320,令p的值为1,令q的值为0, 设置变量k;
[0055] S321,令k的值为p+1,记 ,转到S322;
[0056] S322,记  ,记企业亲密协同量EISV=|(Crp‑sign)/(min{Crp,sign})|,其中,min{Crp,sign}代表Crp和sign之间的最小值,若EISV的值小于1,则将矩阵DA中第k行第p列的元素和第p行第k列的元素更新为1,转到S323(设置变量Ap0、Bp0、Apt、Bpt、apq、bpq、mpq、计算函数Crfpq(x)的目的是为了计算EISV,通过计算EISV判断企业间是否存在联系,并更新到矩阵DA中,以此修正企业关系图谱);
[0057] S323,若k的值小于N,令k的值增加1,转到S322,若k的值大于等于N,转到S324;
[0058] S324,若p的值小于N,令p的值增加1,转到S321,若p的值大于等于N,转到S325;
[0059] S325,若q的值小于t,重置p的值为1,令q的值增加1,转到S321,若q的值大于等于t,转到S326;
[0060] S326,结束程序;
[0061] 其中,所述t设定为[1,2]年,即[31536000, 63072000]秒。
[0062] 本步骤的有益效果为:由于企业间的关联程度高低不一,部分企业会存在隐形的合作关系,影响企业关系图谱的准确性,利用企业位置以及企业中员工移动设备的位置信息计算得到企业亲密协同量,以企业亲密协同量EISV更新矩阵DA,相较于原有的矩阵DA更能准确地指示出各个企业之间的关联度,解决了企业图谱之间关联的连接线不准确的问题,进一步充分提高企业图谱的参考价值。
[0063] 进一步地,步骤S400中,根据深化应用矩阵更新企业关系图谱,具体步骤为:
[0064] S401,记深化应用矩阵中的值为0的元素所在的行为第m1行,所在的列为第n1列,记值为1的元素所在的行为第m2行,所在的列为第n2列,根据企业编号关系,在企业关系图谱中,取消编号为m1的企业和编号为n1的企业之间的连接,连接编号为m2的企业和编号为n2的企业;
[0065] S402,循环执行S401,直至遍历完深化应用矩阵中的所有元素;
[0066] S403,在企业关系图谱中,删去孤立的企业,所述孤立的企业,即在企业关系图谱中没有与其他企业存在连接关系的企业。
[0067] 优选地,步骤S400中,根据深化应用矩阵更新企业关系图谱,具体步骤为:
[0068] 按照深度优先搜索算法遍历深化应用矩阵中每个元素,在企业关系图谱中,将值为0的元素所对应的两个企业之间的连接断开,将值为1的元素所对应的两个企业进行连接(元素所对应的两个企业,其意义即为:在企业关系图谱中,由企业编号关系,元素所在的行和列对应着两个企业);遍历完成后,在企业关系图谱中,删去孤立的企业,所述孤立的企业,即在企业关系图谱中没有与其他企业存在连接关系的企业。
[0069] 本发明还提供了一种企业关系图谱的构建系统,所述一种企业关系图谱的构建系统包括:处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现一种企业关系图谱的构建方法中的步骤,所述企业关系图谱的构建系统可以运行于桌上型计算机、笔记本电脑、移动电话、手提电话、平板电脑、掌上电脑及云端数据中心等计算设备中,可运行的系统可包括,但不仅限于,处理器、存储器、服务器集群,所述处理器执行所述计算机程序运行在以下系统的单元中:
[0070] 图谱获取单元,用于获取某企业的企业关系图谱;
[0071] 矩阵构建单元,用于根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵;
[0072] 矩阵生成单元,用于根据企业关系矩阵,生成深化应用矩阵;
[0073] 图谱更新单元,用于根据深化应用矩阵更新企业关系图谱,并将企业关系图谱输出。
[0074] 本发明的有益效果为:所述方法能够提高企业关系图谱的准确性,充分反映各企业之间的关联程度,在构建过程中强调企业信息变动的权重值,通过协调图谱中所有企业的关联性,有效分析企业间的隐形关系,修正并优化数据库中的企业关系图谱,对分析企业风险传播路径以及企业的经营活动有着立竿见影的帮助。

附图说明

[0075] 通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
[0076] 图1所示为一种企业关系图谱的构建方法的流程图;
[0077] 图2所示为一种企业关系图谱的构建系统的系统结构图。

具体实施方式

[0078] 以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0079] 在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
[0080] 如图1所示为根据本发明的一种企业关系图谱的构建方法的流程图,下面结合图1来阐述根据本发明的实施方式的一种企业关系图谱的构建方法。
[0081] 本发明提出一种企业关系图谱的构建方法,所述方法包括以下步骤:
[0082] S100,获取待查询企业的企业关系图谱;
[0083] S200,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵;
[0084] S300,根据企业关系矩阵,生成深化应用矩阵;
[0085] S400,根据深化应用矩阵更新企业关系图谱,并将更新后的企业关系图谱输出;
[0086] 其中,所述企业关系图谱中包括至少两个企业,每个企业包括多个员工,每个员工持有一台移动设备,用以获取员工的定位信息,定位信息包括经纬度坐标。
[0087] 优选地,步骤S100,获取待查询企业的企业关系图谱,具体方法为:通过专利号为CN107229756A的专利中的企业关系图谱生成方法获取到待查询企业的企业关系图谱,或通过企查查网站(一款企业信息查询工具)获取到待查询企业的企业关系图谱;
[0088] 进一步地,步骤S200,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵,具体步骤为:在企业关系图谱中筛选出所有企业,记所有企业的数量为N,以N个数字1,2,…,N依次对所有企业进行编号得到企业编号关系(图谱中每个企业都对应一个数字编号,根据数字即可定位到相应企业),创建N行N列的全零矩阵R,设置整数变量i=1,记i的取值范围为[1,N];
[0089] 依次遍历i,在企业关系图谱中,记与编号为i的企业存在连接关系的所有企业的编号为r1,r2,…,rn,设置整数变量j,记j的取值依次为r1,r2,…,rn,依次遍历j,更新矩阵R中第i行第j列的元素为1(即以0或1标记企业关系图谱中所有企业之间的关系),记R1为R的转置矩阵,更新R为R+R1,记矩阵R为企业关系矩阵(也称邻接矩阵,用以表示图谱中元素的连接关系)。
[0090] 进一步地,步骤S300,根据企业关系矩阵,生成深化应用矩阵,具体方法为:记员工人数最多的企业为E,记E中所有员工的人数为st,获取E中每个员工的移动设备的经纬度坐标,依次以E中每个员工的移动设备的经纬度坐标为一行构建数组lal(数组lal即为二维数组,共st行2列,第1列为每个员工的移动设备的经度坐标,第2列为每个员工的移动设备的纬度坐标),记lali1j1为二维数组lal中第i1行第j1列的元素,记E的企业位置的经纬度坐标为(eg,et),通过下式计算得到企业中枢测值
[0091] ;
[0092] 其中,以企业中枢测值作为指标,用以根据员工未知的变化趋势判断企业的关联状态是否存在异常;
[0093] 获取各个企业的经纬度坐标,按照企业编号升序依次以各个企业的经纬度坐标为一行构建数组cc(数组cc即为二维数组,共N行2列),依次以各个企业中所有员工的移动设备的经纬度坐标的平均值为一行构建数组mdc(数组mdc即为二维数组,共N行2列),记cci2j2为数组cc中第i2行第j2列的元素,记mdci3j3为数组mdc中第i3行第j3列的元素,i2,j2=1,2,…,N,i3,j3=1,2,…,N,设置整数变量p=1,p∈[1,N],依次遍历p,以数组esc储存满足条件con1且满足条件con2的所有p的值,
[0094] 其中,条件con1指数组cc中第p个元素对应企业的企业中枢测值小于或者等于cpp,或者,条件con1指当前企业(当前企业即数组cc中第p个元素对应的企业)的企业中枢测值小于或者等于ccGV,条件con2指mdcp1∈[ccp1‑K1, ccp1+K1],并且mdcp2∈[ccp2‑K2, ccp2+K2];ccGV是数组cc中各个企业的企业中枢测值的平均值;K1是KT1和KST1之间的差值;
K2是KT2和KST2之间的差值;KT1为数组lal中第1列的各元素的平均值,KST1为当前企业对应的数组mdc的第1列中各元素的平均值;KT2为数组lal中第2列的各元素的平均值,KST2为当前企业对应的数组mdc的第2列中各元素的平均值;
[0095] 或者,其中,条件con1指mdcp1∈[int1,int2],条件con2指mdcp2∈[int3,int4],int1的值为ccp1‑cpp,int2的值为ccp1+cpp,int3的值为ccp2‑cpp,int4的值为ccp2+cpp;记esci4为数组esc中的第i4个元素,遍历i4的取值范围(i4的取值范围由满足条件的p的数量决定),依次将企业关系矩阵R中第esci4行的所有元素和第esci4列的所有元素更新为0,记矩阵R为深化应用矩阵DA。
[0096] 其中,当前企业的企业中枢测值(和员工人数最多的企业为E企业中枢测值计算方法一样)计算方法为:
[0097] 记当前企业EQ中所有员工的人数为st1,获取当前企业EQ中每个员工的移动设备的经纬度坐标,依次以当前企业EQ中每个员工的移动设备的经纬度坐标为一行构建数组lalC(数组lalC即为二维数组,共st1行2列,第1列为每个员工的移动设备的经度坐标,第2列为每个员工的移动设备的纬度坐标),记lalCi1j1为二维数组lalC中第i1行第j1列的元素,记当前企业EQ的企业位置的经纬度坐标为(EQgC,EQtC),通过下式计算得到当前企业EQ的企业中枢测值: 。
[0098] 由于企业间的关联程度高低不一,部分企业会存在隐形关系,影响企业关系图谱的准确性,为解决该问题,进一步提高企业关系图谱的可供参考价值,本发明提供了一个更优先的改进深化应用矩阵DA的方法,如下:
[0099] 优选地,所述深化应用矩阵DA还需要通过以下步骤进行优化:
[0100] S301,记设备回归测度erd=[ln (|cpp/(1‑cpp)|)],其中,[]是表示向上取整,[ln (|cpp/(1‑cpp)|)]表示对ln(|cpp/(1‑cpp)|)向上取整,|cpp/(1‑cpp)|表示cpp/(1‑cpp)的绝对值,设置整数变量i,i∈[1,N],在i的取值范围内遍历i,在坐标系中依次以(cci1,cci2)为圆心、erd为半径构建N个圆C1,C2,…,CN,记所有企业中所有员工的移动设备的经纬度坐标为待处理坐标,标记落在圆C1,C2,…,CN内部的待处理坐标为稳定坐标,依次计算C1, C2,…, CN内所有稳定坐标的平均值,得到N个载荷点坐标,依次为(x1, y1),(x2, y2),…,(xN, yN),按矩阵DA中的连接关系连接所有载荷点(矩阵DA为01矩阵,行列下标分别为各个企业的编号,0代表两个企业之间不连接,1代表两个企业之间连接,矩阵DA存储了所有企业的连接关系,企业位置信息代表了企业,而数组cc储存了企业位置信息,圆C1, C2,…, CN以数组cc中的元素为圆心,同时载荷点落在圆内,因此,按矩阵DA中的企业间的连接关系连接所有载荷坐标,即可反映企业的连接关系);
[0101] S302,设置变量j=1,转至S303;
[0102] S303,设定时间段[0,t],在时间段[0,t]中以每秒为间隔创建数列0,1,…,t,转至S304;
[0103] S304,记(xj0, yj0), (xj1, yj1),…, (xjt, yjt) 分别为载荷点(xj, yj)在0,1,…,t时的坐标值,令j增加1,转至S305;
[0104] S305,若j小于等于N,转至S304,若j大于N,转至S306;
[0105] S306,设置变量p=1,设置变量q=0;
[0106] S307,记第q+1时刻的第p个载荷点的经度和第q时刻的第p个载荷点的经度的差值为hpq,hpq的计算公式为:hpq=xp(q+1)‑xpq,令q 的值增加1,转到S308;
[0107] S308,若q的值小于等于t,转到S307,若q的值大于t,转到S309;
[0108] S309,令q的值为1,转到S310;
[0109] S310,记变量Ap0的值为1,记变量Bp0的值为N*(yp1‑ yp0)/ hp0,记变量Apt的值为0,记变量Bpt的值为N*(ypt‑ yp(t‑1))/ hp(t‑1),记变量Apq的值为hp(q‑1)/(hp(q‑1)+hp),记变量Bpq的值为N*(1‑Apq)*( ypq‑ yp(q‑1))/ hp(q‑1)+ N*Apq*( yp(q+1)‑ypq)/ hpq,
[0110] 令q的值增加1,转到S311;
[0111] S311,若q的值小于t,转到S310,若q的值大于等于t,转到S312;
[0112] S312,令q的值为0,转到S313;
[0113] S313,记变量ap0的值为 (‑ Ap0)/2,记变量bp0的值为 Bp0/2,
[0114] 记变量apq的值为(‑Apq)/((N‑1)+(1‑ Apq)* Ap(q‑1)),
[0115] 记变量bpq的值为(Bpq‑(1‑ Apq)* Bp(q‑1))/((N‑1)+(1‑ Apq)* Ap(q‑1)),[0116] 令q的值增加1,转到S314;
[0117] S314,若q的值小于等于t,转到S313,若q的值大于t,转到S315;
[0118] S315,令q的值为t‑1,记mpt的值为bpt,记mpq的值为apq*mp(q+1)+bpq,令q的值减1,转到S316;
[0119] S316,若q的值大于等于0,转到S315,若q的值小于0,转到S317;
[0120] S317,令q的值为0,记x为函数Crfpq(x)的自变量,函数Crfpq(x)的计算方式为:Crfpq(x)=
[0121] (1+N*(x‑xp(q+1))/(xpq‑ xp(q+1)))*((x‑xpq)/(xp(q+1)‑ xpq))2*yp(q+1)+(x‑xpq)*(x‑2
xp(q+1))/(xpq‑ xp(q+1)) *mpq,
[0122] 令q的值增加1,转到S318;
[0123] S318,若q的值小于t,转到S317,若q的值大于等于t,转到S319;
[0124] S319,若p的值小于等于N,令p的值增加1,重置q=0,转到S307,若p的值大于N,转到S320;
[0125] S320,令p的值为1,令q的值为0, 设置变量k;
[0126] S321,令k的值为p+1,记  ,转到S322;
[0127] S322,记 ,记企业亲密协同量EISV=|(Crp‑sign)/(min{Crp,sign})|,其中,min{Crp,sign}代表Crp和sign之间的最小值,若EISV的值小于1,则将矩阵DA中第k行第p列的元素和第p行第k列的元素更新为1,转到S323;其中,通过计算EISV判断企业间是否存在联系,并更新到矩阵DA中,以此修正企业关系图谱;
[0128] S323,若k的值小于N,令k的值增加1,转到S322,若k的值大于等于N,转到S324;
[0129] S324,若p的值小于N,令p的值增加1,转到S321,若p的值大于等于N,转到S325;
[0130] S325,若q的值小于t,重置p的值为1,令q的值增加1,转到S321,若q的值大于等于t,转到S326;
[0131] S326,结束程序;
[0132] 其中,所述t设定为[1,2]年,即[31536000, 63072000]秒。
[0133] 进一步地,步骤S400中,根据深化应用矩阵更新企业关系图谱,具体步骤为:
[0134] S401,记深化应用矩阵中的值为0的元素所在的行为第m1行,所在的列为第n1列,记值为1的元素所在的行为第m2行,所在的列为第n2列,根据企业编号关系,在企业关系图谱中,取消编号为m1的企业和编号为n1的企业之间的连接,连接编号为m2的企业和编号为n2的企业;
[0135] S402,循环执行S401,直至遍历完深化应用矩阵中的所有元素;
[0136] S403,在企业关系图谱中,删去孤立的企业,所述孤立的企业,即在企业关系图谱中没有与其他企业存在连接关系的企业。
[0137] 优选地,步骤S400中,根据深化应用矩阵更新企业关系图谱,具体步骤为:
[0138] 按照深度优先搜索算法遍历深化应用矩阵中每个元素,在企业关系图谱中,将值为0的元素所对应的两个企业之间的连接断开,将值为1的元素所对应的两个企业进行连接(元素所对应的两个企业,其意义即为:在企业关系图谱中,由企业编号关系,元素所在的行和列对应着两个企业);遍历完成后,在企业关系图谱中,删去孤立的企业,所述孤立的企业,即在企业关系图谱中没有与其他企业存在连接关系的企业。
[0139] 本发明的实施例提供的一种企业关系图谱的构建系统,如图2所示,该实施例的一种企业关系图谱的构建系统包括:处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种企业关系图谱的构建方法实施例中的步骤,所述处理器执行所述计算机程序运行在以下系统的单元中:
[0140] 图谱获取单元,用于获取某企业的企业关系图谱;
[0141] 矩阵构建单元,用于根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵;
[0142] 矩阵生成单元,用于根据企业关系矩阵,生成深化应用矩阵;
[0143] 图谱更新单元,用于根据深化应用矩阵更新企业关系图谱,并将企业关系图谱输出。
[0144] 所述一种企业关系图谱的构建系统可以运行于桌上型计算机、笔记本电脑、掌上电脑及云端数据中心等计算设备中。所述一种企业关系图谱的构建系统包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是一种企业关系图谱的构建方法及系统的示例,并不构成对一种企业关系图谱的构建方法及系统的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种企业关系图谱的构建系统还可以包括输入输出设备、网络接入设备、总线等。
[0145] 所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器  (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field‑ Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立元器件门电路或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种企业关系图谱的构建系统的控制中心,利用各种接口和线路连接整个一种企业关系图谱的构建系统的各个分区域。
[0146] 所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述一种企业关系图谱的构建方法及系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡  (Smart Media Card  ,SMC),安全数字 (Secure Digital  ,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0147] 本发明提供了一种企业关系图谱的构建方法,本发明提供了一种企业关系画谱的构建方法及系统,获取待查询企业的企业关系图谱,根据企业关系图谱中的企业名称和企业关系构建企业关系矩阵,根据企业关系矩阵,生成深化应用矩阵,根据深化应用矩阵更新企业关系图谱并将其输出。尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。