会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利库 / 交易对手风险 / 数据查询方法、装置、计算机设备和存储介质

数据查询方法、装置、计算机设备和存储介质

申请号 CN201811196512.4 申请日 2018-10-15 公开(公告)号 CN109543096A 公开(公告)日 2019-03-29
申请人 平安科技(深圳)有限公司; 发明人 刘小青; 叶素兰; 李国才; 王芊; 史羽超; 丁楠;
摘要 本申请涉及一种基于知识图谱技术的数据查询方法、装置、计算机设备和存储介质。所述方法包括:接收终端发送的查询请求;查询请求携带关键词;基于查询请求获取预设的知识图谱;根据知识图谱确定与关键词匹配的交易对手标识;获取与交易对手标识对应的目标数据;将目标数据输入预设的风险模型,得到交易对手标识对应的风险等级;将目标数据及风险等级发送至终端。采用本方法能够基于与交易对手相关的大数据准确确定交易对手风险程度。
权利要求

1.一种数据查询方法,所述方法包括:

接收终端发送的查询请求;所述查询请求携带关键词;

基于所述查询请求获取预设的知识图谱;

根据所述知识图谱确定与所述关键词匹配的交易对手标识;

获取与所述交易对手标识对应的目标数据;

将所述目标数据输入预设的风险模型,得到所述交易对手标识对应的风险等级;

将所述目标数据及所述风险等级发送至所述终端。

2.根据权利要求1所述的方法,其特征在于,在所述基于所述查询请求获取预设的知识图谱之前,还包括:获取多个交易对手标识,及每个所述交易对手标识对应的属性信息;

根据每个所述交易对手标识对应的属性信息,创建任意两个交易对手标识之间的关联关系;

根据所述多个交易对手标识和任意两个交易对手标识之间的关联关系,构建知识图谱。

3.根据权利要求2所述的方法,其特征在于,所述根据所述知识图谱确定与所述关键词匹配的交易对手标识,包括:查找包含所述关键词的多个交易对手标识,得到标识集;

基于所述知识图谱中查找与所述标识集中任意所述交易对手标识相邻的交易对手标识;

提取处于所述标识集的相邻的交易对手标识,作为与所述关键词匹配的交易对手标识。

4.根据权利要求1至3任意一项所述的方法,其特征在于,所述获取与所述交易对手标识对应的目标数据,包括:采集与所述交易对手标识对应的多种关联数据;

对所述多种关联数据进行数据清洗处理,生成待校验数据;

对所述待校验数据进行规则校验,得到校验结果;

根据所述校验结果为所述待校验数据打上相应的标签,得到目标数据。

5.根据权利要求1所述的方法,其特征在于,在所述将所述目标数据输入预设的风险模型,得到所述交易对手标识对应的风险等级之后,还包括:查找与所述风险等级对应的风险提示信息;

将所述风险提示信息发送至所述终端;所述风险提示信息用于指示所述终端展示与所述风险等级对应的预警标识。

6.根据权利要求1所述的方法,其特征在于,所述目标数据包括多项资产数据,所述方法还包括:确定每项资产数据对应的资产类型和时间信息;

根据所述时间信息确定每项资产数据对应的时间段;

将相同资产类型对应的多项资产数据,按照每项资产数据对应的时间段进行计算,得到相同资产类型在多个时间段的趋势数据;

根据所述趋势数据生成资产走势图,将所述资产走势图发送至所述终端。

7.一种数据查询装置,其特征在于,所述装置包括:接收模块,用于接收终端发送的查询请求;所述查询请求携带关键词;

匹配模块,用于基于所述查询请求获取预设的知识图谱;根据所述知识图谱确定与所述关键词匹配的交易对手标识;

获取模块,用于获取与所述交易对手标识对应的目标数据;

风险模块,用于将所述目标数据输入预设的风险模型,得到所述交易对手标识对应的风险等级;将所述目标数据及所述风险等级发送至所述终端。

8.根据权利要求7所述的装置,其特征在于,所述获取模块还用于采集与所述交易对手标识对应的多种关联数据;对所述多种关联数据进行数据清洗处理,生成待校验数据;对所述待校验数据进行规则校验,得到校验结果;根据所述校验结果为所述待校验数据打上相应的标签,得到目标数据。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

说明书全文

数据查询方法、装置、计算机设备和存储介质

技术领域

[0001] 本申请涉及计算机技术领域,特别是涉及一种数据查询方法、装置、计算机设备和存储介质。

背景技术

[0002] 公司在与交易对手进行交易之前,会查询交易对手的相关数据,以分析与该交易对手进行交易的风险。相关数据可以是该公司及该公司所属集团的其他子公司与该交易对手曾进行交易的历史数据。传统方式中,用户需登录多个子公司的系统进行数据查询,再将查询结果进行人工汇总。然而,由于子公司系统数据不连通,通常查询到的数据会具有一定的局限性,无法全面展示交易对手全貌,且基于个人经验对所查询到的数据进行分析,具有较强的主观性和不稳定性,导致难以准确地确定交易对手的风险程度。

发明内容

[0003] 基于此,有必要针对上述技术问题,提供一种能够准确确定交易对手风险程度的数据查询方法、装置、计算机设备和存储介质。
[0004] 一种数据查询方法,所述方法包括:接收终端发送的查询请求;所述查询请求携带关键词;基于所述查询请求获取预设的知识图谱;根据所述知识图谱确定与所述关键词匹配的交易对手标识;获取与所述交易对手标识对应的目标数据;将所述目标数据输入预设的风险模型,得到所述交易对手标识对应的风险等级;将所述目标数据及所述风险等级发送至所述终端。
[0005] 在其中一个实施例中,在所述基于所述查询请求获取预设的知识图谱之前,还包括:获取多个交易对手标识,及每个所述交易对手标识对应的属性信息;根据每个所述交易对手标识对应的属性信息,创建任意两个交易对手标识之间的关联关系;根据所述多个交易对手标识和任意两个交易对手标识之间的关联关系,构建知识图谱。
[0006] 在其中一个实施例中,所述根据所述知识图谱确定与所述关键词匹配的交易对手标识,包括:查找包含所述关键词的多个交易对手标识,得到标识集;基于所述知识图谱中查找与所述标识集中任意所述交易对手标识相邻的交易对手标识;提取处于所述标识集的相邻的交易对手标识,作为与所述关键词匹配的交易对手标识。
[0007] 在其中一个实施例中,所述获取与所述交易对手标识对应的目标数据,包括:采集与所述交易对手标识对应的多种关联数据;对所述多种关联数据进行数据清洗处理,生成待校验数据;对所述待校验数据进行规则校验,得到校验结果;根据所述校验结果为所述待校验数据打上相应的标签,得到目标数据。
[0008] 在其中一个实施例中,在所述将所述目标数据输入预设的风险模型,得到所述交易对手标识对应的风险等级之后,还包括:查找与所述风险等级对应的风险提示信息;将所述风险提示信息发送至所述终端;所述风险提示信息用于指示所述终端展示与所述风险等级对应的预警标识。
[0009] 在其中一个实施例中,所述目标数据包括多项资产数据,所述方法还包括:确定每项资产数据对应的资产类型和时间信息;根据所述时间信息确定每项资产数据对应的时间段;将相同资产类型对应的多项资产数据,按照每项资产数据对应的时间段进行计算,得到相同资产类型在多个时间段的趋势数据;根据所述趋势数据生成资产走势图,将所述资产走势图发送至所述终端。
[0010] 一种数据查询装置,所述装置包括:接收模块,用于接收终端发送的查询请求;所述查询请求携带关键词;匹配模块,用于基于所述查询请求获取预设的知识图谱;根据所述知识图谱确定与所述关键词匹配的交易对手标识;获取模块,用于获取与所述交易对手标识对应的目标数据;风险模块,用于将所述目标数据输入预设的风险模型,得到所述交易对手标识对应的风险等级;将所述目标数据及所述风险等级发送至所述终端。
[0011] 在其中一个实施例中,所述获取模块还用于采集与所述交易对手标识对应的多种关联数据;对所述多种关联数据进行数据清洗处理,生成待校验数据;对所述待校验数据进行规则校验,得到校验结果;根据所述校验结果为所述待校验数据打上相应的标签,得到目标数据。
[0012] 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述各个实施例中所述的数据查询方法的步骤。
[0013] 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个实施例中所述的数据查询方法的步骤。
[0014] 上述数据查询方法、装置、计算机设备和存储介质,综合服务器在接收到终端发送的携带关键词的查询请求之后,获取事先预设的知识图谱,并基于知识图谱准确地确定与关键词匹配的交易对手标识。综合服务器再基于知识图谱获取与交易对手标识对应的目标数据,将目标数据输入预设的风险模型进行数据处理,得到与交易对手标识对应的风险等级,综合服务器可将目标数据和相应的风险等级发送至终端进行展示。知识图谱能够全面反映所需查询的交易对手的目标数据,及其与其他交易对手的关联关系,基于知识图谱确定交易对手标识及获取目标数据能够获得更全面的数据,且通过风险模型对目标数据进行客观、稳定地数据分析,从而能够准确地确定交易对手的风险程度。

附图说明

[0015] 图1为一个实施例中数据查询方法的应用场景图;
[0016] 图2为一个实施例中数据查询方法的流程示意图;
[0017] 图3为另一个实施例中数据查询方法的流程示意图;
[0018] 图4为一个实施例中数据查询装置的结构框图;
[0019] 图5为一个实施例中计算机设备的内部结构图。

具体实施方式

[0020] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0021] 本申请提供的数据查询方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与综合服务器104进行通信。综合服务器104通过网络与多个子服务器106进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,综合服务器104与子服务器106可以用独立的服务器或者是多个服务器组成的服务器集群来实现。综合服务器104接收到终端102发送的查询请求之后,可基于查询请求获取预设的知识图谱,根据查询请求携带的关键词确定匹配的交易对手标识。综合服务器104可从多个子服务器106中获取与交易对手标识对应的目标数据,之后将目标数据输入预设的风险模型,得到交易对手标识对应的风险等级。综合服务器104还将目标数据及相应的风险等级发送至终端102。
[0022] 在一个实施例中,如图2所示,提供了一种数据查询方法,以该方法应用于图1中的综合服务器104为例进行说明,包括以下步骤:
[0023] 步骤202,接收终端发送的查询请求;查询请求携带关键词。
[0024] 关键词可以包括交易对手的全称、简称或部分名称,还可以包括交易对手的属性信息等,但不限于此。交易对手可以是企业也可以是法人或自然人。比如说,关键词可以是企业名称或组织机构号等,关键词还可以是人名、职务、关系等。查询请求携带的关键词可为一个或多个。
[0025] 在一个实施例中,查询请求还携带用户标识,综合服务器还用于检测该携带的用户标识对应的用户权限,当用户权限符合数据查询条件时,执行进一步的数据查询操作。
[0026] 在一个实施例中,终端可提供一个数据查询界面,该数据查询界面可包括文本框、选择框、下拉框等输入控件。用户可访问该处置信息上传界面,并通过输入控件选择所需查询的交易对手的属性或输入关键词。数据查询界面中还可包含确定查询控件,当终端检测到作用于该确定查询控件的点击操作时,可将用户选择或输入的关键词发送至综合服务器。
[0027] 步骤204,基于查询请求获取预设的知识图谱。
[0028] 知识图谱是指包含多个交易对手标识且用于反映交易对手之间关联关系的图谱。知识图谱中每个交易对手标识都可作为一个节点。节点之间通过交易对手之间的关联关系进行连接。关联关系包括但不限于投资关系、增信关系、隐性关系、信贷关系、事件关系、交易关系等。增信关系可以是银行担保关系。隐性关系可以是亲属关系、往来关系、代理关系、职务关系等。
[0029] 在一个实施例中,在基于查询请求获取预设的知识图谱之前,还包括:获取多个交易对手标识,及每个交易对手标识对应的属性信息;根据每个交易对手标识对应的属性信息,创建任意两个交易对手标识之间的关联关系;根据多个交易对手标识和任意两个交易对手标识之间的关联关系,构建知识图谱。
[0030] 综合服务器可从多个子服务器获取交易对手标识及每个交易对手标识对应的属性信息。属性信息可以是该交易对手本身的信息,也可以是交易对手与其他交易对手之间的关联关系信息。不同子服务器中可存储相同和/或不同的存储的交易对手标识。综合服务器可根据交易对手标识对应的交易对手名称、组织机构代码、法人信息等信息,对多个交易对手标识进行去重处理。通过分析任意两个交易对手标识对应的属性信息之间的交叉关系,创建任意两个交易对手标识之间的关联关系。若两个交易对手标识对应的属性信息之间不存在交叉,则说明二者之间的相互影响的程度较小。通过构建由多个交易对手标识之间的知识图谱,能够反映每个交易对手与其他交易对手之间的影响程度。
[0031] 步骤206,根据知识图谱确定与关键词匹配的交易对手标识。
[0032] 交易对手标识包括但不限于交易对手的编号、全称或简称等。用户输入的关键词并不一定确切全面。比如用户输入关键词A,但是包含A的交易对手编号可有多个,A保险公司、A金融公司、A银行等。再比如用户不记得交易对手的具体名称,只能通过输入多个维度的属性关键词来逐步缩小查询范围。知识图谱中包含全面的交易对手标识,且还包含交易对手之间的关联关系,因此可通过知识图谱查找与关键词匹配的一个或多个交易对手标识。
[0033] 在一个实施例中,关键词包括交易对手的部分名称,可从知识图谱中获取包含关键词的多个交易对手标识。综合服务器可将查找到的多个交易对手标识发送至终端,终端可以以列表或图谱的形式展示多个交易对手标识。当终端检测到作用于其中一个交易对手标识的选择操作时,将该被选择的交易对手标识作为与关键词匹配的交易对手标识,并将匹配的交易对手标识发送至综合服务器,以进行下一步的数据查询步骤。
[0034] 在一个实施例中,关键词包括交易对手的属性信息,可将关键词与知识图谱中交易对手标识与交易对手标识之间的关联关系进行匹配,得到与关键词匹配的关联关系。可将匹配的关联关系对应的两个交易对手标识,作为与关键词匹配的交易对手标识。
[0035] 步骤208,获取与交易对手标识对应的目标数据。
[0036] 目标数据可以是与该交易对手相关的资产数据、舆情事件数据、工商数据等其中一种或多种。资产数据包括但不限于非标债权、资本市场债券、信贷、非信贷等金融数据。舆情事件数据包括但不限于交易对手的涉诉情况、经营情况等。
[0037] 在一个实施例中,可基于预设的知识图谱获取对应的目标数据,目标数据可以包括交易对手之间的关联关系数据。还可以将与所选择的交易对手具有较强关联关系的交易对手的相关数据也作为目标数据。比如,若交易对手M为交易对手N的旗下子公司,则交易对手N的经营情况等必定会影响交易对手M,因此目标数据可包含交易对手N的相关数据。
[0038] 步骤210,将目标数据输入预设的风险模型,得到交易对手标识对应的风险等级。
[0039] 在一个实施例中,可预先构建包含多个目标指标的风险模型。首先需进行指标数据探查,分析指标的缺失率和异常率,剔除缺失率高或存在大量离群点或异常值的指标;进行单因素分析,将对剩余指标进行分箱处理,计算IV值(information value,信息值),当指标的IV值大于预设阈值时,将该指标作为目标指标。根据历史的高风险、低风险、无风险等风险等级的交易对手分别对应的目标数据及目标指标进行建模,得到风险模型。可通过风险模型对需查询的交易对手进行风险预测。能够将还未纳入黑灰名单,但具有潜在风险的交易对手筛选出来以进行提前观察预防。
[0040] 在一个实施例中,风险模型包括逻辑回归模型。举例来说,获取初始逻辑回归模型,如下公式所示:交易对手为高风险的概率为 则交易对手为无风险的概率为 其中,y=1表示交易对手为高风险的情况,y=0表示
交易对手为无风险的情况。令θTx=g(x)=β0+β1x+β2x2+...+βkxk,其中,β0为常量,β1……βk为拟合系数。高风险交易对手和无风险交易对手的概率比为 对两边取对
数则为线性函数 根据选取的目标指标对
应的建模数据对线性函数进行拟合训练,得到拟合系数的具体值。根据拟合得到的具体值可以得到拟合后的逻辑回归模型。可将交易对手的该目标指标对应的目标数据带入相应的逻辑回归模型,得到针对该目标指标的风险概率。得到每个目标指标对应的拟合后的逻辑回归模型之后,可综合每个逻辑回归模型得到违规风险模型。风险模型可用于对每个逻辑回归模型计算出的概率进行加权求和,转换为相应的违规风险分数或风险等级,以此衡量交易对手的风险大小。比如说共有四个目标指标,每个目标指标相应的逻辑回归模型计算出的风险概率为P1、P2、P3、P4,及相应的权重为W1、W2、W3、W4,则风险分数可为:Q=P1*W1+P2*W2+P3*W3+P4*W4。还可预先划分不同风险等级对应的风险分数的区间,从而能够将计算得到的风险分数转化为相应的风险等级。
[0041] 在一个实施例中,目标数据可包含非标债权、资本市场债券、信贷、非信贷等金融资产数据,可根据交易对手的资产数据将交易对手划分至黑灰名单。黑名单中的交易对手是指已实际逾期欠息、实际违约的交易对手;其中银行是以逾期天数大于7天来定义黑名单交易对手的。灰名单中的交易对手包括确认上报风险资产分类为“预警监测类”,银行上报风险资产为“重大预警”、“五级分类为关注类”、“5000万以上一二级预警”的资产数据对应的交易对手。
[0042] 在一个实施例中,目标数据中包含多种标签,风险模型可检测目标数据中的标签类型,还可统计目标数据中的标签数量。可根据不同的标签类型,或标签数量的数量区间,将交易对手标识映射为不同的风险等级。比如说,当目标数据包含高风险标签时,或目标数据包含超过20个低风险标签时,可将交易对手标识标记为高风险等级。
[0043] 步骤212,将目标数据及风险等级发送至终端。
[0044] 在一个实施例中,在将目标数据输入预设的风险模型,得到交易对手标识对应的风险等级之后,还包括:查找与风险等级对应的风险提示信息;将风险提示信息发送至终端;风险提示信息用于指示终端展示与风险等级对应的预警标识。
[0045] 举例来说,当所查询的交易对手处于黑灰名单时,生成相应的限额警示、预警风险提示等。且预警风险可以亮灯的形式进行提示。比如对持仓增加的“红灯”警示交易对手。比如交易对手B是已出险的但银行对交易对手B继续新增授信,银行的持仓增加,就会亮红灯提示风险。集中度警示可以是根据对行业集中度、投资大类集中度的限额要求和监测管理要求,对交易对手进行集中度监测,结合风险信息对集中度进行调节,当交易对手授信敞口接近或突破集中度时,进行警示。针对黑名单中的交易对手和灰名单中的交易对手通过不同颜色的亮灯来警示,比如说通过红灯来警示黑名单中的交易对手,通过黄灯来警示灰名单中的交易对手。用户可根据警示灯快速地了解交易对手的风险程度。还可结合交易对手的多个维度综合风险情况和持仓规模大小,给出综合预警强度等级。比如可分为刚、强、中、弱四个等级。通过预警风险警示提醒相关部门对综合预警强度等级较高的交易对手进行排查。
[0046] 上述数据查询方法中,综合服务器在接收到终端发送的携带关键词的查询请求之后,获取事先预设的知识图谱,并基于知识图谱准确地确定与关键词匹配的交易对手标识。综合服务器再基于知识图谱获取与交易对手标识对应的目标数据,将目标数据输入预设的风险模型进行数据处理,得到与交易对手标识对应的风险等级,综合服务器可将目标数据和相应的风险等级发送至终端进行展示。知识图谱能够全面反映所需查询的交易对手的目标数据,及其与其他交易对手的关联关系,基于知识图谱确定交易对手标识及获取目标数据能够获得更全面的数据,且通过风险模型对目标数据进行客观、稳定地数据分析,从而能够准确地确定交易对手的风险程度。
[0047] 在一个实施例中,获取与交易对手标识对应的目标数据,包括:采集与交易对手标识对应的多种关联数据;对多种关联数据进行数据清洗处理,生成待校验数据;对待校验数据进行规则校验,得到校验结果;根据校验结果为待校验数据打上相应的标签,得到目标数据。
[0048] 综合服务器可预先从多个子公司的子数据库中拉取交易对手的相关数据进行汇总,或通过网络爬虫在网页上采集相关信息。在采集多维度的数据之后,对数据进行数据清洗转换为风险控制角度需关注的待校验数据。通过对待校验数据进行规则校验,可得到校验结果。根据校验结果构建交易对象的风险画像,可对交易对象打上各类标签。比如“是否实际违约”“实际违约次数”“实际违约金额”“实际违约时长”“近期是否涉诉”等。通过标签,使得用户能够方便地从多个维度全面地了解交易对手的全貌。
[0049] 在一个实施例中,得到待校验数据之后,还包括对待校验数据进行敞口计算,将计算得到的风险敞口也作为目标数据。风险敞口是指因债务人违约行为导致的可能承受风险的信贷余额。可通过回归分析来评估风险敞口,比如根据交易对手的历史收益或现金流量与风险要素之间的数量关系回归来估计要素p系数。在回归模型中要素卢系数就是曲线的斜率、可根据模拟法度量风险敞口、还可通过波动率和在险价值来度量风险敞口。
[0050] 在一个实施例中,根据知识图谱确定与关键词匹配的交易对手标识,包括:查找包含关键词的多个交易对手标识,得到标识集;基于知识图谱中查找与标识集中任意交易对手标识相邻的交易对手标识;提取处于标识集的相邻的交易对手标识,作为与关键词匹配的交易对手标识。
[0051] 当用户需要查询一个集团母公司旗下的子公司时,而同一母公司旗下的子公司名称通常会比较相似,用户通常会输入比较有针对性的关键词,比如输入子公司名称的重叠部分作为关键词时。而查询到包含关键词的交易对手标识会比较多,不利于用户进行高效地选择。比如说,若用户想要查询平安集团下的子公司,则用户输入的关键词为“平安”,但包含“平安”关键词的可能还有其他不相关的交易对手标识,需要将不相关的交易对手排除。
[0052] 可通过将包含关键词的交易对手标识作为一个标识集,并基于知识图谱查找与包含关键词的交易对手标识相邻的交易对手标识,也就是与包含关键词的交易对手标识具有关联关系的交易对手标识。若提取的相邻的交易对手标识也处于标识集中,则说明该相邻的交易对手标识包含该关键词,该相邻的交易对手标识可作为与关键词匹配的交易对手标识。筛选出来的与关键词匹配的交易对手标识具有较强的集团性,可提高用户在查询一个集团母公司旗下的子公司时,确定交易对手标识的效率。
[0053] 在一个实施例中,目标数据包括多项资产数据,该方法还包括:确定每项资产数据对应的资产类型和时间信息;根据时间信息确定每项资产数据对应的时间段;将相同资产类型对应的多项资产数据,按照每项资产数据对应的时间段进行计算,得到相同资产类型在多个时间段的趋势数据;根据趋势数据生成资产走势图,将资产走势图发送至终端。
[0054] 举例来说,具体的趋势变动可以是每隔预设时长展示展示交易对手的账面余额数据。比如说按天、按月展示交易对手的持仓量,生成折线图,从而能够更加直观地看出交易对手的动态走势。用户还可以选择多个交易对手,将多个相关联的交易对手的资产数据进行累加,得到展示累加数据的资产走势图。
[0055] 在一个实施例中,在将目标数据及风险等级发送至终端之后,用户还可对大量的目标数据进行筛选。比如说,用户还可输入查询条件,当查询条件的复杂度较高时,通过HIVE(一种基于Hadoop的一个数据仓库工具)查询引擎进行查询,当查询条件较低时,通过presto(一种分布式SQL查询引擎)查询引擎查询投融资数据。当查询请求所针对的查询对象的数据量大于预设阈值时,使用HIVE进行查询。当查询时间跨度大于预设时长时,使用HIVE进行查询。比如超过1年的,一般用HIVE查询。跨度越大,查询所对应的数据量也越大。当PRESTO中未处理的查询任务超过预设数量时,使用HIVE进行查询。其余情况通过presto查询引擎分担HIVE查询引擎的查询任务,提高了查询效率。
[0056] 在一个实施例中,如图3所示,提供了另一种资产数据处理方法,以该方法应用于图1中的综合服务器104为例进行说明,包括以下步骤:
[0057] 步骤302,获取多个交易对手标识,及每个交易对手标识对应的属性信息。
[0058] 步骤304,根据每个交易对手标识对应的属性信息,创建任意两个交易对手标识之间的关联关系。
[0059] 步骤306,根据多个交易对手标识和任意两个交易对手标识之间的关联关系,构建知识图谱。
[0060] 步骤308,接收终端发送的查询请求;查询请求携带关键词。
[0061] 步骤310,基于查询请求获取预设的知识图谱。
[0062] 步骤312,查找包含关键词的多个交易对手标识,得到标识集。
[0063] 步骤314,基于知识图谱中查找与标识集中任意交易对手标识相邻的交易对手标识。
[0064] 步骤316,提取处于标识集的相邻的交易对手标识,作为与关键词匹配的交易对手标识。
[0065] 步骤318,获取与交易对手标识对应的目标数据。
[0066] 步骤320,将目标数据输入预设的风险模型,得到交易对手标识对应的风险等级。
[0067] 步骤322,将目标数据及风险等级发送至终端。
[0068] 上述数据查询方法中,综合服务器在接收到终端发送的携带关键词的查询请求之后,获取事先预设的知识图谱,并基于知识图谱准确地确定与关键词匹配的交易对手标识。综合服务器再基于知识图谱获取与交易对手标识对应的目标数据,将目标数据输入预设的风险模型进行数据处理,得到与交易对手标识对应的风险等级,综合服务器可将目标数据和相应的风险等级发送至终端进行展示。知识图谱能够全面反映所需查询的交易对手的目标数据,及其与其他交易对手的关联关系,基于知识图谱确定交易对手标识及获取目标数据能够获得更全面的数据,且通过风险模型对目标数据进行客观、稳定地数据分析,从而能够准确地确定交易对手的风险程度。
[0069] 应该理解的是,虽然图2和3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0070] 在一个实施例中,如图4所示,提供了一种数据查询装置400,包括:接收模块402,用于接收终端发送的查询请求;查询请求携带关键词;匹配模块404,用于基于查询请求获取预设的知识图谱;根据知识图谱确定与关键词匹配的交易对手标识;获取模块406,用于获取与交易对手标识对应的目标数据;风险模块408,用于将目标数据输入预设的风险模型,得到交易对手标识对应的风险等级;将目标数据及风险等级发送至终端。
[0071] 在一个实施例中,获取模块406还用于采集与交易对手标识对应的多种关联数据;对多种关联数据进行数据清洗处理,生成待校验数据;对待校验数据进行规则校验,得到校验结果;根据校验结果为待校验数据打上相应的标签,得到目标数据。
[0072] 在一个实施例中,该装置还包括图谱模块,用于获取多个交易对手标识,及每个交易对手标识对应的属性信息;根据每个交易对手标识对应的属性信息,创建任意两个交易对手标识之间的关联关系;根据多个交易对手标识和任意两个交易对手标识之间的关联关系,构建知识图谱。
[0073] 在一个实施例中,匹配模块404还用于查找包含关键词的多个交易对手标识,得到标识集;基于知识图谱中查找与标识集中任意交易对手标识相邻的交易对手标识;提取处于标识集的相邻的交易对手标识,作为与关键词匹配的交易对手标识。
[0074] 在一个实施例中,获取模块406还用于采集与交易对手标识对应的多种关联数据;对多种关联数据进行数据清洗处理,生成待校验数据;对待校验数据进行规则校验,得到校验结果;根据校验结果为待校验数据打上相应的标签,得到目标数据。
[0075] 在一个实施例中,该装置还包括展示模块,用于查找与风险等级对应的风险提示信息;将风险提示信息发送至终端;风险提示信息用于指示终端展示与风险等级对应的预警标识。
[0076] 在一个实施例中,展示模块还用于确定每项资产数据对应的资产类型和时间信息;根据时间信息确定每项资产数据对应的时间段;将相同资产类型对应的多项资产数据,按照每项资产数据对应的时间段进行计算,得到相同资产类型在多个时间段的趋势数据;根据趋势数据生成资产走势图,将资产走势图发送至终端。
[0077] 关于数据查询装置的具体限定可以参见上文中对于数据查询方法的限定,在此不再赘述。上述数据查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0078] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预设的知识图谱等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据查询方法。
[0079] 本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0080] 在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述各个实施例中的数据查询方法的步骤。
[0081] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个实施例中的数据查询方法的步骤。
[0082] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0083] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0084] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。