数据同步的方法和装置转让专利
申请号 : CN201811522527.5
文献号 : CN109829012B
文献日 : 2021-03-12
发明人 : 李佰超 , 李世健 , 王德山
申请人 : 山东亚华电子股份有限公司
摘要 :
权利要求 :
1.一种数据同步的方法,其特征在于,所述方法包括如下步骤:查找源数据库中与一个或多个目标字段对应的源字段,其中,所述一个或多个目标字段为目标数据库的数据字典中的一个或多个字段,所述目标数据库的数据字典中的每个字段对应唯一的键值;
确定所述一个或多个目标字段的键值与相应源字段之间的关联关系,所述源字段是查找到的所述目标字段对应的源字段;
基于所述关联关系,将所述源数据库中与所述一个或多个目标字段对应的源字段的数据同步到所述目标数据库中;
在确定目标数据库中待同步数据对应的目标字段之前,所述方法还包括:配置所述目标数据库的数据字典,所述目标数据库的数据字典中包含至少一个字段,每个字段具有不同的含义且使用唯一的键值进行唯一标识;
配置所述目标数据库的数据字典,包括:获取源数据库的字段;
在所述目标数据库中未查找到与所述源数据库的字段对应的目标字段情况下,将所述源数据库的字段添加到所述目标数据库的数据字典中,并为所述源数据库的字段设置唯一的键值;
查找源数据库中与所述目标字段对应的源字段,包括:获取目标字段的数据特征向量,以及所述源数据库中源字段的数据特征向量,所述目标字段的数据特征向量和所述源字段的数据特征向量均为多维向量;
计算所述目标字段的数据特征向量和所述源字段的数据特征向量的加权欧式距离;
将欧式距离最小的源字段确定为所述源数据库中与所述目标字段对应的源字段;
所述源数据库为医院内各种信息系统的数据库;
在同步数据时,将医院信息系统的数据读取到临时表中,并根据历史数据源说明文档将临时键值写入临时表中,比对临时表中的临时键值是否等于医疗设备主机的数据库对应的预先配置的数据字典中字段的唯一键值,只有完全相等的情况下,将该临时键值对应的字段的数据写入医疗设备主机的数据库中。
2.根据权利要求1所述的数据同步的方法,其特征在于,配置所述目标数据库的数据字典,包括:
配置所述目标数据库的数据字典中每个字段的如下至少一种属性:是否来自源数据库、源数据库的标识、是否显示字段、字段类型。
3.根据权利要求1所述的数据同步的方法,其特征在于,查找源数据库中与所述目标字段对应的源字段,包括:
获取目标字段的目标字段名,以及源字段的源字段名;
采用逆向最大匹配算法对所述目标字段名和所述源字段名分别进行分词处理,得到所述目标字段名和所述源字段名对应的多个特征词;其中,每个特征词对应一个文本特征项;
计算所述目标字段名与所述源字段名的相似度;
将相似度大于阈值的源字段名对应的源字段作为与所述目标字段对应的源字段;
将每个目标字段对应的源字段的源字段名添加到每个目标字段对应的字段名称库中,其中,每个目标字段对应的字段名称库中包含所述目标字段对应的多个字段名,所述多个字段名具有相同的键值,所述每个目标字段对应的字段名称库用于所述目标数据库同步其他的源数据库中的数据;
其中,计算所述目标字段名与所述源字段名的相似度的公式为:其中,
Ftarget=(ftarget,1,ftarget,2,…,ftarget,k,…ftarget,N);
Foriginal=(foriginal,1,foriginal,2,…,foriginal,k,…foriginal,N);
其中,Sim(Ftarget,Foriginal)表示目标字段名与源字段名的相似度;Ftarget表示目标字段名对应的文本向量,ftarget,k表示目标字段名对应的第k个文本特征项,wtarget,k表示目标字段名对应的第k个文本特征项ftarget,k的权重;Foriginal表示源字段名对应的文本向量,foriginal,k表示源字段名对应的第k个文本特征项,woriginal,k表示源字段名对应的第k个文本特征项foriginal,k的权重;N表示从所述目标字段名或源字段名中提取的文本特征项的最大数量。
4.根据权利要求1所述的数据同步的方法,其特征在于,所述加权欧式距离的公式为:其中,
Xtarget=(xtarget,1,xtarget,2,…,xtarget,k,…xtarget,M);
Xoriginal=(xoriginal,1,xoriginal,2,…,xoriginal,k,…xoriginal,N);
其中,Distance(dtarget,j,doriginal,j)表示目标字段的数据特征向量与源字段的数据特征向量之间的欧式距离;Xtarget表示目标字段的数据特征向量,dtarget,j表示目标字段的第j个数据特征;Xoriginal表示源字段的数据特征向量,doriginal,j表示源字段的第j个数据特征;
Sj表示方差;M表示从所述目标字段名或源字段名中提取的数据特征的最大数量。
5.根据权利要求1所述的数据同步的方法,其特征在于,在基于所述关联关系,将所述源数据库中与所述目标字段对应的源字段的数据同步到所述目标数据库中之后,所述方法还包括:
获取所述目标数据库中待显示的至少一个字段;
输出所述目标数据库中待显示的至少一个字段的数据。
6.根据权利要求1所述的数据同步的方法,其特征在于,基于所述关联关系,将所述源数据库中与所述目标字段对应的源字段的数据同步到所述目标数据库中,包括:所述源数据库通过如下任意一种或多种方式向所述目标数据库提供与所述目标字段对应的源字段的数据:视图、Web服务、集成平台。
7.一种数据同步的装置,其特征在于,所述装置包括:查找单元,用于查找源数据库中与一个或多个目标字段对应的源字段,其中,所述一个或多个目标字段为目标数据库的数据字典中的一个或多个字段,所述目标数据库的数据字典中的每个字段对应唯一的键值;获取目标字段的数据特征向量,以及所述源数据库中源字段的数据特征向量,所述目标字段的数据特征向量和所述源字段的数据特征向量均为多维向量;计算所述目标字段的数据特征向量和所述源字段的数据特征向量的加权欧式距离;将欧式距离最小的源字段确定为所述源数据库中与所述目标字段对应的源字段;所述源数据库为医院内各种信息系统的数据库;配置所述目标数据库的数据字典,所述目标数据库的数据字典中包含至少一个字段,每个字段具有不同的含义且使用唯一的键值进行唯一标识;获取源数据库的字段;在所述目标数据库中未查找到与所述源数据库的字段对应的目标字段情况下,将所述源数据库的字段添加到所述目标数据库的数据字典中,并为所述源数据库的字段设置唯一的键值;
确定单元,用于确定所述一个或多个目标字段的键值与相应源字段之间的关联关系,所述源字段是查找到的所述目标字段对应的源字段;
同步单元,用于基于所述关联关系,将所述源数据库中与所述一个或多个目标字段对应的源字段的数据同步到所述目标数据库中;在同步数据时,将医院信息系统的数据读取到临时表中,并根据历史数据源说明文档将临时键值写入临时表中,比对临时表中的临时键值是否等于医疗设备主机的数据库对应的预先配置的数据字典中字段的唯一键值,只有完全相等的情况下,将该临时键值对应的字段的数据写入医疗设备主机的数据库中。
说明书 :
数据同步的方法和装置
技术领域
背景技术
现代化医疗设备。这些现代化医疗设备需要与医院的医疗信息系统对接,以获取一些基本
的医疗信息。但是,由于不同医院的医疗信息系统,采用的数据库技术不同,导致这些现代
化医疗设备与不同医院的医疗信息系统对接的时候,对现场实施人员的门槛要求比较高。
一般需要具有一定数据库知识储备和代码能力的现场实施人员,现场编写相应的脚本代码
来读取医院信息系统的数据。这种数据同步方式,大大影响了工作效率。
发明内容
库的数据字典中的一个或多个字段,目标数据库的数据字典中的每个字段对应唯一的键
值;确定一个或多个目标字段的键值与相应源字段之间的关联关系,源字段是查找到的目
标字段对应的源字段;基于关联关系,将源数据库中与一个或多个目标字段对应的源字段
的数据同步到目标数据库中。
有不同的含义且使用唯一的键值进行唯一标识。
标数据库的数据字典中,并为源数据库的字段设置唯一的键值。
类型。
阈值的源字段名对应的源字段作为与目标字段对应的源字段;其中,计算目标字段名与源
字段名的相似度的公式为:
标字段名对应的第k个文本特征项ftarget,k的权重;Foriginal表示源字段名对应的文本向量,
foriginal,k表示源字段名对应的第k个文本特征项,woriginal,k表示源字段名对应的第k个文本
特征项foriginal,k的权重;N表示从目标字段名或源字段名中提取的文本特征项的最大数量。
对应的多个特征词;其中,每个特征词对应一个文本特征项。
字段对应的字段名称库中,其中,每个目标字段对应的字段名称库中包含目标字段对应的
多个字段名,多个字段名具有相同的键值;其中,每个目标字段对应的字段名称库用于目标
数据库同步其他的源数据库中的数据。
段的数据特征向量均为多维向量;计算目标字段的数据特征向量和源字段的数据特征向量
的加权欧式距离;将欧式距离最小的源字段确定为源数据库中与目标字段对应的源字段;
其中,加权欧式距离的公式为:
第j个数据特征;Xoriginal表示源字段的数据特征向量,doriginal,j表示源字段的第j个数据特
征;Sj表示方差;M表示从目标字段名或源字段名中提取的数据特征的最大数量。
标数据库中待显示的至少一个字段的数据。
标字段对应的源字段的数据:视图、Web服务、集成平台。
数据字典中的一个或多个字段,目标数据库的数据字典中的每个字段对应唯一的键值;确
定单元,用于确定一个或多个目标字段的键值与相应源字段之间的关联关系,源字段是查
找到的目标字段对应的源字段;同步单元,用于基于关联关系,将源数据库中与一个或多个
目标字段对应的源字段的数据同步到目标数据库中。
求,实现目标数据库与不同厂商医院信息系统的数据同步,以获取相应的医疗数据,实现了
不同厂商医院信息系统的互通,提高现场实施人员的实施效率;
附图说明
具体实施方式
步处理,需要这些医疗设备的现场实施人员在部署时现场编写SQL(Structured Query
Language,结构化查询语言)脚本来读取HIS数据,导致医疗设备与医院信息系统之间的数
据同步配置工作需要较长的时间,且需要现场实施人员有一定的数据库知识储备和代码能
力,要求现场实施人员的门槛极高。在人手不充足的情况下,多个医院同时部署,会导致配
置效率低下。
时,内置一份字段配置表的数据字典,现场实施人员只需要根据医院要求,设置出厂内置的
数据字典中哪些字段需要显示即可。在配置好字段以后,针对不同厂商HIS的数据库,选择
相应的数据源(包括但不限于(例如,DB2、ORACLE、SQL SEVER等数据库)匹配连接,以读取相
应的HIS数据,并基于预先配置的字段以及字段反射和映射机制,将相应的HIS数据同步到
本地数据库。
疗设备主机102与医疗设备分机之间通过局域网103连接。
份HIS数据源的说明文档,该说明文档中包含了HIS数据源的字段含义。
施人员只需要通过修改SQL语句将医院信息系统101上的数据读取到医疗设备主机102的本
地数据库的临时表中,在写入临时表中时,根据历史数据源说明文档将一个临时的键值
(Key值)写入临时表中。然后执行同步比对程序。比对临时表中的临时Key值是否等于医疗
设备主机的数据库对应的预先配置的数据字典中字段的唯一Key值,只有完全相等的情况
下,将该临时Key值对应的字段的数据写入医疗设备主机102的数据库中。当待同步数据的
全部字段都比对完成后,医疗设备主机102执行下发操作,将同步的数据显示到各个医疗设
备分机104中。
设备包括主机和多个分机。通过主机来向各个分机下发相应的数据。由此,现场实施人员只
需要在部署医疗设备主机的时候,对医疗设备主机的数据库进行数据同步配置即可。
1 P1 过敏 1 1 过敏
2 P2 饮食 1 1 饮食
3 P3 手术时间 1 1 扩展
4 P4 诊断 1 1 扩展
5 P5 陪护 0 1 扩展
6 P6 隔离 0 1 预警
7 P7 防压疮 1 1 预警
8 P8 防坠床 1 1 预警
9 P9 防跌倒 1 1 预警
10 P10 记出入量 1 1 预警
11 P11 病情 1 1 扩展
12 P12 余额 1 1 余额
13 P13 已缴费金额 0 1 扩展
14 P14 已支付金额 0 1 扩展
15 P15 绝对卧床 1 1 预警
16 P16 心率监测 1 1 预警
17 P17 VTE 1 1 预警
18 P18 重点观察 1 1 预警
19 P19 小心烫伤 1 1 预警
20 P20 防导管滑脱 1 1 预警
21 P21 二维码 0 1 二维码
22 P22 费别 1 1 扩展
23 PATIENT_ID 患者ID 1 1 基础
24 INP_NO 住院号 1 1 基础
25 NURSE_LEVEL 护理等级 1 1 基础
26 IN_FQCY 住院次数 1 1 基础
27 PATIENT_NAME 病人姓名 1 1 基础
28 PATIENT_SEX 性别 1 1 基础
29 PATIENT_BIRTHDAY 生日 1 1 基础
30 DOCTOR 主治医生 1 1 基础
31 NURSE 责任护士 1 1 基础
32 IN_TIME 入院时间 1 1 基础
33 PAT_AGE 年龄 1 1 基础
显示字段、字段类型;其中,源数据库的标识可以是但不限于医院信息系统HIS、实验室信息
系统LIS、医学影像存档与通讯系统PACS等;字段类型包括如下至少之一:基础字段、扩展字
段和预警字段。其中,基础字段可以是构成目标数据库的基础的字段;扩展字段可以是在基
础字段的基础上扩展出来的字段;预警字段可以是用于提示预警信息的字段。可选地,还可
以是余额、二维码等其他特殊类型的字段。
的字段配置数据字典的时候,具体步骤为:获取源数据库的字段;在目标数据库中未查找到
与源数据库的字段对应的目标字段情况下,将源数据库的字段添加到目标数据库的数据字
典中,并为源数据库的字段设置唯一的键值。
“病人ID”、C医院对患者的住院号的字段命名为“患者号码”、D医院对患者的住院号的字段
命名为“病人号码”。为了兼容不同厂商的HIS系统,本申请通过字段的唯一键值来标识每个
字段,可以起到唯一标识的作用。
个字段对应唯一的键值。
对应的源字段(即源数据库中的字段)。
段的源字段名;计算目标字段名与源字段名的相似度;将相似度大于阈值的源字段名对应
的源字段作为与目标字段对应的源字段;其中,计算目标字段名与源字段名的相似度的公
式为:
标字段名对应的第k个文本特征项ftarget,k的权重;Foriginal表示源字段名对应的文本向量,
foriginal,k表示源字段名对应的第k个文本特征项,woriginal,k表示源字段名对应的第k个文本
特征项foriginal,k的权重;N表示从目标字段名或源字段名中提取的文本特征项的最大数量。
特征词;其中,每个特征词对应一个文本特征项。
应的字段名称库中,其中,每个目标字段对应的字段名称库中包含目标字段对应的多个字
段名,多个字段名具有相同的键值;其中,每个目标字段对应的字段名称库用于目标数据库
同步其他的源数据库中的数据。将源数据库中,未在目标数据库的数据字典中查找到的字
段,添加到目标数据库的数据字典中,可以丰富目标数据库的数据字典中包含的字段,以便
兼容更多厂商的HIS系统。
中源字段的数据特征向量,目标字段的数据特征向量和源字段的数据特征向量均为多维向
量;计算目标字段的数据特征向量和源字段的数据特征向量的加权欧式距离;将欧式距离
最小的源字段确定为源数据库中与目标字段对应的源字段;其中,加权欧式距离的公式为:
第j个数据特征;Xoriginal表示源字段的数据特征向量,doriginal,j表示源字段的第j个数据特
征;Sj表示方差;M表示从目标字段名或源字段名中提取的数据特征的最大数量。
情况发生。例如,A医院的“患者ID”与D医院的“病人号码”,如果仅通过自然语言技术,根据
字段名来查找的时候,容易识别为两个字段,即为A医院对患者的住院号的字段设置一个键
值,为B医院对患者的住院号的字段设置另一个键值。
目标字段的键值,将查找到的字段的数据同步到目标数据库中。
意的是,源数据库可以通过如下任意一种或多种方式向目标数据库提供与目标字段对应的
源字段的数据:视图、Web服务、集成平台。
库)后,还可以进一步确定每个医疗设备分机104上显示的字段,隐藏掉一些只在医护设备
主机102显示,而不想再医疗设备分机104上显示的数据。
持和拓展。该数据同步方法对实施人员无计算机水平硬性要求,会常规操作电脑和文档即
可。在一定程度上也降低了实施人员的招聘难度。可以实现但不限于如下技术效果:(1)提
高适配性,减少可重复工作量,提高工作效率;(2)实现多类型HIS数据互通,打通数据壁垒;
(3)减少现场维护难度,降低维护人员门槛。从而解决了现有医院信息系统数据同步时每个
应用场景单独实施,操作繁琐、易用性差,以及不方便扩展、配置脚本复杂,无法零基础配置
的问题。
据字典中的每个字段对应唯一的键值;确定单元,用于确定一个或多个目标字段的键值与
相应源字段之间的关联关系,源字段是查找到的目标字段对应的源字段;同步单元,用于基
于关联关系,将源数据库中与一个或多个目标字段对应的源字段的数据同步到目标数据库
中。
施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。
这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。
专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现
不应认为超出本发明的范围。
替换、改进等,均应包含在本申请的权利要求范围之内。