数据同步的方法和装置转让专利

申请号 : CN201811522527.5

文献号 : CN109829012B

文献日 : 2021-03-12

本申请公开了一种数据同步的方法和装置，所述方法包括如下步骤：查找源数据库中与一个或多个目标字段对应的源字段，其中，一个或多个目标字段为目标数据库的数据字典中的一个或多个字段，目标数据库的数据字典中的每个字段对应唯一的键值；确定一个或多个目标字段的键值与相应源字段之间的关联关系，源字段是查找到的目标字段对应的源字段；基于关联关系，将源数据库中与一个或多个目标字段对应的源字段的数据同步到目标数据库中。本申请实现了一种可兼容各种异构信息系统的数据同步方式，提高了现场实施人员的工作效率。

1.一种数据同步的方法，其特征在于，所述方法包括如下步骤：查找源数据库中与一个或多个目标字段对应的源字段，其中，所述一个或多个目标字段为目标数据库的数据字典中的一个或多个字段，所述目标数据库的数据字典中的每个字段对应唯一的键值；

确定所述一个或多个目标字段的键值与相应源字段之间的关联关系，所述源字段是查找到的所述目标字段对应的源字段；

基于所述关联关系，将所述源数据库中与所述一个或多个目标字段对应的源字段的数据同步到所述目标数据库中；

在确定目标数据库中待同步数据对应的目标字段之前，所述方法还包括：配置所述目标数据库的数据字典，所述目标数据库的数据字典中包含至少一个字段，每个字段具有不同的含义且使用唯一的键值进行唯一标识；

配置所述目标数据库的数据字典，包括：获取源数据库的字段；

在所述目标数据库中未查找到与所述源数据库的字段对应的目标字段情况下，将所述源数据库的字段添加到所述目标数据库的数据字典中，并为所述源数据库的字段设置唯一的键值；

查找源数据库中与所述目标字段对应的源字段，包括：获取目标字段的数据特征向量，以及所述源数据库中源字段的数据特征向量，所述目标字段的数据特征向量和所述源字段的数据特征向量均为多维向量；

计算所述目标字段的数据特征向量和所述源字段的数据特征向量的加权欧式距离；

将欧式距离最小的源字段确定为所述源数据库中与所述目标字段对应的源字段；

所述源数据库为医院内各种信息系统的数据库；

在同步数据时，将医院信息系统的数据读取到临时表中，并根据历史数据源说明文档将临时键值写入临时表中，比对临时表中的临时键值是否等于医疗设备主机的数据库对应的预先配置的数据字典中字段的唯一键值，只有完全相等的情况下，将该临时键值对应的字段的数据写入医疗设备主机的数据库中。

2.根据权利要求1所述的数据同步的方法，其特征在于，配置所述目标数据库的数据字典，包括：

配置所述目标数据库的数据字典中每个字段的如下至少一种属性：是否来自源数据库、源数据库的标识、是否显示字段、字段类型。

3.根据权利要求1所述的数据同步的方法，其特征在于，查找源数据库中与所述目标字段对应的源字段，包括：

获取目标字段的目标字段名，以及源字段的源字段名；

采用逆向最大匹配算法对所述目标字段名和所述源字段名分别进行分词处理，得到所述目标字段名和所述源字段名对应的多个特征词；其中，每个特征词对应一个文本特征项；

计算所述目标字段名与所述源字段名的相似度；

将相似度大于阈值的源字段名对应的源字段作为与所述目标字段对应的源字段；

将每个目标字段对应的源字段的源字段名添加到每个目标字段对应的字段名称库中，其中，每个目标字段对应的字段名称库中包含所述目标字段对应的多个字段名，所述多个字段名具有相同的键值，所述每个目标字段对应的字段名称库用于所述目标数据库同步其他的源数据库中的数据；

其中，计算所述目标字段名与所述源字段名的相似度的公式为：其中，

Ftarget＝(ftarget,1,ftarget,2,…,ftarget,k,…ftarget,N)；

Foriginal＝(foriginal,1,foriginal,2,…,foriginal,k,…foriginal,N)；

其中，Sim(Ftarget,Foriginal)表示目标字段名与源字段名的相似度；Ftarget表示目标字段名对应的文本向量，ftarget,k表示目标字段名对应的第k个文本特征项，wtarget,k表示目标字段名对应的第k个文本特征项ftarget,k的权重；Foriginal表示源字段名对应的文本向量，foriginal,k表示源字段名对应的第k个文本特征项，woriginal,k表示源字段名对应的第k个文本特征项foriginal,k的权重；N表示从所述目标字段名或源字段名中提取的文本特征项的最大数量。

4.根据权利要求1所述的数据同步的方法，其特征在于，所述加权欧式距离的公式为：其中，

Xtarget＝(xtarget,1,xtarget,2,…,xtarget,k,…xtarget,M)；

Xoriginal＝(xoriginal,1,xoriginal,2,…,xoriginal,k,…xoriginal,N)；

其中，Distance(dtarget,j,doriginal,j)表示目标字段的数据特征向量与源字段的数据特征向量之间的欧式距离；Xtarget表示目标字段的数据特征向量，dtarget,j表示目标字段的第j个数据特征；Xoriginal表示源字段的数据特征向量，doriginal,j表示源字段的第j个数据特征；

Sj表示方差；M表示从所述目标字段名或源字段名中提取的数据特征的最大数量。

5.根据权利要求1所述的数据同步的方法，其特征在于，在基于所述关联关系，将所述源数据库中与所述目标字段对应的源字段的数据同步到所述目标数据库中之后，所述方法还包括：

获取所述目标数据库中待显示的至少一个字段；

输出所述目标数据库中待显示的至少一个字段的数据。

6.根据权利要求1所述的数据同步的方法，其特征在于，基于所述关联关系，将所述源数据库中与所述目标字段对应的源字段的数据同步到所述目标数据库中，包括：所述源数据库通过如下任意一种或多种方式向所述目标数据库提供与所述目标字段对应的源字段的数据：视图、Web服务、集成平台。

7.一种数据同步的装置，其特征在于，所述装置包括：查找单元，用于查找源数据库中与一个或多个目标字段对应的源字段，其中，所述一个或多个目标字段为目标数据库的数据字典中的一个或多个字段，所述目标数据库的数据字典中的每个字段对应唯一的键值；获取目标字段的数据特征向量，以及所述源数据库中源字段的数据特征向量，所述目标字段的数据特征向量和所述源字段的数据特征向量均为多维向量；计算所述目标字段的数据特征向量和所述源字段的数据特征向量的加权欧式距离；将欧式距离最小的源字段确定为所述源数据库中与所述目标字段对应的源字段；所述源数据库为医院内各种信息系统的数据库；配置所述目标数据库的数据字典，所述目标数据库的数据字典中包含至少一个字段，每个字段具有不同的含义且使用唯一的键值进行唯一标识；获取源数据库的字段；在所述目标数据库中未查找到与所述源数据库的字段对应的目标字段情况下，将所述源数据库的字段添加到所述目标数据库的数据字典中，并为所述源数据库的字段设置唯一的键值；

确定单元，用于确定所述一个或多个目标字段的键值与相应源字段之间的关联关系，所述源字段是查找到的所述目标字段对应的源字段；

同步单元，用于基于所述关联关系，将所述源数据库中与所述一个或多个目标字段对应的源字段的数据同步到所述目标数据库中；在同步数据时，将医院信息系统的数据读取到临时表中，并根据历史数据源说明文档将临时键值写入临时表中，比对临时表中的临时键值是否等于医疗设备主机的数据库对应的预先配置的数据字典中字段的唯一键值，只有完全相等的情况下，将该临时键值对应的字段的数据写入医疗设备主机的数据库中。

数据同步的方法和装置

技术领域

[0001] 本申请涉及软件领域，尤其涉及一种数据同步的方法和装置。

背景技术

[0002] 医疗信息系统(hospital Information System，HIS)是现代化医院运营的必要技术支撑和基础设施。为了提供更好的医疗服务，随着计算机互联网的发展，医院引进了很多
现代化医疗设备。这些现代化医疗设备需要与医院的医疗信息系统对接，以获取一些基本
的医疗信息。但是，由于不同医院的医疗信息系统，采用的数据库技术不同，导致这些现代
化医疗设备与不同医院的医疗信息系统对接的时候，对现场实施人员的门槛要求比较高。
一般需要具有一定数据库知识储备和代码能力的现场实施人员，现场编写相应的脚本代码
来读取医院信息系统的数据。这种数据同步方式，大大影响了工作效率。

发明内容

[0003] 为了解决上述问题，本申请提出了一种数据同步的方法，方法包括如下步骤：查找源数据库中与一个或多个目标字段对应的源字段，其中，一个或多个目标字段为目标数据
库的数据字典中的一个或多个字段，目标数据库的数据字典中的每个字段对应唯一的键
值；确定一个或多个目标字段的键值与相应源字段之间的关联关系，源字段是查找到的目
标字段对应的源字段；基于关联关系，将源数据库中与一个或多个目标字段对应的源字段
的数据同步到目标数据库中。

[0004] 在一个示例中，在确定目标数据库中待同步数据对应的目标字段之前，方法还包括：配置目标数据库的数据字典，目标数据库的数据字典中包含至少一个字段，每个字段具
有不同的含义且使用唯一的键值进行唯一标识。

[0005] 在一个示例中，配置目标数据库的数据字典，包括：获取源数据库的字段；在目标数据库中未查找到与源数据库的字段对应的目标字段情况下，将源数据库的字段添加到目
标数据库的数据字典中，并为源数据库的字段设置唯一的键值。

[0006] 在一个示例中，配置目标数据库的数据字典，包括：配置目标数据库的数据字典中每个字段的如下至少一种属性：是否来自源数据库、源数据库的标识、是否显示字段、字段
类型。

[0007] 在一个示例中，查找源数据库中与目标字段对应的源字段，包括：获取目标字段的目标字段名，以及源字段的源字段名；计算目标字段名与源字段名的相似度；将相似度大于
阈值的源字段名对应的源字段作为与目标字段对应的源字段；其中，计算目标字段名与源
字段名的相似度的公式为：

[0008]

[0009] 其中，

[0010] Ftarget＝(ftarget,1,ftarget,2,…,ftarget,k,…ftarget,N)；

[0011] Foriginal＝(foriginal,1,foriginal,2,…,foriginal,k,…foriginal,N)；

[0012] 其中，Sim(Ftarget,Foriginal)表示目标字段名与源字段名的相似度；Ftarget表示目标字段名对应的文本向量，ftarget,k表示目标字段名对应的第k个文本特征项，wtarget,k表示目
标字段名对应的第k个文本特征项ftarget,k的权重；Foriginal表示源字段名对应的文本向量，
foriginal,k表示源字段名对应的第k个文本特征项，woriginal,k表示源字段名对应的第k个文本
特征项foriginal,k的权重；N表示从目标字段名或源字段名中提取的文本特征项的最大数量。

[0013] 在一个示例中，在计算目标字段名与源字段名的相似度之前，方法还包括：采用逆向最大匹配算法对目标字段名和源字段名分别进行分词处理，得到目标字段名和源字段名
对应的多个特征词；其中，每个特征词对应一个文本特征项。

[0014] 在一个示例中，在将相似度大于阈值的源字段名对应的源字段作为与目标字段对应的源字段之后，方法还包括：将每个目标字段对应的源字段的源字段名添加到每个目标
字段对应的字段名称库中，其中，每个目标字段对应的字段名称库中包含目标字段对应的
多个字段名，多个字段名具有相同的键值；其中，每个目标字段对应的字段名称库用于目标
数据库同步其他的源数据库中的数据。

[0015] 在一个示例中，查找源数据库中与目标字段对应的源字段，包括：获取目标字段的数据特征向量，以及源数据库中源字段的数据特征向量，目标字段的数据特征向量和源字
段的数据特征向量均为多维向量；计算目标字段的数据特征向量和源字段的数据特征向量
的加权欧式距离；将欧式距离最小的源字段确定为源数据库中与目标字段对应的源字段；
其中，加权欧式距离的公式为：

[0016]

[0017] 其中，

[0018] Xtarget＝(xtarget,1,xtarget,2,…,xtarget,k,…xtarget,M)；

[0019] Xoriginal＝(xoriginal,1,xoriginal,2,…,xoriginal,k,…xoriginal,N)；

[0020] 其中，Distance(dtarget,j,doriginal,j)表示目标字段的数据特征向量与源字段的数据特征向量之间的欧式距离；Xtarget表示目标字段的数据特征向量，dtarget,j表示目标字段的
第j个数据特征；Xoriginal表示源字段的数据特征向量，doriginal,j表示源字段的第j个数据特
征；Sj表示方差；M表示从目标字段名或源字段名中提取的数据特征的最大数量。

[0021] 在一个示例中，在基于关联关系，将源数据库中与目标字段对应的源字段的数据同步到目标数据库中之后，方法还包括：获取目标数据库中待显示的至少一个字段；输出目
标数据库中待显示的至少一个字段的数据。

[0022] 在一个示例中，基于关联关系，将源数据库中与目标字段对应的源字段的数据同步到目标数据库中，包括：源数据库通过如下任意一种或多种方式向目标数据库提供与目
标字段对应的源字段的数据：视图、Web服务、集成平台。

[0023] 在一个示例中，源数据库为医院内各种信息系统的数据库。

[0024] 另一方面，本申请还提出了一种数据同步的装置，装置：查找单元，用于查找源数据库中与一个或多个目标字段对应的源字段，其中，一个或多个目标字段为目标数据库的
数据字典中的一个或多个字段，目标数据库的数据字典中的每个字段对应唯一的键值；确
定单元，用于确定一个或多个目标字段的键值与相应源字段之间的关联关系，源字段是查
找到的目标字段对应的源字段；同步单元，用于基于关联关系，将源数据库中与一个或多个
目标字段对应的源字段的数据同步到目标数据库中。

[0025] 通过本申请提出数据同步方式能够带来如下有益效果：

[0026] 1.基于预先配置的通用数据字典(即目标数据库的数据字典)，可以提供一种可兼容各种异构信息系统的数据同步方式，以医院信息系统为例，可以实现根据不同医院的需
求，实现目标数据库与不同厂商医院信息系统的数据同步，以获取相应的医疗数据，实现了
不同厂商医院信息系统的互通，提高现场实施人员的实施效率；

[0027] 2.目标数据库的数据字典可以重复使用，为后期医疗设备维护提供的较好的支持和扩展。

[0028] 3.减少了现场维护难度，降低了现场实施人员的门槛要求。

附图说明

[0029] 此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

[0030] 图1为本申请实施例提供的一种医院信息数据的同步系统示意图；

[0031] 图2为本申请实施例提供的一种数据同步方法流程图。

具体实施方式

[0032] 为了更清楚的阐释本申请的整体构思，下面结合说明书附图以示例的方式进行详细说明。

[0033] 不同的医院信息系统，由于采用不同的异构软、硬件平台，构成了异构数据源。随着各种现代化医疗设备在医院的普及，为了实现现代化医疗设备与医院信息系统的数据同
步处理，需要这些医疗设备的现场实施人员在部署时现场编写SQL(Structured Query
Language，结构化查询语言)脚本来读取HIS数据，导致医疗设备与医院信息系统之间的数
据同步配置工作需要较长的时间，且需要现场实施人员有一定的数据库知识储备和代码能
力，要求现场实施人员的门槛极高。在人手不充足的情况下，多个医院同时部署，会导致配
置效率低下。

[0034] 另外，如果多个医院同时部署，现场实施人员需要一个医院接着一个医院进行部署，效率极低，较大时间花费在了等待了，造成了人力和财力的浪费。

[0035] 为了解决现有医疗设备与医院信息系统之间进行数据同步时，现场实施难度高、效率低下的问题。本申请提供了一种兼容对接各种厂商HIS的方法，在医疗设备等产品出厂
时，内置一份字段配置表的数据字典，现场实施人员只需要根据医院要求，设置出厂内置的
数据字典中哪些字段需要显示即可。在配置好字段以后，针对不同厂商HIS的数据库，选择
相应的数据源(包括但不限于(例如，DB2、ORACLE、SQL SEVER等数据库)匹配连接，以读取相
应的HIS数据，并基于预先配置的字段以及字段反射和映射机制，将相应的HIS数据同步到
本地数据库。

[0036] 例如，图1为本申请实施例提供的一种医院信息数据的同步系统示意图，如图1所示，该系统包括：医院信息系统101、医疗设备主机102、至少一个医疗设备分机104，其中，医
疗设备主机102与医疗设备分机之间通过局域网103连接。

[0037] 其中，医院信息系统101向医疗设备主机102提供数据的方式可以是视图，也可以是Web service。

[0038] 在部署医疗设备的时候，现场实施人员可以根据医院的需求(例如，医院护理部或护理单元护士长提出的要求)，确定待同步数据的字段，医院信息系统的厂商一般会提供一
份HIS数据源的说明文档，该说明文档中包含了HIS数据源的字段含义。

[0039] 在同步数据时，需要先将医院信息系统101的数据读取到一个中间表(临时表)中，导入中间表的时候可以通过SQL语句实现。基于HIS厂商提供的数据源的说明文档，现场实
施人员只需要通过修改SQL语句将医院信息系统101上的数据读取到医疗设备主机102的本
地数据库的临时表中，在写入临时表中时，根据历史数据源说明文档将一个临时的键值
(Key值)写入临时表中。然后执行同步比对程序。比对临时表中的临时Key值是否等于医疗
设备主机的数据库对应的预先配置的数据字典中字段的唯一Key值，只有完全相等的情况
下，将该临时Key值对应的字段的数据写入医疗设备主机102的数据库中。当待同步数据的
全部字段都比对完成后，医疗设备主机102执行下发操作，将同步的数据显示到各个医疗设
备分机104中。

[0040] 容易注意的是，每个医院可以根据实际展示效果，确定哪些字段显示，哪些字段不显示。

[0041] 在上述应用场景下，本申请的实施例公开了一种数据同步的方法，如图2所示，包括如下步骤：

[0042] 步骤S201，配置目标数据库的数据字典，目标数据库的数据字典中包含至少一个字段，每个字段具有不同的含义且使用唯一的键值进行唯一标识。

[0043] 作为一种可选的实施例，上述目标数据库可以是与医院信息系统进行数据同步的任意一种设备，例如，医院内为医护人员或患者提供服务的各种医疗设备。可选地，该医疗
设备包括主机和多个分机。通过主机来向各个分机下发相应的数据。由此，现场实施人员只
需要在部署医疗设备主机的时候，对医疗设备主机的数据库进行数据同步配置即可。

[0044] 具体地，上述数据字典可以预先配置的一个包含多个字段的数据库说明文档，该数据字典中，为每个字段设置唯一的键值。

[0045] 例如，表1为目标数据库(医疗设备的数据库)的数据字典。在目标数据库的数据字典中，为每个字段设置唯一的键值，以便通过每个键值同步源数据库中相应字段的数据。

[0046] 表1目标数据库的数据字典

[0047]序号键值字段名是否显示是否来自HIS系统字段类型
1 P1 过敏 1 1 过敏
2 P2 饮食 1 1 饮食
3 P3 手术时间 1 1 扩展
4 P4 诊断 1 1 扩展
5 P5 陪护 0 1 扩展
6 P6 隔离 0 1 预警
7 P7 防压疮 1 1 预警
8 P8 防坠床 1 1 预警
9 P9 防跌倒 1 1 预警
10 P10 记出入量 1 1 预警
11 P11 病情 1 1 扩展
12 P12 余额 1 1 余额
13 P13 已缴费金额 0 1 扩展
14 P14 已支付金额 0 1 扩展
15 P15 绝对卧床 1 1 预警
16 P16 心率监测 1 1 预警
17 P17 VTE 1 1 预警
18 P18 重点观察 1 1 预警
19 P19 小心烫伤 1 1 预警
20 P20 防导管滑脱 1 1 预警
21 P21 二维码 0 1 二维码
22 P22 费别 1 1 扩展
23 PATIENT_ID 患者ID 1 1 基础
24 INP_NO 住院号 1 1 基础
25 NURSE_LEVEL 护理等级 1 1 基础
26 IN_FQCY 住院次数 1 1 基础
27 PATIENT_NAME 病人姓名 1 1 基础
28 PATIENT_SEX 性别 1 1 基础
29 PATIENT_BIRTHDAY 生日 1 1 基础
30 DOCTOR 主治医生 1 1 基础
31 NURSE 责任护士 1 1 基础
32 IN_TIME 入院时间 1 1 基础
33 PAT_AGE 年龄 1 1 基础

[0048] 可选地，如表1所示，在配置目标数据库的数据字典的时候，还可以配置目标数据库的数据字典中每个字段的如下至少一种属性：是否来自源数据库、源数据库的标识、是否
显示字段、字段类型；其中，源数据库的标识可以是但不限于医院信息系统HIS、实验室信息
系统LIS、医学影像存档与通讯系统PACS等；字段类型包括如下至少之一：基础字段、扩展字
段和预警字段。其中，基础字段可以是构成目标数据库的基础的字段；扩展字段可以是在基
础字段的基础上扩展出来的字段；预警字段可以是用于提示预警信息的字段。可选地，还可
以是余额、二维码等其他特殊类型的字段。

[0049] 需要说明的是，预先配置的数据字典中的字段，可以是开发人员预先设定的，也可以是根据待同步数据的源数据库(例如，医院信息系统)中的字段配置的。在根据源数据库
的字段配置数据字典的时候，具体步骤为：获取源数据库的字段；在目标数据库中未查找到
与源数据库的字段对应的目标字段情况下，将源数据库的字段添加到目标数据库的数据字
典中，并为源数据库的字段设置唯一的键值。

[0050] 容易注意的是，不同的源数据库中，对于同一字段的设置的字段名可能存在差异，例如，A医院对患者的住院号的字段命名为“患者ID”、B医院对患者的住院号的字段命名为
“病人ID”、C医院对患者的住院号的字段命名为“患者号码”、D医院对患者的住院号的字段
命名为“病人号码”。为了兼容不同厂商的HIS系统，本申请通过字段的唯一键值来标识每个
字段，可以起到唯一标识的作用。

[0051] 步骤S202，接收用户指令，其中，所述用户指令用于从目标数据库的数据字典中选择一个或多个目标字段。

[0052] 具体地，用户(设备现场实施人员)可以根据每个医院的需求，确定医疗设备的数据库(即目标数据库)中需要待同步数据的一个或多个字段，目标数据库的数据字典中的每
个字段对应唯一的键值。

[0053] 步骤S203，查找源数据库中与一个或多个目标字段对应的源字段。

[0054] 可选地，上述源数据库为医院内各种信息系统的数据库。在根据每个医院的需求，确定待同步数据的一个或多个字段后，基于每个字段的唯一键值，从医院信息系统中查找
对应的源字段(即源数据库中的字段)。

[0055] 需要说明的是，在查找源数据库中与目标字段对应的源字段的时候，可以根据每个字段的字段名来进行查找，也可以根据每个字段对应的字段值的数据特征来进行查找。

[0056] 作为第一种可选的实施方式，基于每个字段的字段名，采用自然语言识别技术，来查找源数据库中与目标字段对应的字段，具体包括：获取目标字段的目标字段名，以及源字
段的源字段名；计算目标字段名与源字段名的相似度；将相似度大于阈值的源字段名对应
的源字段作为与目标字段对应的源字段；其中，计算目标字段名与源字段名的相似度的公
式为：

[0057]

[0058] 其中，

[0059] Ftarget＝(ftarget,1,ftarget,2,…,ftarget,k,…ftarget,N)；

[0060] Foriginal＝(foriginal,1,foriginal,2,…,foriginal,k,…foriginal,N)；

[0061] 其中，Sim(Ftarget,Foriginal)表示目标字段名与源字段名的相似度；Ftarget表示目标字段名对应的文本向量，ftarget,k表示目标字段名对应的第k个文本特征项，wtarget,k表示目
标字段名对应的第k个文本特征项ftarget,k的权重；Foriginal表示源字段名对应的文本向量，
foriginal,k表示源字段名对应的第k个文本特征项，woriginal,k表示源字段名对应的第k个文本
特征项foriginal,k的权重；N表示从目标字段名或源字段名中提取的文本特征项的最大数量。

[0062] 可选地，在计算目标字段名与源字段名的相似度之前，还可以采用逆向最大匹配算法对目标字段名和源字段名分别进行分词处理，得到目标字段名和源字段名对应的多个
特征词；其中，每个特征词对应一个文本特征项。

[0063] 需要说明的是，在将相似度大于阈值的源字段名对应的源字段作为与目标字段对应的源字段之后，还可以将每个目标字段对应的源字段的源字段名添加到每个目标字段对
应的字段名称库中，其中，每个目标字段对应的字段名称库中包含目标字段对应的多个字
段名，多个字段名具有相同的键值；其中，每个目标字段对应的字段名称库用于目标数据库
同步其他的源数据库中的数据。将源数据库中，未在目标数据库的数据字典中查找到的字
段，添加到目标数据库的数据字典中，可以丰富目标数据库的数据字典中包含的字段，以便
兼容更多厂商的HIS系统。

[0064] 通过上述第一种方式，采用自然语言识别技术，实现了自动根据字段名来查找源数据库中与目标字段对应的字段，无需人为配置，降低了现场实施难度。

[0065] 作为第二种可选的实施方式，基于每个字段的字段值的数据特征，在查找源数据库中与目标字段对应的源字段的时候，可以获取目标字段的数据特征向量，以及源数据库
中源字段的数据特征向量，目标字段的数据特征向量和源字段的数据特征向量均为多维向
量；计算目标字段的数据特征向量和源字段的数据特征向量的加权欧式距离；将欧式距离
最小的源字段确定为源数据库中与目标字段对应的源字段；其中，加权欧式距离的公式为：

[0066]

[0067] 其中，

[0068] Xtarget＝(xtarget,1,xtarget,2,…,xtarget,k,…xtarget,M)；

[0069] Xoriginal＝(xoriginal,1,xoriginal,2,…,xoriginal,k,…xoriginal,N)；

[0070] 其中，Distance(dtarget,j,doriginal,j)表示目标字段的数据特征向量与源字段的数据特征向量之间的欧式距离；Xtarget表示目标字段的数据特征向量，dtarget,j表示目标字段的
第j个数据特征；Xoriginal表示源字段的数据特征向量，doriginal,j表示源字段的第j个数据特
征；Sj表示方差；M表示从目标字段名或源字段名中提取的数据特征的最大数量。

[0071] 通过上述第二种实施方式，实现了根据每个字段的数据特征来进行查找的目的，避免了两个数据库中，由于同一字段的命名差异较大，而导致为同一字段设置两个键值的
情况发生。例如，A医院的“患者ID”与D医院的“病人号码”，如果仅通过自然语言技术，根据
字段名来查找的时候，容易识别为两个字段，即为A医院对患者的住院号的字段设置一个键
值，为B医院对患者的住院号的字段设置另一个键值。

[0072] 步骤S204，确定一个或多个目标字段的键值与相应源字段之间的关联关系。

[0073] 具体地，在源数据库(医院信息系统的数据库)中查找到与目标字段(待同步数据的一个或多个字段)对应的字段后，可以将目标字段的键值与查找到的字段关联，以便通过
目标字段的键值，将查找到的字段的数据同步到目标数据库中。

[0074] 步骤S205，基于关联关系，将源数据库中与一个或多个目标字段对应的源字段的数据同步到目标数据库中。

[0075] 具体地，将目标字段的键值与查找到的源数据库中对应的字段关联后，可以基于该关联关系，将源数据库中与目标字段对应的源字段的数据同步到目标数据库中。容易注
意的是，源数据库可以通过如下任意一种或多种方式向目标数据库提供与目标字段对应的
源字段的数据：视图、Web服务、集成平台。

[0076] 步骤S206，获取目标数据库中待显示的至少一个字段。

[0077] 具体地，在将根据医院需求确定的目标字段对应的源数据库的数据同步到目标数据库后，医院可以确定每个字段是否显示。

[0078] 步骤S207，输出目标数据库中待显示的至少一个字段的数据。

[0079] 具体地，根据医院确定的需要显示的字段，显示目标数据库中对应字段的数据。例如，图1中，医疗设备主机102在将医院信息系统101的数据同步到本地数据库(即目标数据
库)后，还可以进一步确定每个医疗设备分机104上显示的字段，隐藏掉一些只在医护设备
主机102显示，而不想再医疗设备分机104上显示的数据。

[0080] 通过本申请提供的数据同步的方法，较大提高实施速度和成功率，减少院方等待时间，较快应用产品。且配置表可重复利用，减少浪费。后期对院方维护也提供了较好的支
持和拓展。该数据同步方法对实施人员无计算机水平硬性要求，会常规操作电脑和文档即
可。在一定程度上也降低了实施人员的招聘难度。可以实现但不限于如下技术效果：(1)提
高适配性，减少可重复工作量，提高工作效率；(2)实现多类型HIS数据互通，打通数据壁垒；
(3)减少现场维护难度，降低维护人员门槛。从而解决了现有医院信息系统数据同步时每个
应用场景单独实施，操作繁琐、易用性差，以及不方便扩展、配置脚本复杂，无法零基础配置
的问题。

[0081] 本申请还提出了一种数据同步的装置，该装置包括：查找单元、确定单元和同步单元。

[0082] 其中，查找单元，用于查找源数据库中与一个或多个目标字段对应的源字段，其中，一个或多个目标字段为目标数据库的数据字典中的一个或多个字段，目标数据库的数
据字典中的每个字段对应唯一的键值；确定单元，用于确定一个或多个目标字段的键值与
相应源字段之间的关联关系，源字段是查找到的目标字段对应的源字段；同步单元，用于基
于关联关系，将源数据库中与一个或多个目标字段对应的源字段的数据同步到目标数据库
中。

[0083] 本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实
施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例
的部分说明即可。

[0084] 专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬
件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。
这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。
专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现
不应认为超出本发明的范围。

[0085] 以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同
替换、改进等，均应包含在本申请的权利要求范围之内。

数据同步的方法和装置转让专利

申请号 : CN201811522527.5

文献号 : CN109829012B

文献日 : 2021-03-12

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 李佰超 , 李世健 , 王德山

申请人 : 山东亚华电子股份有限公司

摘要 :

权利要求 :

说明书 :