基于大数据和核心算法的患者诊疗过程预警系统及方法转让专利

申请号 : CN202210649378.9

文献号 : CN115036031B

文献日 : 2022-12-23

基于大数据的患者诊疗过程预警系统，包括数据收集模块、疾病谱数据库、数据管理模块、数据监控模块和预警模块，数据收集模块用于将收集的历史疾病诊疗数据传输至疾病谱数据库进行存储，数据管理模块用于调取疾病谱数据库中的历史疾病诊疗数据进行预处理和聚类处理，并将聚类所得的类集合分别存储于数据监控模块，数据监控模块用于对待检测患者的疾病诊疗数据进行监控，当发现存在异常时令预警模块进行预警。本发明采用信息化手段对医院患者疾病数据进行分析，并结合医保分值等数据构建有医院特色的《疾病谱数据库》，能够为医院管理提供更好的数据支持，从而通过信息化手段在病人的诊疗过程中进行核对与查询，实现患者诊疗过程的实时预警。

1.基于大数据和核心算法的患者诊疗过程预警系统，其特征在于，包括数据收集模块、疾病谱数据库、数据管理模块、数据监控模块和预警模块，数据收集模块用于收集病患的历史疾病诊疗数据，并将收集的历史疾病诊疗数据传输至疾病谱数据库进行存储，数据管理模块在监测到疾病谱数据库接收到新的历史疾病诊疗数据时，调取疾病谱数据库中存储的历史疾病诊疗数据进行预处理和聚类处理，并将聚类所得的类集合分别存储于数据监控模块，数据监控模块将待检测患者的疾病诊疗数据和其当前存储的各类集合中的历史疾病诊疗数据进行相似检测，当发现待检测患者的疾病诊疗数据存在异常时令预警模块进行预警；数据管理模块对调取的历史疾病诊疗数据进行量化和归一化处理后，采用FCM聚类算法对预处理后的历史疾病诊疗数据进行聚类处理，并采用人工蜂群算法确定所述FCM聚类算法的初始聚类中心；数据管理模块采用改进的人工蜂群算法确定FCM聚类算法的初始聚类中心，在跟随蜂阶段，按照下列方式计算每个蜜源被跟随蜂选择的概率：首先将当前蜜源按其适应度函数值由高到低进行排序组成序列L，依次计算序列L中每个蜜源被跟随蜂选择的概率，设Xi表示序列L中的第i个蜜源的位置，Pi表示序列L中的第i个蜜源被跟随蜂选择的概率，则Pi的值为：式中，Fiti表示序列L中的第i个蜜源的适应度函数值，SN表示当前的蜜源数，Ki表示序列L中的第i个蜜源的区域惩罚因子，且Ki的值为：当i＝1时，则Ki＝0，当i>1时，则其中，di表示序列L中的第i个蜜源的序列距离值，且其中，Xi‑1表示序列L中的第(i‑1)个蜜源的位置，表示序列L中的蜜

源的序列截断阈值，且的值取：其中，表示序列

L中的蜜源的序列距离值的均值，且表示序列L中的蜜源的序列距离值

的均方差，且 dk表示序列L中的第k个蜜源的序列距离值，且dk＝|Xk‑Xk‑1|，其中，Xk表示序列L中的第k个蜜源的位置，Xk‑1表示序列L中的第(k‑1)个蜜源的位置，t表示当前迭代次数，Tmax表示最大迭代次数；数据监控模块将待检测患者的疾病诊疗数据中的病种名称和病种治疗方式和其当前存储的各类集合中的历史疾病诊疗数据中的病种名称和病种治疗方式进行相似检测，选取最相似的类集合作为相似类集合，计算所述相似类集合中的历史疾病诊疗数据中的病种分值的均值，当待检测患者的疾病诊疗数据中的病种分值高于所述均值的值超出给定的阈值时，则判定待检测患者的疾病诊疗数据存在异常；

在人工蜂群算法中，设xj表示当前的第j个蜜源的位置，当对蜜源位置xj在进行了Gmax次搜索次数之后，蜜源位置xj的质量没有发生变化，则舍弃蜜源位置xj，与此同时，引领蜂转换为侦查蜂，并采用下列方式生成一个新的蜜源位置vj，其中，Gmax为给定的最大搜索次数：(1)对当前种群中的蜜源进行筛选，设A表示当前种群中的较优蜜源位置集合，表示当前蜜源适应度函数值的均值，xl表示当前的第l个蜜源的位置，fitl表示当前的第l个蜜源的适应度函数值，当第l个蜜源满足：时，则将xl加入到集合A中；

(2)侦查蜂采用下列方式生产新的蜜源位置vj：

vj＝xj+rand1(0,1)(xj‑xj1)+rand2(0,1)(xj‑xj2)上式中，vj为侦查蜂生成的新的第j个蜜源的位置，rand1(0,1)和rand2(0,1)分别为生成的0到1之间的随机数，xj1为侦查蜂生成新的第j个蜜源的位置的第一参考蜜源位置，xj1的值采用下列方式确定：侦查蜂在集合A中随机选取一个蜜源位置作为xj1，设为侦查蜂在集合A中随机选取的一个蜜源的位置，且表示集合A中的第a个蜜源的位置，则令xj2为侦查蜂生成新的第j个蜜源的位置的第二参考蜜源位置，xj2的值采用下列方式确定：设为蜜源位置的邻域蜜源位置集合，且

其中，xj,a,b表示集合中的第b个蜜源位置，D表示当前邻域截断值，且D的值为：其中，SN表示当前的蜜源数，Dl表示第l个蜜源的邻域截断值，且其中，e为给定的正整数，且e

定义表示蜜源位置的邻域寻优收益值，且的表达式为：

式中，表示蜜源位置xj,a,b和蜜源位置之间的比较系数，且

其中，表示蜜源位置对应的适应度函数值，

fitj,a,b表示蜜源位置xj,a,b对应的适应度函数值，表示蜜源位置的邻域修正系数，且的值为：其中，表示蜜源位置的邻域属性值，且的值为：为当前蜜源位置的邻域属性值的均值，且其中，Hl

表示蜜源位置xl的邻域属性值；

设Nj2表示第二参考蜜源位置xj2的候选蜜源位置集合，Dj2表示第二参考蜜源位置xj2的邻域截断值，且则其中，xj2,c表示集合Nj2中的第c个候选蜜源位置；

xj2为在集合Nj2中随机选取的一个蜜源位置，且

2.根据权利要求1所述的患者诊疗过程预警系统，其特征在于，所述疾病诊疗数据包括病种名称、病种治疗方式和病种分值。

3.一种患者诊疗过程预警方法，其特征在于使用权利要求1或2的系统进行患者诊疗过程预警。

基于大数据和核心算法的患者诊疗过程预警系统及方法

技术领域

[0001] 本发明创造涉及大数据领域，具体涉及一种基于大数据和核心算法的患者诊疗过程预警系统。

背景技术

[0002] 国家医保局于10月在71个统筹地区开展区域点数法总额预算和按病种分值付费试点(DIP)，将病种作为计点单位，用医疗服务点数进行结算。新的支付方式迫使医院必须加强内部精细化管理，采用信息化手段对医院患者疾病数据进行分析，并结合医保分值等数据，构建有医院特色的《疾病谱数据库》能够为医院管理提供更好的数据支持，从而通过信息化手段在病人全流程的诊疗过程中进行数据监控，实现对高套等行为进行报警，并且能够规范临床医生的诊疗行为，同时能够防止新的医保付费方式下给医院带来的损失。

发明内容

[0003] 针对上述问题，本发明旨在提供一种基于大数据和核心算法的患者诊疗过程预警系统。

[0004] 本发明创造的目的通过以下技术方案实现：

[0005] 基于大数据和核心算法的患者诊疗过程预警系统，包括数据收集模块、疾病谱数据库、数据管理模块、数据监控模块和预警模块，数据收集模块用于收集病患的历史疾病诊疗数据，并将收集的历史疾病诊疗数据传输至疾病谱数据库进行存储，数据管理模块在监测到疾病谱数据库接收到新的历史疾病诊疗数据时，调取疾病谱数据库中存储的历史疾病诊疗数据进行预处理和聚类处理，并将聚类所得的类集合分别存储于数据监控模块，数据监控模块将待检测患者的疾病诊疗数据和其当前存储的各类集合中的历史疾病诊疗数据进行相似检测，当发现待检测患者的疾病诊疗数据存在异常时令预警模块进行预警。

[0006] 进一步的，所述疾病诊疗数据包括病种名称、病种治疗方式和病种分值。

[0007] 进一步的，数据管理模块对调取的历史疾病诊疗数据进行量化和归一化处理后，采用FCM 聚类算法对预处理后的历史疾病诊疗数据进行聚类处理，并采用人工蜂群算法确定所述FCM 聚类算法的初始聚类中心。

[0008] 进一步的，数据管理模块采用改进的人工蜂群算法确定FCM聚类算法的初始聚类中心，在跟随蜂阶段，按照下列方式计算每个蜜源被跟随蜂选择的概率：

[0009] 首先将当前蜜源按其适应度函数值由高到低进行排序组成序列L，依次计算序列L中每个蜜源被跟随蜂选择的概率，设Xi表示序列L中的第i个蜜源的位置，Pi表示序列l中的第i个蜜源被跟随蜂选择的概率，则Pi的值为：

[0010]

[0011] 式中，Fiti表示序列L中的第i个蜜源的适应度函数值，SN表示当前的蜜源数，Ki表示序列 L中的第i个蜜源的区域惩罚因子，且Ki的值为：当i＝1时，则Ki＝0，当i>1时，则其中，di表示序列L中的第i个蜜源的序列距离值，且其中，Xi‑1表示序列L中的第(i‑1)个蜜源的位置，表示序列L中的蜜
源的序列截断阈值，且的值取：其中，表示序列
L中的蜜源的序列距离值的均值，且表示序列L中的蜜源的序列距离值
的均方差，且 dk表示序列L中的第k个蜜源的序列距离值，且dk＝|Xk‑Xk‑1|，其中，Xk表示序列L中的第k个蜜源的位置，Xk‑1表示序列L中的第(k‑1)个蜜源的位置，t 表示当前迭代次数，Tmax表示最大迭代次数。

[0012] 进一步的，在人工蜂群算法中，设xj表示当前的第j个蜜源的位置，当对蜜源位置xj在进行了Gmax次搜索次数之后，蜜源位置xj的质量没有发生变化，则舍弃蜜源位置xj，与此同时，引领蜂转换为侦查蜂，并采用下列方式生成一个新的蜜源位置vj，其中，Gmax为给定的最大搜索次数：

[0013] (1)对当前种群中的蜜源进行筛选，设A表示当前种群中的较优蜜源位置集合，表示当前蜜源适应度函数值的均值，xl表示当前的第l个蜜源的位置，fitl表示当前的第l个蜜源的适应度函数值，当第l个蜜源满足：时，则将xl加入到集合A中；

[0014] (2)侦查蜂采用下列方式生产新的蜜源位置vj：

[0015] vj＝xj+rand1(0,1)(xj‑xj1)+rand2(0,1)(xj‑xj2)

[0016] 上式中，vj为侦查蜂生成的新的第j个蜜源的位置，rand1(0,1)和rand2(0,1)分别为生成的0到1之间的随机数，xj1为侦查蜂生成新的第j个蜜源的位置的第一参考蜜源位置，xj1的值采用下列方式确定：

[0017] 侦查蜂在集合A中随机选取一个蜜源位置作为xj1，设为侦查蜂在集合A中随机选取的一个蜜源的位置，且表示集合A中的第a个蜜源的位置，则令

[0018] xj2为侦查蜂生成新的第j个蜜源的位置的第二参考蜜源位置，xj2的值采用下列方式确定：

[0019] 设为蜜源位置的邻域蜜源位置集合，且其中，xj,a,b表示集合中的第b个蜜源位置，D表示当前邻域截断值，且D的值为：其中，SN表示当前的蜜源数，Dl表示第l个蜜源的邻域截断值，且
其中，e为给定的正整数，且e

[0020] 定义表示蜜源位置的邻域寻优收益值，且的表达式为：

[0021]

[0022] 式中，表示蜜源位置xj,a,b和蜜源位置之间的比较系数，且其中，表示蜜源位置对应的适应度函数值，
fitj,a,b表示蜜源位置xj,a,b对应的适应度函数值，表示蜜源位置的邻域修正系数，且的值为：其中，表示蜜源位置的邻域属性值，且的值
为：为当前蜜源位置的邻域属性值的均值，且其中，Hl
表示蜜源位置xl的邻域属性值；

[0023] 设Nj2表示第二参考蜜源位置xj2的候选蜜源位置集合，Dj2表示第二参考蜜源位置xj2的邻域截断值，且则其中，xj2,c表示集合Nj2中的第c个候选蜜源位置；

[0024] xj2为在集合Nj2中随机选取的一个蜜源位置，且

[0025] 进一步的，数据监控模块将待检测患者的疾病诊疗数据中的病种名称和病种治疗方式和其当前存储的各类集合中的历史疾病诊疗数据中的病种名称和病种治疗方式进行相似检测，选取最相似的类集合作为相似类集合，计算所述相似类集合中的历史疾病诊疗数据中的病种分值的均值，当待检测患者的疾病诊疗数据中的病种分值高于所述均值的值超出给定的阈值时，则判定待检测患者的疾病诊疗数据存在异常。

[0026] 本发明创造的有益效果：采用信息化手段对医院患者疾病数据进行分析，并结合医保分值等数据构建有医院特色的《疾病谱数据库》，能够为医院管理提供更好的数据支持，从而通过信息化手段在病人全流程的诊疗过程中进行数据监控，实现对高套等行为进行报警，并且能够规范临床医生的诊疗行为，同时能够防止新的医保付费方式下给医院带来的损失。

附图说明

[0027] 利用附图对发明创造作进一步说明，但附图中的实施例不构成对本发明创造的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

[0028] 图1是本发明结构示意图。

具体实施方式

[0029] 结合以下实施例对本发明作进一步描述。

[0030] 参见图1，本实施例的基于大数据和核心算法的患者诊疗过程预警系统，包括数据收集模块、疾病谱数据库、数据管理模块、数据监控模块和预警模块，数据收集模块用于收集病患的历史疾病诊疗数据，并将收集的历史疾病诊疗数据传输至疾病谱数据库进行存储，数据管理模块在监测到疾病谱数据库接收到新的历史疾病诊疗数据时，调取疾病谱数据库中存储的历史疾病诊疗数据进行预处理和聚类处理，并将聚类所得的类集合分别存储于数据监控模块，数据监控模块将待检测患者的疾病诊疗数据和其当前存储的各类集合中的历史疾病诊疗数据进行相似检测，当发现待检测患者的疾病诊疗数据存在异常时令预警模块进行预警。

[0031] 优选的，所述疾病诊疗数据包括病种名称、病种治疗方式和病种分值。

[0032] 具体的，本实施例采用信息化手段对医院患者疾病数据进行分析，并结合医保分值等数据构建有医院特色的《疾病谱数据库》，能够为医院管理提供更好的数据支持，从而通过信息化手段在病人全流程的诊疗过程中进行数据监控，实现对高套等行为进行报警，并且能够规范临床医生的诊疗行为，同时能够防止新的医保付费方式下给医院带来的损失。

[0033] 优选的，数据管理模块对调取的历史疾病诊疗数据进行量化和归一化处理后，采用FCM 聚类算法对预处理后的历史疾病诊疗数据进行聚类处理，并采用人工蜂群算法确定所述FCM 聚类算法的初始聚类中心，定义人工蜂群算法的适应度函数为：

[0034]

[0035] 其中，J(U,V)为FCM聚类算法定义的目标函数，聚类效果越好，J(U,V)的值就越小，fit 的值也就越大。

[0036] 具体的，本实施例针对FCM聚类算法具有对初始聚类中心的选择依赖的缺陷，提出采用改进的人工蜂群算法来确定初始聚类中心，再利用FCM聚类算法对初始聚类中心进行优化，最后获得精度较高的聚类结果。

[0037] 优选的，数据管理模块采用改进的人工蜂群算法确定FCM聚类算法的初始聚类中心，在跟随蜂阶段，按照下列方式计算每个蜜源被跟随蜂选择的概率：

[0038] 首先将当前蜜源按其适应度函数值由高到低进行排序组成序列L，依次计算序列L中每个蜜源被跟随蜂选择的概率，设Xi表示序列L中的第i个蜜源的位置，Pi表示序列L中的第i个蜜源被跟随蜂选择的概率，则Pi的值为：

[0039]

[0040] 式中，Fiti表示序列L中的第i个蜜源的适应度函数值，SN表示当前的蜜源数，Ki表示序列 L中的第i个蜜源的区域惩罚因子，且Ki的值为：当i＝1时，则Ki＝0，当i>1时，则其中，di表示序列L中的第i个蜜源的序列距离值，且其中，Xi‑1表示序列L中的第(i‑1)个蜜源的位置，表示序列L中的蜜
源的序列截断阈值，且的值取：其中，表示序列
L中的蜜源的序列距离值的均值，且表示序列L中的蜜源的序列距离值
的均方差，且 dk表示序列L中的第k个蜜源的序列距离值，且dk＝|Xk‑Xk‑1|，其中，Xk表示序列L中的第k个蜜源的位置，Xk‑1表示序列L中的第(k‑1)个蜜源的位置，t 表示当前迭代次数，Tmax表示最大迭代次数。

[0041] 具体的，在人工蜂群的跟随蜂阶段，跟随蜂在了解了所有引领蜂提供的蜜源信息后会根据一定概率在这些蜜源中选择蜜源进行开采，其中，在标准人工蜂群算法中，跟随蜂通过适应度函数值来判断蜜源的优劣程度，适应度函数值越高，代表所述蜜源越优，其被跟随蜂选择的概率越高，当大部分跟随蜂都选择了较好的蜜源时，容易使得蜂群多样性变差，并且易陷入局部最优解，此外，该种概率计算方式使得跟随蜂很难选中较差的蜜源，但这些较差蜜源中仍可能含有有用的信息，抛弃它们会影响算法的全局收敛能力，针对上述缺陷，本实施例对传统的概率计算方式进行改进，将蜜源按照适应度函数值由高到低进行排序，即排序越往前，表明所述蜜源在所有蜜源中越有优势，而序列中相邻的两个蜜源在所有蜜源中占有相似的优势地位，因此，将蜜源和优于其的前一个蜜源进行检测，当所述蜜源和优于其的前一个蜜源的序列距离值较近时，就可以减小该蜜源被跟随蜂选择的概率，因为所述优于其的前一个蜜源已经可以保证吸引较多的跟随蜂对该局部区域的搜索，而减小该蜜源被跟随蜂选择的概率，可以避免过多的跟随蜂对该区域的重复搜索导致算法的收敛速度减慢，并且可以增加较差蜜源被跟随蜂选中的概率，使得蜜源被选择的概率更加均匀，可以保持蜜源集合的多样性，此外，在概率中引入迭代次数，可以保证到寻优后期，适应度函数值越高的蜜源被选择的概率越高，即提高算法的搜索精度，保证蜂群最后收敛到全局最优解。

[0042] 优选的，在人工蜂群算法中，设xj表示当前的第j个蜜源的位置，当对蜜源位置xj在进行了Gmax次搜索次数之后，蜜源位置xj的质量没有发生变化，则舍弃蜜源位置xj，与此同时，引领蜂转换为侦查蜂，并采用下列方式生成一个新的蜜源位置vj，其中，Gmax为给定的最大搜索次数：

[0043] (1)对当前种群中的蜜源进行筛选，设A表示当前种群中的较优蜜源位置集合，表示当前蜜源适应度函数值的均值，xl表示当前的第l个蜜源的位置，fitl表示当前的第l个蜜源的适应度函数值，当第l个蜜源满足：时，则将xl加入到集合A中；

[0044] (2)侦查蜂采用下列方式生产新的蜜源位置vj：

[0045] vj＝xj+rand1(0,1)(xj‑xj1)+rand2(0,1)(xj‑xj2)

[0046] 上式中，vj为侦查蜂生成的新的第j个蜜源的位置，rand1(0,1)和rand2(0,1)分别为生成的0到1之间的随机数，xj1为侦查蜂生成新的第j个蜜源的位置的第一参考蜜源位置，xj1的值采用下列方式确定：

[0047] 侦查蜂在集合A中随机选取一个蜜源位置作为xj1，设为侦查蜂在集合A中随机选取的一个蜜源的位置，且表示集合A中的第a个蜜源的位置，则令

[0048] xj2为侦查蜂生成新的第j个蜜源的位置的第二参考蜜源位置，xj2的值采用下列方式确定：

[0049] 设为蜜源位置的邻域蜜源位置集合，且其中，xj,a,b表示集合中的第b个蜜源位置，D表示当前邻域截断值，且D的值为：其中，Dl表示第l个蜜源的邻域截断值，且其中，e为给定的正
整数，且e

[0050] 定义表示蜜源位置的邻域寻优收益值，且的表达式为：

[0051]

[0052] 式中，表示蜜源位置xj,a,b和蜜源位置之间的比较系数，且其中，表示蜜源位置对应的适应度函数值，
fitj,a,b表示蜜源位置xj,a,b对应的适应度函数值，表示蜜源位置的邻域修正系数，且的值为：其中，表示蜜源位置的邻域属性值，且的值
为：为当前蜜源位置的邻域属性值的均值，且其中，Hl
表示蜜源位置xl的邻域属性值；

[0053] 设Nj2表示第二参考蜜源位置xj2的候选蜜源位置集合，Dj2表示第二参考蜜源位置xj2的邻域截断值，且则其中，xj2,c表示集合Nj2中的第c个候选蜜源位置；

[0054] xj2为在集合Nj2中随机选取的一个蜜源位置，且

[0055] 具体的，人工蜂群算法中侦查蜂的替换操作能够提高当前蜜源的多样性，有利于算法跳出局部最优，避免早熟，然而传统的人工蜂群算法其邻域搜索方式并没有采用任何对比信息，只是在某个蜜源周围随机选取一个蜜源位置进行更新，即侦查蜂的搜索过程会具有较大的盲目性，因此使得算法收敛速度和精度都不太理想，为了改善上述缺陷，本实施例设置侦查蜂在生成新的蜜源位置时，在当前较优蜜源中随机选取一个蜜源位置作为第一参考蜜源位置，从而保持算法的搜索多样性，第二参考蜜源位置用于对侦查蜂根据第一参考蜜源位置进行搜索的结果进行补充，定义的邻域寻优收益值反映了第一参考蜜源位置的邻域寻优收益性，此外，邻域修正系数引入了全局信息，使得计算所得的邻域寻优收益值能够在全局蜜源的基础上反映所述第一参考蜜源位置的邻域寻优收益性的好坏，当所述邻域寻优收益值越大，表明所述第一参考蜜源位置的邻域相较于全局获得了较好的寻优，此时为了避免重复寻优，在第一参考蜜源位置的邻域蜜源位置集合的基础上扩大第二参考蜜源位置的随机选取范围，从而提高蜜源的多样性，避免陷入局部最优，当所述邻域寻优收益值较小时，表明此时第一参考蜜源位置的邻域相较于全局还需要加强寻优，此时，在第一参考蜜源位置的邻域范围内随机选取第二参考蜜源位置，从而提高该区域的搜索精度。即本实施例通过随机选取的第一参考蜜源位置使得侦查蜂在更新蜜源时，保证蜜源的多样性，并通过选取的第二参考蜜源位置对第一参考蜜源位置的寻优结果进行调节，从而保证提高蜜源的多样性和搜索精度。

[0056] 优选的，数据监控模块将待检测患者的疾病诊疗数据中的病种名称和病种治疗方式和其当前存储的各类集合中的历史疾病诊疗数据中的病种名称和病种治疗方式进行相似检测，选取最相似的类集合作为相似类集合，计算所述相似类集合中的历史疾病诊疗数据中的病种分值的均值，当待检测患者的疾病诊疗数据中的病种分值高于所述均值的值超出给定的阈值时，则判定待检测患者的疾病诊疗数据存在异常。

[0057] 最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

基于大数据和核心算法的患者诊疗过程预警系统及方法转让专利

申请号 : CN202210649378.9

文献号 : CN115036031B

文献日 : 2022-12-23

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 徐昆

申请人 : 中晗控股集团有限公司

摘要 :

权利要求 :

说明书 :