基于精准算法和大数据的医药知识快速学习系统及方法转让专利
申请号 : CN202210045933.7
文献号 : CN114064883B
文献日 : 2022-04-29
发明人 : 段小霞 , 吴嘉瑞 , 于言言 , 赵郑
申请人 : 北京融华汇投资管理有限公司
摘要 :
权利要求 :
1.一种基于精准算法和大数据的医药知识快速学习系统,其特征在于,包括以下部分:用户终端(10)和医药知识服务器(20),所述医药知识服务器(20)包括:大数据对接组件(201)、数据整理组件(202)、用户接口组件(203)、实时检测组件(204)、数据处理组件(205)、数据分析组件(206)、指令响应组件(207)和医药知识库(208);
所述数据整理组件(202)用于对医药知识图谱中的所有医药知识进行整理、分析,挖掘医药知识中的隐含关系,构建医药知识词典,所述指令响应组件(207)用于根据第一触发指令和第二触发指令中所述医药知识库(208)中寻找相应的医药知识点,并根据每个药物知识及其连接通道得到关联性强的其他药物知识,将所有药物知识按照顺序汇集,得到当前用户的医药知识推荐集,所述指令响应组件(207)将医药知识推荐集通过数据连接的方式传输给所述用户接口组件(203)和所述医药知识库(208);
所述数据整理组件(202)具体包括:数据梳理单元(2021)、数据计算单元(2022)、格式规划单元(2023)、通道构建单元(2024),所述数据梳理单元(2021)用于将医药知识图谱中的所有医药知识形成不同知识维度的数据列,将整理后的数据通过数据传输的方式发送给所述数据计算单元(2022);所述数据计算单元(2022)用于计算每个药物在医药知识图谱中的重要性置信度和两个实体之间的关系置信度,将药物的重要性置信度和两个实体之间的关系置信度发送给所述通道构建单元(2024),并将关系置信度发送给所述格式规划单元(2023);所述格式规划单元(2023)用于将医药知识图谱中各药物节点之间的关系格式设置为三元组,将三元组通过数据连接的方式发送给所述通道构建单元(2024);所述通道构建单元(2024)用于在符合关系置信度阈值的药物之间设置关系连接通道,药物之间的连接通道权重决定了药物是否可以进行搭配学习,所述通道构建单元(2024)将药物三元组知识以及药物通道共同构成医药知识词典,将医药知识词典通过数据连接的方式发送给所述医药知识库(208);
所述数据计算单元(2022)计算每个药物在医药知识图谱中的重要性,用于表征药物的重要性置信度,所述重要性置信度的具体计算公式为:其中, 表示药物 在医药知识图谱中的重要性置信度,为医药知识图谱中节点继续扩展的概率, 和 分别为药物 在医药知识图谱中的入度和出度,表示药物 在医药知识图谱中的重要性置信度, , 表示药物种类;所述药物的富集程度是指药物用途广泛程度的量化;
所述数据计算单元(2022)还用于计算两个实体的关系置信度,所述关系置信度的表达式为:
其中, 表示实体 与实体 的关系置信度, 表示实体 与实体 在第d个知识维度下的相似度,即第d种关系的相似度, 为第d种关系的权重;
所述通道构建单元(2024)在符合关系置信度阈值的药物之间设置关系连接通道,通道的权重计算公式为:
药物之间的连接通道权重决定了药物是否可以进行搭配学习。
2.一种基于精准算法和大数据的医药知识快速学习系统的实现方法,其特征在于,包括以下步骤:
S1.获取医药知识图谱,对医药知识图谱中的所有医药知识进行整理、分析,挖掘医药知识中的隐含关系,构建医药知识词典;
所述医药知识词典的具体构建方法如下:首先将医药知识图谱中的所有医药知识形成不同知识维度的数据列,所述数据列即为不同的知识维度;将所有医药分类编码的集合记为 ,共有 种药物,每种药物作为一个节点,每种药物不同知识维度的数据列记为 ,表示任意一种知识维度,即任意一列,共有D列数据;计算每个药物在医药知识图谱中的重要性,用于表征药物的重要性置信度,具体计算公式为:其中, 表示药物 在医药知识图谱中的重要性置信度,为医药知识图谱中节点继续扩展的概率, 和 分别为药物 在医药知识图谱中的入度和出度,表示药物 在医药知识图谱中的重要性置信度, ;所述药物的富集程度是指药物用途广泛程度的量化;
然后将医药知识图谱中各药物节点之间的关系格式设置为三元组,包括第一实体、关系和第二实体,三元组数据中两个实体之间的关系置信度越高,则表明两个实体的关联性越强;所述关系置信度是指两个实体之间存在的不同关系权重和等级所得到的数值;计算两个实体的关系置信度,所述关系置信度的表达式为:其中, 表示实体 与实体 的关系置信度, 表示实体 与实体 在第d个知识维度下的相似度,即第d种关系的相似度, 为第d种关系的权重;
最后在符合关系置信度阈值的药物之间设置关系连接通道,通道的权重计算公式为:药物之间的连接通道权重决定了药物是否可以进行搭配学习;由药物三元组知识以及药物通道共同构成医药知识词典;
S2.将医药知识词典用于用户学习环境中,根据第一触发指令和第二触发指令寻找相应的医药知识点,形成医药知识推荐集,能适时地按照用户的学习状况推荐学习内容,方便用户快速学习。
3.如权利要求2所述的一种基于精准算法和大数据的医药知识快速学习系统的实现方法,其特征在于,所述步骤S2具体包括:用户接口组件测验出用户的学习状况,即用户对医药知识的掌握程度;用户接口组件获取用户访问日志中的用户行为信息以及用户行为信息对应的响应信息。
4.如权利要求3所述的一种基于精准算法和大数据的医药知识快速学习系统的实现方法,其特征在于,所述步骤S2具体包括:将行为数据的权重和学习权重作为用户对不同药物的不同知识维度的需求度,根据学习权重得到第一触发指令;根据行为数据的权重得到第二触发指令;指令响应组件根据第一触发指令和第二触发指令在中医药知识库中寻找相应的医药知识点,并根据每个药物知识及其连接通道得到关联性强的其他药物知识,将所有药物知识按照顺序汇集,得到当前用户的医药知识推荐集。
说明书 :
基于精准算法和大数据的医药知识快速学习系统及方法
技术领域
背景技术
无从选择,用户难以找到适时、适地、适合的价值信息。如何把大量医药知识向用户有针对
性的、及时的推荐和普及,使得用户能够有针对性的、快速学习医药知识是一个亟待解决的
课题。
对医药网站内容进行解析;完成对解析内容的数据清洗;利用基于词典的切分算法对解析
内容进行切分处理;设计医药知识图谱实体关系,并进行基于医药知识图谱的语义表示;基
于注意力机制进行知识图谱网络的构建,并进行基于知识图谱的医药问答;将基于知识图
谱的医药问答过程建模为排序问题,采用逐点训练的方式进行计算,得到问答之间的匹配
分数,并根据匹配分数的分布特征进行参数精调,实现少样本下的知识图谱训练。
内容进行精准挖掘,用户难以找到适合的价值信息,难以加快学习速度。
发明内容
藏内容进行精准挖掘,用户难以找到适合的价值信息,难以加快学习速度的问题;实现了精
准挖掘医药知识隐含信息,为用户推荐合适的医药知识,使得用户能够有针对性的、快速学
习医药知识。
信度,构建知识词典,实现大数据精准挖掘;根据用户实测水平和行为数据了解用户需求,
根据用户需求推荐相应知识数据集。具体包括以下部分:
识库208;
令和第二触发指令中所述医药知识库208中寻找相应的医药知识点,并根据每个药物知识
及其连接通道得到关联性强的其他药物知识,将所有药物知识按照顺序汇集,得到当前用
户的医药知识推荐集。所述指令响应组件207将医药知识推荐集通过数据连接的方式传输
给所述用户接口组件203和所述医药知识库208。
列,将整理后的数据通过数据传输的方式发送给所述数据计算单元2022;所述数据计算单
元2022用于计算每个药物在医药知识图谱中的重要性置信度和两个实体之间的关系置信
度,将药物的重要性置信度和两个实体之间的关系置信度发送给所述通道构建单元2024,
并将关系置信度发送给所述格式规划单元2023;所述格式规划单元2023用于将医药知识图
谱中各药物节点之间的关系格式设置为三元组,将三元组通过数据连接的方式发送给所述
通道构建单元2024;所述通道构建单元2024用于在符合关系置信度阈值的药物之间设置关
系连接通道,药物之间的连接通道权重决定了药物是否可以进行搭配学习,所述通道构建
单元2024将药物三元组知识以及药物通道共同构成医药知识词典,将医药知识词典通过数
据连接的方式发送给所述医药知识库208;
方便用户快速学习。
据第一触发指令和第二触发指令在中医药知识库中寻找相应的医药知识点,并根据每个药
物知识及其连接通道得到关联性强的其他药物知识,将所有药物知识按照顺序汇集,得到
当前用户的医药知识推荐集。
中的重要性置信度和关联置信度,构建医药知识词典,实现医药知识精准挖掘;
通道得到关联性强的其他药物知识,形成医药知识推荐集,让用户明白自身学习的弱点与
盲点,并根据医药知识推荐集对弱点知识点与其它相关知识点的方式进行强化学习,让用
户能有计划、快速地学习医药知识。
加快学习速度的问题。并且,上述系统或方法经过了一系列的效果调研,通过验证,最终能
够精准挖掘医药知识隐含信息,为用户推荐合适的医药知识,使得用户能够有针对性的、快
速学习医药知识。
附图说明
具体实施方式
藏内容进行精准挖掘,用户难以找到适合的价值信息,难以加快学习速度的问题。
的重要性置信度和关联置信度,构建医药知识词典,实现医药知识精准挖掘;将医药知识词
典用于用户学习环境中,按照用户的学习状况和行为数据设置第一触发指令和第二触发指
令,根据触发指令推荐医药知识,并根据每个药物知识及其连接通道得到关联性强的其他
药物知识,形成医药知识推荐集,让用户明白自身学习的弱点与盲点,并根据医药知识推荐
集对弱点知识点与其它相关知识点的方式进行强化学习,让用户能有计划、快速地学习医
药知识。
库208;
计算单元2022、格式规划单元2023、通道构建单元2024,如图3所示。数据梳理单元2021用于
将医药知识图谱中的所有医药知识形成不同知识维度的数据列,数据梳理单元2021将整理
后的数据通过数据传输的方式发送给数据计算单元2022;数据计算单元2022用于计算每个
药物在医药知识图谱中的重要性置信度和两个实体之间的关系置信度,数据计算单元2022
将药物的重要性置信度和两个实体之间的关系置信度发送给通道构建单元2024,并将关系
置信度发送给格式规划单元2023;格式规划单元2023用于将医药知识图谱中各药物节点之
间的关系格式设置为三元组,将三元组通过数据连接的方式发送给通道构建单元2024;通
道构建单元2024用于在符合关系置信度阈值的药物之间设置关系连接通道,药物之间的连
接通道权重决定了药物是否可以进行搭配学习,通道构建单元2024将药物三元组知识以及
药物通道共同构成医药知识词典,将医药知识词典通过数据连接的方式发送给医药知识库
208;
户的学习状况发送给实时检测组件204,将用户终端10的用户访问日志中的用户行为信息
以及用户行为信息对应的响应信息发送给数据处理组件205;将指令响应组件207的医药知
识推荐集通过数据连接的方式传输给用户终端10;
204将获取的用户对药物知识的掌握情况通过数据连接的方式发送给指令响应组件207;
其响应信息进行分类,得到至少一个行为数据。数据处理组件205将用户行为数据通过数据
传输的方式发送给数据分析组件206;
将所有药物知识按照顺序汇集,得到当前用户的医药知识推荐集。指令响应组件207将医药
知识推荐集通过数据连接的方式传输给用户接口组件203和医药知识库208;
知识学习者在学习过程中面对如此繁多的知识无法快速、有效得建立知识结构体系,不易
掌握,因此本发明所述的医药知识快速学习系统对医药知识大数据进行整理、分析,针对知
识学习者(即用户)的知识掌握情况精准地向用户推荐医药知识,便于用户快速学习。
接组件201用于接收抓取的医药知识图谱。所述已存在的医药知识图谱中包含所有医药知
识,例如药品名称、成分、用途、使用方法、存放方式等。所述大数据对接组件201将医药知识
图谱传输给数据整理组件202数据整理组件202对医药知识图谱中的所有医药知识进行整
理、分析,挖掘医药知识中的隐含关系,构建医药知识词典。数据整理组件202构建医药知识
词典的具体方法如下:
类编码的集合记为 ,共有 种药物,每种药物作为一个节点,每种药物
不同知识维度的数据列记为 , 表示任意一种知识维度,
即任意一列,共有D列数据。数据计算单元2022计算每个药物在医药知识图谱中的重要性,
用于表征药物的重要性置信度,具体计算公式为:
节点的入度和出度反映了医药知识图谱中当前药物节点的富集程度和节点与其他节点间
的关联强度,具体入度和出度数据可由实验获得, 表示药物 在医药知识图谱中的
重要性置信度, 。所述药物的富集程度是指药物用途广泛程度的量化。
高,则表面两个实体的关联性越强。所述关系置信度是指两个实体之间存在的不同关系权
重和等级所得到的数值。对两个实体之间的不同关系进行等级划分,每种关系均分为5个等
级,每种关系的权重不同,关系权重根据实际情况自行设定。两个实体间的关系包括成分相
似度、用途相似度、使用方法相似度、存放方式相似度等,例如当两个实体的成分相似度达
到80%以上时,设定两个实体在成分关系中的等级为5级。数据计算单元2022计算两个实体
的关系置信度,所述关系置信度的表达式为:
之间设置关系连接通道,通道的权重计算公式为:
和准确率,挖掘医药知识中的重要性置信度和关联置信度,构建医药知识词典,实现医药知
识精准挖掘。
方便用户快速学习。
的学习状况,即用户对医药知识的掌握程度。根据实时检测组件204获得的用户学习状况可
以得到用户对不同药物知识的掌握情况,根据用户的错误率对不同药物知识赋予学习权
重,错误率越高,对应的药物知识权重值越大。
操作,以及上述操作所对应的医药知识。
其响应信息进行分类,得到至少一个行为数据,所述行为数据是指在用户的点击、下载、收
藏、转发等操作中所对应的医药知识及其操作权重。所述操作权重是指点击、下载、收藏、转
发等操作的重要占比,根据实际情况自行设定。
用现有技术中最常用的卷积神经网络方法,首先对加权后的行为数据进行筛选,剔除权重
小于预设的行为权重阈值的行为数据,然后对行为数据与对应的局部知识信息进行训练学
习,当网络精准率达到期望时,停止训练,最终输出行为数据对应的局部知识信息,即不同
药物的不同知识维度 。
触发指令;根据行为数据的权重得到第二触发指令,即当出现大于行为权重阈值的医药知
识时,触发第二触发指令。指令响应组件207根据第一触发指令和第二触发指令在中医药知
识库208中寻找相应的医药知识点,并根据每个药物知识及其连接通道得到关联性强的其
他药物知识,将所有药物知识按照顺序汇集,得到当前用户的医药知识推荐集。将用户对应
的医药知识推荐集推荐给用户,达到快速学习的目的。
据每个药物知识及其连接通道得到关联性强的其他药物知识,形成医药知识推荐集,让用
户明白自身学习的弱点与盲点,并根据医药知识推荐集对弱点知识点与其它相关知识点的
方式进行强化学习,让用户能有计划、快速地学习医药知识。
中的重要性置信度和关联置信度,构建医药知识词典,实现医药知识精准挖掘;
通道得到关联性强的其他药物知识,形成医药知识推荐集,让用户明白自身学习的弱点与
盲点,并根据医药知识推荐集对弱点知识点与其它相关知识点的方式进行强化学习,让用
户能有计划、快速地学习医药知识。
快学习速度的问题。并且,上述系统或方法经过了一系列的效果调研,通过验证,最终能够
精准挖掘医药知识隐含信息,为用户推荐合适的医药知识,使得用户能够有针对性的、快速
学习医药知识。
程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实
现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。
选实施例以及落入本发明范围的所有变更和修改。
之内,则本发明也意图包含这些改动和变型在内。