一种中医体质动态变化辨识方法及系统转让专利

申请号 : CN201910657360.1

文献号 : CN110432864B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 罗悦温川飙孙涛高园宋海贝程小恩赵姝婷程爱景

申请人 : 成都中医药大学

摘要 :

本发明公开了一种中医体质动态变化辨识方法及系统,包括:基于量表辨识法和传统四诊法分别采集体质辨识数据,所述体质辨识数据包括多个中医体质及其对应的体质影响因子;构建知识数据库;采用灰色关联分析法对所述知识数据库进行分析,求取所述多个中医体质及其对应的关键体质影响因子;基于所述多个中医体质及其对应的关键体质影响因子构建知识图谱。本发明通过运用灰色关联分析算法和知识图谱技术,更客观地展示了影响中医体质的关键体质影响因子,将影响中医体质的关键体质影响因子进行了科学地量化。并且本系统通过相应编程设置,自动输出中医体质类型的关键影响因子,用于辅助医生进行体质诊断,采用本发明的系统,使用方便、效率高。

权利要求 :

1.一种中医体质动态变化辨识方法,其特征在于,包括:

基于量表辨识法和传统四诊法分别采集体质辨识数据,所述体质辨识数据包括多个中医体质及其对应的体质影响因子;

对基于量表辨识法和传统四诊法分别采集到的体质辨识数据进行预处理,并基于所述多个中医体质及其对应的体质影响因子间的相互作用关系构建知识数据库;运用灰色关联分析法对所述知识数据库进行分析,求取所述多个中医体质类型及其对应关键体质影响因子;基于所述多个中医体质类型及其对应的关键体质影响因子构建中医体质知识图谱。

2.根据权利要求1所述的方法,其特征在于,所述中医体质知识图谱基于所述知识数据库的更新进行自动更新。

3.根据权利要求1所述的方法,其特征在于,采用数据处理专用工具Kettle对所述体质辨识数据进行预处理。

4.根据权利要求1所述的方法,其特征在于,采用规则表示法表示所述中医体质类型及其对应的体质影响因子间的相互作用关系。

5.根据权利要求1所述的方法,其特征在于,所述运用灰色关联分析法对所述知识数据库进行分析,求取所述多个中医体质类型及其对应关键体质影响因子具体包括:以知识数据库中基于量表辨识法采集的多个中医体质为量表辨识法参考序列,以所述多个中医体质对应的体质影响因子为量表辨识法比较序列;对所述量表辨识法参考序列和其对应的量表辨识法比较序列进行量化和无量纲化;求取所述量表辨识法参考序列与其对应的量表辨识法比较序列的差序列;基于所述差序列求取所述量表辨识法参考序列与其对应的量表辨识法比较序列的关联度;对所述量表辨识法比较序列的关联度进行排序求取每个参考序列对应的关联序;

将知识数据库中基于传统四诊法采集的多个中医体质为四诊法参考序列,以所述多个中医体质对应的体质影响因子为四诊法比较序列;对所述四诊法参考序列和其对应的四诊法比较序列进行量化和无量纲化;求取所述四诊法参考序列与其对应的四诊法比较序列的差序列;基于所述差序列求取所述四诊法参考序列与其对应的四诊法比较序列的关联度;

对所述四诊法比较序列的关联度进行排序求取每个参考序列对应的关联序,所述每个参考序列对应的关联序中关联度大的比较序列即为所述中医体质类型对应的关键体质影响因子。

6.根据权利要求5所述的方法,其特征在于,以所述量表辨识法参考序列和四诊法参考序列为事务域,选取所述量表辨识法参考序列和四诊法参考序列对应的关联序中关联度大的比较序列为项域,基于所述事务域、项域构建所述中医体质知识图谱。

7.根据权利要求5或6所述的方法,其特征在于,所述关联度计算公式为:

其中,i、n、k为整数,§i(k)为灰色关联系数;k为时刻。

8.根据权利要求7所述的方法,其特征在于,所述灰色关联系数计算公式为:

其中,θ为分辨系数,取值范围为(0,1);Yi(k)为第k个时刻下的参考序列;Xi(k)为第k个时刻下的参考序列对应的比较序列,i为整数。

9.一种中医体质动态变化辨识系统,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至

8中任一项所述的方法。

说明书 :

一种中医体质动态变化辨识方法及系统

技术领域

[0001] 本发明涉及知识图谱技术领域,尤其涉及一种中医体质动态变化辨识方法及系统。

背景技术

[0002] 朱燕波、王琦等人分析了中医阳虚质的主要相关影响因素为疾病因素、性别、运动习惯、饮食因素、体型。王健平等人通过505例样本分析发现阳虚质、阴虚质、瘀血质、气郁质者体型偏瘦,痰湿质者体型偏胖;阳虚质者血TC、TG、LDL、FBG偏低,阴虚质者血FBG偏高,痰湿质者TG、LDL偏高,HDL偏低。朱丽冰等人通过对样本数据的分析发现体重指数与中医体质类型之间存在着一定的关联性。也有不少研究者针对某一疾病开展中医体质的关联性因素分析:如柳红芳等人研究发现对于2型糖尿病患者,BMI、腰围增大,胆固醇、甘油三酯指标升高可能是痰湿质的危险因子,BMI、腰围减小是阴虚质的危险因素,提示纤维蛋白原含量、D二聚体可能是血瘀质的危险因素。李小燕等人研究发现痰湿体质与血糖水平、血脂(TG、TC、HDL-C、LDL-C)有关。邓科穗等人通过对高血压患者的中医体质与体检指标的关系分析,发现高血压平和质患者与心肌缺血和心电传导指标有关,高血压痰湿质和湿热质与肾功能指标有关。其他研究者如张伟骏、Mihui Li等人均是通过对某一患病人群的分析,研究分析发现中医体质与某些西医体检指标、气候或个体自身因素如性格、心理有关。
[0003] 现有技术中也有运用现代智能化技术开展中医体质关联因素的研究,如:课题负责人前期运用神经网络对950例体检者及其对应的体质类型开展研究,通过构建中医体质与体检指标的神经网络关联模型,发现中医体质与西医体检指标存在一定的关联性。
[0004] 现有研究均偏向于某一状态下如疾病状态或健康状态者某一时刻的体质类型关联因素分析,而个体体质是会随着外界环境、自身情况变化而变化的,即影响某一体质类型的因素应通过不同时刻的动态研究、分析发现。并且目前的中医体质辨识方法中,还存在样本量不足(2230例)、可信度不够的问题;且其中涉及到的中医体质的关联因素还不够多,缺乏对中医体质的核心影响因素分析。
[0005] 综上,现有的关于中医体质的辨识分析方法存在样本数量不足、导致研究结果不可靠;缺乏对中医体质类型的动态分析,且存在片面性、未能找出中医体质关键影响因子的问题。

发明内容

[0006] 本发明的目的之一至少在于,针对如何克服上述现有技术存在的问题,提供一种中医体质动态变化辨识方法及系统,通过运用灰色关联分析法和知识图谱技术,能够输出中医体质类型的关键影响因子,展示中医体质动态变化规律。
[0007] 为了实现上述目的,本发明采用的技术方案包括以下各方面。
[0008] 一种中医体质动态变化辨识方法,包括:
[0009] 基于量表辨识法和传统四诊法分别采集体质辨识数据,所述体质辨识数据包括多个中医体质及其对应的体质影响因子;
[0010] 对基于量表辨识法和传统四诊法分别采集到的体质辨识数据进行预处理,并基于所述多个中医体质及其对应的体质影响因子间的相互作用关系构建知识数据库;运用灰色关联分析法对所述知识数据库进行分析,求取所述多个中医体质类型及其对应关键体质影响因子;基于所述多个中医体质类型及其对应的关键体质影响因子构建中医体质知识图谱。
[0011] 优选的,一种中医体质动态变化辨识方法中,所述中医体质知识图谱基于所述知识数据库的更新进行自动更新。
[0012] 优选的,一种中医体质动态变化辨识方法中,采用数据处理专用工具Kettle对所述体质辨识数据进行预处理。
[0013] 优选的,一种中医体质动态变化辨识方法中,采用规则表示法表示所述中医体质类型及其对应的体质影响因子间的相互作用关系。
[0014] 优选的,一种中医体质动态变化辨识方法中,运用灰色关联分析法对所述知识数据库进行分析,求取所述多个中医体质类型及其对应关键体质影响因子具体包括:
[0015] 以知识数据库中基于量表辨识法采集的多个中医体质为参考序列,以所述多个中医体质对应的体质影响因子为比较序列;对所述参考序列和其对应的比较序列进行量化和无量纲化;求取所述参考序列与其对应的比较序列的差序列;基于所述差序列求取所述多个参考序列与其对应的比较序列的关联度;对所述比较序列的关联度进行排序求取每个参考序列对应的关联序;
[0016] 将知识数据库中基于传统四诊法法采集的多个中医体质为参考序列,以所述多个中医体质对应的体质影响因子为比较序列;对所述多个参考序列和其对应的比较序列进行量化和无量纲化;求取所述多个参考序列与其对应的比较序列的差序列;基于所述差序列求取所述多个参考序列与其对应的比较序列的关联度;对所述比较序列的关联度进行排序求取每个参考序列对应的关联序,所述每个参考序列对应的关联序中关联度大的比较序列即为所述中医体质类型对应的关键体质影响因子。
[0017] 优选的,一种中医体质动态变化辨识方法中,以所述多个参考序列为事务域,选取多个参考序列对应的关联序中关联度大的比较序列为项域,基于所述事务域、项域构建所述中医体质知识图谱。
[0018] 优选的,一种中医体质动态变化辨识方法中,所述关联度计算公式为:
[0019]
[0020] 其中,i、n、k为整数,§i(k)为灰色关联系数。
[0021] 优选的,一种中医体质动态变化辨识方法中,所述灰色关联系数计算公式为:
[0022]
[0023] 其中,θ为分辨系数,取值范围为(0,1);Yi(k)为第k个参考序列;Xi(k)为第k个参考序列对应的比较序列,i为整数。
[0024] 一种中医体质动态变化辨识系统,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。
[0025] 综上所述,由于采用了上述技术方案,本发明至少具有以下有益效果:
[0026] 通过将灰色关联分析法和知识图谱技术运用到中医体质的动态分析中,全面揭示了中医体质类型的关键影响因子,将影响中医体质的关键体质影响因子进行了科学地量化。
[0027] 并且本发明所保护的中医体质动态变化辨识系统,通过相应的灰色关联分析算法和知识图谱算法的编程设置,输出中医体质类型的关键影响因子,用于辅助医生进行体质诊断,与人工理论判断法相比,采用本发明的系统,使用方便、效率高。

附图说明

[0028] 图1是根据本发明示例性实施例的中医体质动态变化辨识方法流程图。
[0029] 图2是根据本发明示例性实施例的中医体质动态变化辨识系统结构示意图。

具体实施方式

[0030] 下面结合附图及实施例,对本发明进行进一步详细说明,以使本发明的目的、技术方案及优点更加清楚明白。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0031] 图1示出了根据本发明示例性实施例的一种中医体质动态变化辨识方法。该实施例的方法主要包括:
[0032] 基于量表辨识法和传统四诊法分别采集体质辨识数据,所述体质辨识数据包括多个中医体质及其对应的体质影响因子;
[0033] 对基于量表辨识法和传统四诊法分别采集到的体质辨识数据进行预处理,并基于所述多个中医体质及其对应的体质影响因子间的相互作用关系构建知识数据库;运用灰色关联分析法对所述知识数据库进行分析,求取所述多个中医体质类型及其对应关键体质影响因子;基于所述多个中医体质类型及其对应的关键体质影响因子构建中医体质知识图谱。由此我们分析得出了中医体质类型及其关键体质影响因子。
[0034] 具体的,基于量表法和传统四诊法采集大量的体质辨识数据,所述体质辨识数据包括中医体质类型及其对应的体质类型影响因子。接着对采集的体质辨识信息进行预处理,先由人工整合采集到的体质信息、并按采集时间分门别类;接着运用ETL(Extract-Transform-Load,将数据从来源端经过萃取、转置、加载至目的端的过NSFC 2019第22页国家自然科学基金申请书2019版版本:19110316073827675程)数据处理专用工具Kettle软件对采集的体质数据进行清洗。由于数据量较大,针对数据查重、勘误、清理不完整数据工作,运用Kettle工具来完成。在本实施例中,经过预处理后形成12000份有效样本作为知识库构建的数据源,并确保量表法和传统四诊法的有效体质辨识样本数据比例为8:2。
[0035] 进一步的,我们利用12000份有效样本构建知识数据库,该知识库的建立包括四个过程:实体抽取、属性识别、关系抽取、知识评估。
[0036] 具体的,参考中医体质9种体质类型6个维度(总体特征、形体特征、常见表现、心理特征、发病倾向、对外界环境适应能力)的表现,实体抽取:体质中的实体可分为:面色、唇色、舌苔、情绪、阴虚质、平和质、阳虚质、痰湿质、湿热质、血瘀质、气郁质等。属性识别:针对实体,对每个实体开展属性分析,如面色的属性为晦黯、潮红、偏红等,唇色的属性为红、偏黯等。关系抽取:实体间的关系。即面色、唇色等与体质类型之间的关系。拟用用规则表示法表示关系,规则表示法形如“IF...THEN...”,用于表达因果关系,中医体质中的关系如“精力充沛、不疲惫、不失眠、记忆好……”与“平和质”之间即属于因果关系,因此规则表示法适用于表达实体之间的关系。知识评估:通过抽样评估,专家评估等多种评估方法确保知识的完整性、一致性和逻辑合理性。
[0037] 进一步的,采用灰色关联分析法对所述知识数据库进行分析,确定多个中医体质类型与其对应的体质影响因子的关联度,以得到对每个体质对应的关键体质影响因子的分析。
[0038] 灰色关联分析法是根据系统内部各因素之间的相似或相异程度来衡量因素之间的关联程度,是一种量化比较分析。进行灰色关联分析首先要指定参考序列。基于灰色关联分析的中医体质关键影响因子分析算法包括如下几个步骤:
[0039] 首先确定分析序列,即量表辨识法分析序列的设计:
[0040] 对于量表辨识法,分析法中因变量组成的序列即中医体质9种类型,为参考序列{Yi},自变量所组成的序列即中医体质影响因素(为体质辨识量表中的体质辨识条目及个体对条目的选项)成为比较序列{Xi}。每个序列是由不同时刻采集的个体中医体质信息所组成,以Yi为例,记第1个时刻(某一个节气)采集的个体体质类型为yi(1),记第2个时刻(某一个节气)采集的个体体质类型为yi(2),记第k个时刻(某一个节气)采集的个体体质类型为yi(k)。同理,比较序列Xi=(xi(1),xi(2)…xi(k))。
[0041] 传统四诊法分析序列的设计:对于传统四诊辨识法,分析法中因变量组成的序列即中医体质9种类型,为参考序列{Yi},自变量组成的序列即中医体质影响因素(每种体质类型的6个维度信息)成为比较序列{Xi}。每个序列是由不同时刻采集的个体中医体质信息所组成,以Yi为例,记第1个时刻(某一个节气)采集的个体体质类型为yi(1),记第2个时刻(某一个节气)采集的个体体质类型为yi(2),记第k个时刻(某一个节气)采集的个体体质类型为yi(k)。同理,比较序列Xi=(xi(1),xi(2)…xi(k))。
[0042] 接着将分析序列量化与无量纲化,灰色关联分析法是基于数字计算的,中医体质信息为非数字,因此需先将中医体质信息转化为数字进行量化。具体的,量表法体质辨识信息量化与无量纲化方法如下:
[0043] 参考序列的量化:中医体质类型为9种(平和质、气虚质、阳虚质、阴虚质、痰湿质、湿热质、瘀血质、气郁质、特禀质),按照数字1-9来标识9种体质类型。
[0044] 比较序列的量化:依据量表法,每种体质类型的判定均有7个或8个判定条目,每个判定条目有没有,很少,有时,经常,总是5个选项。因此,设置一个8*5的矩阵来量化比较序列,用1-8来量化条目,用1-5分别表示对8个选项条目的选择。以平和质为例,如某个体对8个选项的选择分别是“总是、很少、经常、经常、很少、总是、很少、有时”,则平和质的量化情况如表1(示例表)所示:
[0045] 表1量表法中平和质比较序列的量化表(示例表)
[0046]
[0047] 则基于量表法该个体的平和质判定量化(比较序列)矩阵为 其他体质类型的比较序列的量化类似。
[0048] 序列的无量纲化:量纲是指物理量的基本属性,表示物理量的数量级和单位,由于量表法体质辨识信息量化后的比较序列和参考序列数量级和单位一致(均用1-10以内的数字表示),即量纲一样或称为无量纲量,因此无需进行无量纲化。
[0049] 传统四诊法体质辨识信息量化与无量纲化方法如下:
[0050] 参考序列的量化:中医体质类型的量化同量表法一致。
[0051] 比较序列的量化:每种体质类型的6个维度及每个维度分别对应的表现信息组成了比较序列。6个维度用1-6表示,为了便于量化,将每个维度下的具体表现特征用“非常不符合、不符合、一般符合、符合、非常符合”5个等级标记,分别用1-5表示,如根据传统四诊法医生判定某个体平和质维度特征分别为“符合、符合、非常符合、符合、符合、符合”,则基于传统四诊法,该个体平和质的量化情况如表2所示:
[0052] 表2传统四诊法中平和质比较序列的量化表(示例表)
[0053]
[0054]
[0055] 则基于传统四诊法该个体的平和质判定量化(比较序列)矩阵为
[0056] 序列的无量纲化:由于传统四诊法体质辨识信息量化后的比较序列和参考序列数量级和单位一致(均用1-10以内的数字表示),即量纲一样或称为无量纲量,因此也无需进行无量纲化。
[0057] 求差序列、最大差、最小差
[0058] 差序列:
[0059] Δi(k)=|Yi(k)-Xi(k)|   (1)
[0060] 两级最小差:
[0061]
[0062] 两级最大差:
[0063]
[0064] 运用公式(1),(2)和(3),分别对基于量表法和传统四诊法的体质辨识信息求差序列、最大差和最小差。
[0065] 计算灰色关联系数
[0066]
[0067] 其中,θ为分辨系数,取值范围为(0,1),一般取θ=0.5。
[0068] 运用公式(4),分别计算基于量表法和传统四诊法的体质辨识信息的灰色关联系数。
[0069] 计算关联度
[0070] 关联度:
[0071]
[0072] 运用公式(5),分别对基于量表法和传统四诊法的体质辨识信息中参考序列和比较序列的关联度。
[0073] 排关联序。为准确评价每个比较序列与参考序列的关联程度,根据各个数据列所计算出来的关联度,将关联度按照大小排序,称为关联序。关联度大,则表示该序列同参考序列关系密切,反之,则关系疏远。据此找出因变量(参考序列)的关键因素(关键体质影响因子)和次要因素。由此我们分析出了中医体质类型及其对应的关键体质影响因子。
[0074] 最后,分别确定基于量表法和基于传统四诊法的关联度大的多个自变量(其中关联度大的多个自变量,即为相应的关键体质影响因子)和参考序列项构成知识图谱输入的项域和事务域。将灰色关联分析确定的基于量表法和基于传统四诊法的项域和事务域作为知识图谱的输入,经过相应的翻译解释,形成中医体质关键影响因子语义网络(知识图谱)。
[0075] 运用JAVA编程语言,完成经过灰色关联分析法输入的中医体质关键影响因子语义网络可视化。运用JAVA编程语言,编写知识图谱更新算法,实时探测知识库的更新状态,当知识库得到更新时,算法自动完成对知识图谱的更新。
[0076] 图2示出了根据本发明示例性实施例的一种中医体质动态变化辨识系统,即电子设备310(例如具备程序执行功能的计算机服务器),其包括至少一个处理器311,电源314,以及与所述至少一个处理器311通信连接的存储器312和输入输出接口313;所述存储器312存储有可被所述至少一个处理器311执行的指令,所述指令被所述至少一个处理器311执行,以使所述至少一个处理器311能够执行前述任一实施例所公开的方法;所述输入输出接口313可以包括显示器、键盘、鼠标、以及USB接口,用于输入输出数据;电源314用于为电子设备310提供电能。
[0077] 本领域技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0078] 当本发明上述集成的单元以软件功能单元的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
[0079] 以上所述,仅为本发明具体实施方式的详细说明,而非对本发明的限制。相关技术领域的技术人员在不脱离本发明的原则和范围的情况下,做出的各种替换、变型以及改进均应包含在本发明的保护范围之内。