基于PK-PD的中药复方物质基础数据分析方法转让专利

申请号 : CN201310339722.5

文献号 : CN104346399B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 刘建勋安金兵林力张颖林成仁李欣志李磊

申请人 : 中国中医科学院西苑医院

摘要 :

一种基于PK-PD的中药复方物质基础数据分析方法,包括:1)对实验获得的原始PK和PD数据进行稳健变换;2)采用基于样本的观测数值总体的重抽样方法,基于每个时间点的PK或PD数据的经验分布函数随机抽取一个虚拟观测样本,多个时间点的虚拟观测形成一个虚拟的样本轨道,以此模拟药动学或者药效学测量过程;3)计算每个时间点的累积效应,分别计算所选择的PK指标和PD指标之间的关系,分析在不同组别之间的差异;4)计算每一条虚拟样本轨道的PD指标关于各药物成分在每个时间点的变化率,通过变化率的密度演化过程获得药动学指标对于药效学指标的作用效果。本发明通过定量分析PK数据与PD数据的变化关系,从中发现成分与PD指标之间的关系。

权利要求 :

1.一种基于PK-PD的中药复方物质基础数据分析方法,其特征在于,包括:

1)对实验获得的原始药代动力学PK和药效动力学PD数据进行稳健变换;

2)采用基于样本的观测数值总体的重抽样方法,基于每个时间点的PK或PD数据的经验分布函数随机抽取一个观测样本,从而多个时间点的观测数据就形成一个样本轨道,以此来模拟一个试验对象的药动学或者药效学测量过程;

3)计算每个时间点的累积效应,并分别计算所选择的药代动力学PK指标和药效动力学PD指标之间的相关关系,分析在不同组别之间的差异;

4)计算每一条样本轨道的药效动力学PD指标关于各个药物成分在每个时间点的变化率,进而通过变化率的密度演化过程获得药效动力学PD指标对于PK指标的作用效果,其中,在所述步骤1)中,通过计算每个时间点测量数据的经验分布函数,来对数据进行稳健变换,在步骤2)中,所述基于样本的观测数值总体的重抽样方法为Bootstrap重抽样方法,包括:

2-1)将PK或者PD数据中每个时间点的所有数据看成是一个总体,并利用这些数据构造经验分布函数,

2-2)从这些时间点对应的总体中分别随机抽取一个样本,从而构成一次观测;

2-3)重复步骤2-1)-2-2)至预定次数,

所述步骤3)包括:

3-1)计算每个时间点的累积效应;

3-2)计算PK指标和PD指标之间的皮尔逊相关系数;

3-3)计算不同PD指标关于药效金指标的相关性,所述步骤4)包括:

4-1),利用三次样条方法计算每一条轨道的PD指标关于各个药物成分在每个时间点的偏导数的数值解;

4-2)利用核函数密度估计方法得到每个时间点PD指标关于各个药物成分的偏导数的密度估计;

4-3)通过概率密度函数随着时间的演化趋势获得PD指标对于PK指标的作用效果。

2.根据权利要求1所述的基于PK-PD的中药复方物质基础数据分析方法,其特征在于,还包括:通过线性插值方法,即每个点的分布函数值通过与它最近临的两个点的函数值的线性插值确定,来对经验分布函数进行连续性校正。

3.根据权利要求1所述的基于PK-PD的中药复方物质基础数据分析方法,其特征在于,所述步骤3)还包括:

3-4)分析经时PD指标与终点PD指标之间的相关性;

3-5)如果该终点指标为金标准,则利用不同PD指标关于该金标准的相关性,推断实际中可能存在不利因素的金标准的替代药效检测指标。

4.根据权利要求1所述的基于PK-PD的中药复方物质基础数据分析方法,其特征在于,还包括:

5)基于不同药物的各个成分的差值以及PD指标的差值分析两者的相关性,

5-1)将有病初始状态的观测值作为基线标准,计算各个时间点的观测相对于基线的差值;

5-2)将差值作为随着时间点变化的PD指标的表观曲线;

5-3)将对照组趋势线的平均值曲线作为不同药物处理组的该PD指标的参考曲线;

5-4)对于每种成分将每个相同的时间点下不同个体中该成分含量的差值作为解释变量,同时将相应个体的PD指标的差值作为响应变量,通过药物含量变化与药效变化之间的相关系数分析药动学与药效学之间的关系。

5.根据权利要求1所述的基于PK-PD的中药复方物质基础数据分析方法,其特征在于,还包括:

6)利用不同组别的PD指标在各个时间点关于对照组数据的分布距离判断各个组别之间的相似程度,进而推断不同组别药物的作用。

6.根据权利要求5所述的基于PK-PD的中药复方物质基础数据分析方法,其特征在于,在所述步骤6)中,针对观测指标的有效时间点,利用不同组别的PD指标在各个时间点关于对照组数据的分布距离判断各个组别之间的相似程度。

说明书 :

基于PK-PD的中药复方物质基础数据分析方法

技术领域

[0001] 本发明涉及数据处理领域,更具体而言,涉及基于PK-PD的中药复方物质基础数据分析方法。

背景技术

[0002] 中药复方是一个由多个药味组成的复杂系统,因其对疾病特殊的治疗作用,与功效相关的物质基础研究一直成为世界学者的兴趣。
[0003] 目前对于中药复方物质基础的探讨中,PK-PD联合研究是其中最为符合中医理论的方法。
[0004] PK,即药代动力学(pharmacokinetics),指用动力的原理与数学模式,定量描述药物进入体内的吸收、分布、代谢和排泄过程中血药浓度随时间动态变化的规律,阐明机体对药物的作用,即PK数据表明了“时间-成分浓度”的关系。PD,即药效动力学(pharmacodynamics,PD),研究药物效应随着给药时间变化的动力学过程,阐明药物对机体的作用,即PD数据表明了“时间-效应(指标)的关系。在相当长的一段时间内,PK和PD是两门独立的学科,随着研究的深入,人们渐渐认识到,孤立的研究PK或PD,忽略两者之间的联系,所得到的信息是不完整的。
[0005] 从20世纪60年代提出将PK和PD模型结合起来,至今已有50多年,PK-PD模型已发展成为一套科学的体系,但上述理论和模型是基于药物作用机制比较清楚的前提下。即药物成分结构已知,其在体内产生的药理效应就是由该成分引起的,两者的关系是明确的。通过建模探讨“浓度-时间-效应”三者之间的关系,可以较为准确和全面的预测和描述一定的剂量和给药方案下药物的效应随时间变化的规律,指导其临床应用。
[0006] 但中药复方的PK-PD研究则与上述不同,其关系要复杂的多。这是因为中药复方发挥疗效具有多成分、多环节、多靶点的特点,某一化学 成分可能作用于多个PD指标,某一PD指标亦可能由多个成分所贡献,因此无法沿用原有的理论和模型进行中药复方物质基础的探讨。
[0007] 另外,对于中药复方PK数据,通常采用HPLC-UV或HPLC-MS等仪器,收集不同时间点的血液或组织,将其进行仪器分析出样品中药物成分的含量。对于PD数据,是根据所选择药物治疗疾病的特点,确定PD指标,通过药理学方法进行PD数据的测定。由于中药中成分复杂,药效机制不清,因此将会获得多个成分的PK数据,以及多个药效的PD数据。因此,如何解决多输入多输出系统的数据分析处理问题是现在亟需解决的问题。另外,数据处理过程中,还会出现实验数据体差异大和PK/PD数据时间不同步的问题,以及实验数据假阳性的问题。

发明内容

[0008] 针对上述问题,本发明提出了一种基于PK-PD的中药复方物质基础数据分析方法,包括:1)对实验获得的原始PK和PD数据进行稳健变换;2)采用基于样本的观测数值总体的重抽样方法,基于每个时间点的PK或PD数据的经验分布函数随机抽取一个观测样本,从而多个时间点的观测数据就形成一个样本轨道,以此来模拟一个试验对象的药动学或者药效学测量过程;3)计算每个时间点的累积效应,并分别计算所选择的PK指标和PD指标之间的相关关系,分析在不同组别之间的差异;4)计算每一条样本轨道的PD指标关于各个药物成分在每个时间点的变化率,进而通过变化率的密度演化过程获得药动学指标对于药效学指标的作用效果。
[0009] 中药复方的研究最大问题是不知道物质基础是什么,不知道哪些成分起效。本发明建立的基于PK-PD的数据分析处理方法,是将中药复方在体内发挥作用的机制看作黑箱系统,多成分的药代动力学PK数据为黑箱系统的输入,对应产生的多指标的药效动力学PD数据是黑箱系统的输出。通过定量描述和分析PK数据与PD数据的变化关系,从中寻找和发现哪些成分对哪些PD指标有贡献,其贡献程度有多少,即获得“成分-药效(指标)”的关系。本发明为中药复方物质基础的研究提供了一个新 的思路和方法。

附图说明

[0010] 图1为本发明的方法的一个实施例的流程图;
[0011] 图2为三个PD指标在6个时间点的100次模拟结果及其累积效应的剖面图;
[0012] 图3A为第3个药动学指标对于第1个药效学指标的影响;
[0013] 图3B为第3个药动学指标对于第2个药效学指标的影响;
[0014] 图4A-4C为消除个体差异的对照组和人参组PD指标PR趋势图;
[0015] 图5A为各处理组在动脉收缩压指标的累积效应曲线;
[0016] 图5B为各处理组在心输出量指标的累积效应曲线;
[0017] 图5C为各处理组在QRS间期指标的累积效应曲线。

具体实施方式

[0018] 第一个实施例:
[0019] 根据本发明的第一个实施例。本发明的方法针对药代动力学PK数据,通过定量描述和分析成分和药效的关系,从中寻找和发现哪些成分对哪些PD指标有贡献,其贡献程度有多少,进而得到多指标的药效动力学产生相应变化的数据。本发明的方法包括如下步骤:
[0020] 1、对实验获得的原始PK和PD数据,计算每个时间点测量数据的经验分布函数,从而对测量数据进行稳健变换。
[0021] 实验获得的原始PK和PD数据随时间的波动一般比较大,极不稳定,趋势项并不明显,而且数据的量纲不一。因此,需要对PK和PD数据进行稳健变换。
[0022] 稳健变换可以采用经验分布函数,经验分布函数的取值通常为两个整数的除运算,对于每一个PK或PD测量指标X,将所有试验个体i和不同时间点j针对该指标的测量数据{xi,j}看成一个完备数据集合,该集合的总样本量为N,然后构造这个数据集合的经验分布函数:
[0023]
[0024] 其中,I为指示函数,(xi,j<t)满足时取值为1,否则为0。
[0025] 这样,测量指标X的每一个观测值xi,j,关于这个整体的经验分布函数F(t)必然有一个函数值F(xi,j),则这个函数值F(xi,j)就作为观测变量xi,j的稳健变换数值。例如,对于某个观测值xi,j,不妨将其它同类观测值记录为xm,n,则所有的xm,n与xi,j进行大小比较并得到一系列0或者1的取值,其中1在所有的0、1序列中所占的比率就是xi,j的变换值。可以看出,经过这样的变换过程,每个数据的变换值均在(0,1)内取值,同时保留了每个数值与其它同类观测的相对大小关系。
[0026] 本发明通过基于整体分布的稳健变换,消除了每个数据的量纲,保证了数据的相对大小关系,同时使得那些异常取值的数据得到了比较恰当的抑制,进而可以通过变换后的数量值进行各种量化分析
[0027] 更有利地,可以对经验分布函数通过线性插值方法进行连续性校正,即每个点的分布函数值可以通过与它最近临的两个点的函数值的线性插值确定。当数据量比较小时该方法可以提高运算精度,当数据量较大时则影响不大。
[0028] 更有利地,还可以对各个测量指标的描述性统计。描述性统计一般指数据的最大值、最小值、中位数等基本统计量以及数据的图形描述,这些描述性统计可以提供直观信息。
[0029] 2、采用基于样本的观测数值总体的重抽样方法,基于每个时间点的PK或PD测量数据的经验分布函数随机抽取一个观测样本,这样多个时间点的观测数据就形成一个样本轨道,进而以此来模拟一个试验对象的药动学或者药效学测量过程。
[0030] 优选地,所述基于样本的观测数值总体的重抽样方法为Bootstrap重抽样方法。Bootstrap重抽样方法的可靠性通过经验分布函数的稳定性保证,并且每次抽样都得到一个不同于原始观测的虚拟观测,从而可以弥补样本量较小的弱点。Bootstrap重抽样方法的这个特点与其它类型的基于样本的观测数值总体的重抽样方法相比是明显的。
[0031] 这种方法可以弥补数据的不足并且有助于削弱数据波动较大造成的影响:考虑到PK和PD数据在不同的个体进行观测,个体差异较大并且 数据量较少,不过观测数据的经验分布函数通常满足稳定性,并且对异常的观测不敏感,因此本发明基于观测的经验分布函数进行Bootstrap重抽样来构造每个时间点的虚拟观测是比较可靠的。
[0032] 该步骤2包括:
[0033] (2-1)将每个因素(药物成分或者药效)中每个时间点的所有数据看成是一个总体,并利用这几个数据构造经验分布函数,
[0034] (2-2)从这些时间点对应的总体中分别随机抽取一个虚拟样本,从而构成一个虚拟的观测。随机抽取方法例如为Bootstrap重抽样方法。
[0035] (2-3)重复(2-1)-(2-2)的步骤,进行一定的次数(例如200次),那么就相当于进行200次试验。
[0036] 该方法通过从给定时间数据的分布函数抽取足够多的虚拟样本,相当于增加了实验样本,从而可以据此进行比较细致的数量分析(例如密度演化方法),提高了分析的可靠性。
[0037] 3、计算每个时间点的累积效应,并分别计算用户所选择的PK指标和PD指标之间的相关关系,分析药效在不同组别之间的差异。
[0038] 另外,还可以对经时PD指标(可以获取多个时间点的PD数据)与终点PD指标(只能获取一个时间点的PD数据)之间进行相关性分析。如果该终点指标为金标准,则利用不同PD指标关于该金标准的相关性,还可以推断实际中可能存在不利因素的金标准的替代药效检测指标。
[0039] 所述步骤3包括如下步骤:
[0040] (3-1)计算每个时间点的累积效应
[0041] PD指标在各个时间点的取值波动很大,直接考虑每个时间点的效果是不可靠的,只有从分布的角度讨论药动学药效学指标的取值分布的变化规律才是比较可靠的。
[0042] 因此,本发明根据统计学的基本原理,假设药物是无效的,则不同时间点关于阳性对照的差值的累积效果应该是随机波动的,可以看作是一个以0为均值的布朗运动。基于这样的假设,定义累积效应指标:
[0043]
[0044] 这里的Xi是第i个时间点的观测值关于参考点的差值。例如,图2显示了三个PD指标在6个时间点的100次模拟结果及其累积效应。从图2可以看出,不同观测指标的累积效应在各个时间点的取值满足一定层次性,基本上有了相对明确的取值变化趋势,可以进行进一步分析。
[0045] (3-2)计算PK指标和PD指标之间的皮尔逊相关系数,具体方法是:对于选定的PK指标和PD指标,首先获得试验个体的所有两两组合,然后对于每个组合分别计算PK指标和PD指标在每个时间点ti的差值,所有这些差值形成一个相互对应的二维数据序列,则这个序列的皮尔逊相关系数即可以度量PK指标和PD指标之间的相关性。当PD指标只有一个时间点的取值时,计算的方法类似,只不过PK指标不再是计算各个时间点的对应差值,而是计算PK经时曲线下的总面积在不同试验个体组合的差值。
[0046] (3-3)计算不同PD指标关于药效金指标的相关性,假如某个PD指标和药效金指标有较高的相关性,那么在实际中就可以考虑用该PD指标替代某些有伤害性或者不易检测的药效金指标来评判药物的效果。
[0047] 具体而言,假如药物的治疗效果可以通过试验所测定的k个药物成分的作用来决定,而相关系数是一个比较可靠的说明药物成分作用的指标,那么k个药物成分关于金指标的相关系数就可以看作是度量药物效果的一个特征向量TG。类似的,每个辅助的PD指标也会得到一个以k个相关系数组成的特征向量。显然,如果某个辅助指标A对应的特征向量TA与金指标的特征向量TG比较一致,即TA和TG之间的相关系数有较大取值,则意味着该辅助指标有可能替代金指标来判定药物的效果。
[0048] 4、计算每一条虚拟样本轨道的PD指标关于各个药物成分在每个时间点的密度估计,进而通过概率密度函数随着时间的演化趋势获得药动学指标对于药效学指标的作用效果。
[0049] 更具体而言,利用三次样条方法计算每一条虚拟轨道的PD指标关于各个药物成分在每个时间点的偏导数的数值解。然后利用核函数密度估计方法得到每个时间点PD指标关于各个药物成分的偏导数的密度估计,进而通过概率密度函数随着时间的演化趋势对药动学指标对于药效学指 标的起效时间、作用时间持续时间以及促进或抑制等效果作出判断。
[0050] 综上所述,本发明基于药动学药效学指标的累积效应计算药效学指标关于药动学指标的变化率,并通过变化率的密度演化过程对药动学药效学指标的关系进行说明。
[0051] 药动学指标和药效学指标的观测数据有较大变差,本发明在虚拟轨道的基础上,通过三次样条方法估计药效学指标在各个时间点关于药动学指标的变化率,这样对于每一条虚拟轨道在每个时间点各个药物成分和PD指标可以得到一系列变化率的取值,然后计算各个时间点该变化率的概率密度值,据此判断特定药动学指标对于药效学指标的影响程度。
[0052] 一般来说,如果某个药物成分对于药效没有明显作用则偏导数的概率密度将在0值附近集中,否则将移动到其它正值或者负值处。此外,对于某种药物成分来说,随着时间的推移,变化率一般又会回到0值附近,通常意味着该药物成分的代谢过程结束,从而就可以根据图形显示的变化时间推测某种成分的起效时间和持续时间的长短。
[0053] 例如,参看图3A、3B所示的某药物成分关于PD指标的密度演化图,其中图3A为第3个药动学指标对于第1个药效学指标的影响。图3B为第3个药动学指标对于第2个药效学指标的影响。从图3A和3B可以看出,同一个药动学指标对于不同的药效学指标往往有类似的形状,说明该成分有相对明确的作用机制,否则就可能和其它成分存在较强的相互作用。从图3A和3B可以判断,第三、四个药物成分对于治疗效果的影响比较明显。从图上看,该成分关于药效学的概率密度值在0值附近持续一定时间后向负值移动比较大,说明该成分对当前PD指标是一种抑制作用,另外这个成分有可能是一种短期效应,因为图中显示密度曲线持续一段时间后密度又向0值附近移动。
[0054] 第二个实施例:
[0055] 对数据进行稳健变换,可以抑制数据的异常取值,但无法消除个体间的差异。根据本发明的另一方面,为了提高分析准确性,还要考虑实验数据个体差异大和PK/PD数据时间不同步的问题。因此,本发明提出 了第二个实施例,该方法包括步骤:
[0056] 1、对实际的观测数据进行稳健变换(第一个实施例的步骤1)之后,本发明采用基线法进行实验数据的进一步处理,将有病初始状态的观测值作为基线标准,计算各个时间点的观测相对于基线的差值,将差值作为随着时间点变化的PD指标的表观曲线,这样对照组趋势线(此处所指的对照组是指在药理学研究中,除不给实验药物外,其它操作等同正式实验的操作组。对照组设定的目的是为了消除实验研究中除了药物之外其它外界因素对实验动物PD指标的影响。)的平均值曲线就可以作为不同药物处理组的该PD指标的参考曲线,从而削弱个体差异对于分析的影响。
[0057] 由于各个试验个体初始状态取值的变动是非常大的,甚至不能保证无病状态和有病初始状态之间的有序关系。因此,本发明选择基线方法,将刚刚发病的初始数据作为基线标准,考虑不同时间点的PD指标关于有病初始状态的观测值的差值,将这种随着时间点变化的差值作为药效的表观曲线。例如,对于某种药物的数据经过上述处理过程之后,可以看出对照组和给药组之间确实存在着较大差异,药物在动物模型上存在比较明显的疗效(如图4A-4C所示),因此可以应用该数据进行下一步PK-PD的关联分析研究。
[0058] 2、对于每种成分将每个相同的时间点下不同个体血清中该成分含量的差值作为解释变量,同时将相应个体的PD指标的差值作为响应变量,从而通过药物含量变化与药效变化之间的相关系数分析药动学与药效学之间的影响。这不但削弱了不同时间点的药物成分的滞后效应,而且可以间接增大样本量,提高分析的可靠度。
[0059] 本发明基于不同药物的各个成分的差值以及PD指标的差值分析两者的相关性,该方法可以削弱药物成分和PD指标关于时间的滞后效应,并在一定程度上实现了相关关系的线性化。注意到药物的起效时间有可能存在滞后效应,故而所测量的血清中的药物含量的变化不能直接对应于PD指标的变化,血药浓度较大的药物成分相比血药浓度较小的药物成分所造成的PD指标的变化量通常也会比较大,且变化规律满足一定的关系, 因此本发明对于每种成分将每个相同的时间点下不同个体血清中该成分含量的差值作为解释变量,同时将相应个体的PD指标的差值作为响应变量,从而通过药物含量变化与药效变化之间的相关系数分析药动学与药效学之间的影响。假设Yit是个体i在t时刻的某个药效的测量数值,Xit则是个体i在t时刻的某个成分的血药浓度,则可以定义:
[0060] ΔYt=Yit-Yjt;ΔXt=Xit-Xjt
[0061] 这样对于每种成分,在每个时间t总共可以得到 个组合,不但削弱了不同时间点的药物成分的滞后效应,而且可以间接增大样本量,提高分析的可靠度。
[0062] 第三个实施例:
[0063] 考虑到各个指标之间可能存在相互作用,而两两指标间的相关关系并不能通过完全表达这种作用,甚至可能出现假阳性的问题,为了进一步提高分析的准确性,在第二个实施例的基础上,本发明还提出了第三个实施例。
[0064] 在该方法中,对实际的观测数据进行稳健变换并消除个体差异之后,注意到实验组有可能不是1组,根据实验设计也可能是k组,本发明基于分布距离对不同组别PD指标的关系进行定性分析。
[0065] 考虑到PD指标比较大的变异性,因此不采用药效平均值,而是利用不同组别的PD指标在各个时间点关于对照组数据的分布距离判断各个组别之间的相似程度,进而推断不同组别药物的作用。这种曲线可以从总体上判断不同组别对于在某个PD指标的整体效果,因此所得结果具有一定整体性。
[0066] 基于分布距离对不同组别PD指标的关系进行定性分析,不妨假定观测指标共有s个有效时间点,该方法利用不同组别的PD指标在各个时间点关于对照组数据的分布距离判断各个组别之间的相似程度,进而推断不同组别药物的作用:由于试验组和对照组中每个组别在时间t的观测数据有n个离散取值,不妨假设为:{xt1,xt2,…,xtn},{yt1,yt2,…,ytn},那么第i个试 验组以及对照组的趋势函数分别表示为:
[0067]
[0068] 这里的I(xti<u)在数学上称为指示函数,意思是当观测值xti<u时取值为1,否则为0。由于趋势函数 (u)以及Gt(u)是阶梯函数,故而两个趋势函数的差值只有在试验组和对照组的观测数据{xt1,xt2,…,xtn}和{yt1,yt2,…,ytn}的观测点处才可能有不同取值。因此,计算分布距离时需要将两组数据混合,共有2n个分点,不妨表示为:{zt1,zt2,…,zt2n},则分布距离可以表示为:
[0069]
[0070] 然后将每个组别i在各个时间点t的 连接成趋势线,则可以比较各个组别的关系。
[0071] 如图5A-5C所示,曲线1表示对照组,曲线2表示人参组,曲线3代表元胡组,曲线4代表丹参组,星号线(★)则代表复方组。横轴是时间点,纵轴则是经过变换的表征药效的指标量Et。
[0072] 从图5A可以看出,曲线4表示的丹参组和星号线表示的复方组的效果在动脉收缩压上比较接近。从图5B可以看出,曲线4表示的丹参组和星号线表示的复方组的效果在心输出量等指标上也比较接近。但是,图5C示出,曲线4表示的丹参组和星号线表示的复方组的效果在QRS间期指标上两者则出现较大分离。这就提示两者相异的成分在QRS上有不同的效应或者存在相互作用,从而有助于分析不同成分的作用。
[0073] 上述实施例为本发明的典型的实施方式,但本发明并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。