一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法转让专利

申请号 : CN201710152831.4

文献号 : CN106875367B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陆遥孙颖喻莎田皎林丽李赋

申请人 : 北京思创科泰科技有限公司

摘要 :

本发明公开了一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,包括下述步骤:生成鼻咽原发肿瘤区域的二值图像;去掉肿瘤最外层的不稳定数据;对模板CT的图像序列进行数据离散操作,将图像序列划分并生成对应三维网格;在三维的肿瘤区域内,对体素联合出现的频数进行统计,建立关联规则的数据库;读入需要勾画临床靶区的新病人大体肿瘤数据,使用胡关联规则,模拟肿瘤生长,自动勾画出临床放疗靶区。与目前人工勾画相比,本系统实现了勾画自动化,提高了医生的工作效率。勾画结果达到医生要求的勾画标准,局部的调整将作为后处理,提供给医生选择。

权利要求 :

1.一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,包括下述步骤:

S1、生成鼻咽原发肿瘤区域的二值图像,所述二值图像为:读入医生勾画好的肿瘤轮廓文件,对应肿瘤区域的图像像素格点置1,不含肿瘤区域的像素格点置0;

S2、去掉二值图像中肿瘤表面的不稳定数据,所述的不稳定数据是指:肿瘤表面的数据,由于拍片时间不同,会导致肿瘤表面最外层体素联合出现的频数计算出现误差;

S3、对模板CT的图像序列进行数据离散操作,将图像序列划分并生成对应三维网格;

S4、在三维的肿瘤区域内,对体素联合出现的频数进行统计,建立关联规则的数据库;

S5、读入需要勾画临床靶区的新病人大体肿瘤数据,使用互关联规则,模拟肿瘤生长,自动勾画出临床放疗靶区,具体为:以肿瘤边界处的三个相邻体素为索引,在频繁项集合数据库中,找出与该索引相关联的候选体素,再根据互关联规则,判断肿瘤下一步将侵犯的体素位置。

2.根据权利要求1所述基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,步骤S1中,所述肿瘤区域采用判断像素点是否在多边形内的方法InPolygon,分开非肿瘤与肿瘤区域。

3.根据权利要求1所述基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,步骤S2中,去掉二值图像中肿瘤表面的不稳定数据的方法为:对N例病人在模板CT图像上的肿瘤区域运用腐蚀算法imageerosion,去掉最外层的会对频数统计造成影响的不稳定数据,具体的,肿瘤区域erosion的计算公式为:式中B(x)是结构元素,对空间E中的每一点,结构元素B(x)平移之后,X为使B包含于E的点构成的集合。

4.根据权利要求1所述基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,步骤S3具体为:S301、将模板CT的图像序列进行网格化,将CT图像序列划分为width×height×zLen的三维网格,其中,width和height分别是一个CT切片横向和纵向上的格点数目,zLen为模板CT的层数,读取N例病人的GTV数据文件在模板CT上占位的网格号并存储。

5.根据权利要求1所述基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,步骤S4中,还包括下述步骤:S401、遍历生成的占位三维网格,生成频繁项集合,所述频繁项集,分为频繁一项集、频繁二项集、频繁三项集和频繁四项集,具体的生成方式如下:遍历之前步骤中生成的占位三维网格,统计每个属于GTV区域内部的体素格点在N例病人中出现的频数,记为频繁一项集;再依次统计空间上连续的两个体素格点,在所有病例中,同时出现的频数,记为频繁二项集;同理,再依次生成频繁三项集和频繁四项集,具体的判定连续的判断条件为:空间距离小于 的格点被认为连续。

6.根据权利要求1所述基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,步骤S5具体为:S501、读入需要勾画临床靶区的新病人大体肿瘤数据,对新病人的肿瘤区域进行网格化处理,生成新病人的频繁三项集;

S502、以肿瘤边界处的三个相邻体素组成的频繁三项集为索引,在频繁项集合数据库中,找出与该索引相关联的候选体素,并找出对应频繁四项集的频数,依据互关联规则,判断肿瘤下一步将侵犯的体素位置。

7.根据权利要求6所述基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,步骤S501具体为:计算该病人肿瘤区域的表面格点坐标,遍历所有边缘格点,以每一个格点为中心,在其周围x×y×z=5×5×3的立方体网格区内找寻空间位置连续的格点三项集{i,j,k},在此三项集的基础上,找寻一个位于肿瘤区外部并与该三项集在空间上连续的节点l,组成四项集{i,j,k,l}。

8.根据权利要求7所述基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,其特征在于,步骤S502中,肿瘤是否会扩散到l号格点的计算公式为:式中P(l)是需要考虑的是否新增的潜在肿瘤扩散点,l,i,j,k为中离散化的网格序号,Freset3和Freset4的值分别表示{i,j,k}和ascent{l,i,j,k}频繁项点集在N例GTV中出现的频数,ascent{l,i,j,k}表示对集合{l,i,j,k}进行升序排列;其中,三项集由肿瘤区域内部的体素格点组成,且至少包含一个肿瘤边缘格点,四项集中的新增点为空间上与三项集相邻的肿瘤区域外的点;T表示一个频繁度阈值,多次试验之后,由临床医生根据经验选择0.5作为判断是否扩散的标准阈值;Freset4/Freset3的计算依据为概率统计中的P(B|A)=P(AB)/P(A),即:在A发生的条件下,同时发生B的概率,因此,Freset4(ascent{l,i,j,k})/Freset3(i,j,k)可理解为,在(i,j,k)这三个相邻体素点已被肿瘤侵犯时,与之相邻的体素点l,被包括在肿瘤扩散危险区域的概率,P(l)=1时,表示l体素点属于危险区域,需要被预防照射;反之,则不需要将l体素点勾画进预防照射区域。

说明书 :

一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画

方法

技术领域

[0001] 本发明涉及模拟肿瘤扩散的研究领域,特别涉及一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法。

背景技术

[0002] 调强放射治疗(IntensityModulatedRadiationTherapy,IMRT)是目前治疗鼻咽癌的主流放疗技术,精确的靶区勾画是临床放疗计划成功的前提,对鼻咽癌的治疗、治疗方案各项参数的统计学评估以及病人治疗后的生活质量,都有着极为关键的影响。目前,靶区勾画主要依赖医生的手动勾画。现医院使用的ABAS靶区勾画系统实现了在三维方向上,硬性扩展医生指定的数值范围作为预防照射靶区,之后,再根据医生的临床经验,结合ICRU(InternationalCommissionRadiologicalUnits,83report,2010)给出的大概勾画标准,对结果进行修改。
[0003] 手动勾画的靶区,由于观察者之间存在的主观勾画差异,导致靶区的勾画结果出现很大的差别。这样的差异,给后续的治疗、治疗方案效果及参数的统一评估造成了影响。同时,医生针对一个病人的靶区勾画,通常需要至少2-3个小时。现存的ABAS靶区勾画系统只能实现在三维方向上,硬性扩展用户指定的数值范围作为预防照射靶区。

发明内容

[0004] 本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,方法首次被应用于肿瘤扩散模型模拟,不仅提高了医生的工作效率,同时能够给后续放疗计划提供精确的预测区域,并对后续治疗方案、剂量体积参数的评估和晚期损伤的相关性研究提供一个条件一致的评估基础平台。
[0005] 为了达到上述目的,本发明采用以下技术方案:
[0006] 本发明的一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,包括下述步骤:
[0007] S1、生成鼻咽原发肿瘤区域的二值图像,所述二值图像为:读入医生勾画好的肿瘤轮廓文件,对应肿瘤区域的图像像素格点置1,不含肿瘤区域的像素格点置0;
[0008] S2、去掉二值图像中肿瘤表面的不稳定数据,所述的不稳定数据是指:肿瘤表面的数据,由于拍片时间不同,会导致肿瘤表面最外层体素联合出现的频数计算出现误差;
[0009] S3、对模板CT的图像序列进行数据离散操作,将图像序列划分并生成对应三维网格;
[0010] S4、在三维的肿瘤区域内,对体素联合出现的频数进行统计,建立关联规则的数据库;
[0011] S5、读入需要勾画临床靶区的新病人大体肿瘤数据,使用胡关联规则,模拟肿瘤生长,自动勾画出临床放疗靶区,具体为:以肿瘤边界处的三个相邻体素为索引,在频繁项集合数据库中,找出与该索引相关联的候选体素,再根据互关联规则,判断肿瘤下一步将侵犯的体素位置。
[0012] 作为优选的技术方案,步骤S1中,所述肿瘤区域采用判断像素点是否在多边形内的方法InPolygon,分开非肿瘤与肿瘤区域。
[0013] 作为优选的技术方案,步骤S2中,去掉二值图像中肿瘤表面的不稳定数据的方法为:
[0014] 对N例病人在模板CT图像上的肿瘤区域运用腐蚀算法imageerosion,去掉最外层的会对频数统计造成影响的不稳定数据,具体的,肿瘤区域erosion的计算公式为:
[0015]
[0016] 式中B(x)是结构元素,对空间E中的每一点,结构元素B(x)平移之后,X为使B包含于E的点构成的集合。
[0017] 作为优选的技术方案,步骤S3具体为:
[0018] S301、将模板CT的图像序列进行网格化,将CT图像序列划分为width×height×zLen的三维网格,其中,width和height分别是一个CT切片横向和纵向上的格点数目,zLen为模板CT的层数,读取N例病人的GTV数据文件在模板CT上占位的网格号并存储。
[0019] 作为优选的技术方案,步骤S4中,还包括下述步骤:S401、遍历生成的占位三维网格,生成频繁项集合,所述频繁项集,分为频繁一项集、频繁二项集、频繁三项集和频繁四项集,具体的生成方式如下:
[0020] 遍历之前步骤中生成的占位三维网格,统计每个属于GTV区域内部的体素格点在N例病人中出现的频数,记为频繁一项集;再依次统计空间上连续的两个体素格点,在所有病例中,同时出现的频数,记为频繁二项集;同理,再依次生成频繁三项集和频繁四项集,具体的判定连续的判断条件为:空间距离小于 的格点被认为连续。
[0021] 作为优选的技术方案,步骤S5具体为:
[0022] S501、读入需要勾画临床靶区的新病人大体肿瘤数据,对新病人的肿瘤区域进行网格化处理,生成新病人的频繁三项集;
[0023] S502、以肿瘤边界处的三个相邻体素组成的频繁三项集为索引,在频繁项集合数据库中,找出与该索引相关联的候选体素,并找出对应频繁四项集的频数,依据互关联规则,判断肿瘤下一步将侵犯的体素位置。
[0024] 作为优选的技术方案,步骤S501具体为:
[0025] 计算该病人肿瘤区域的表面格点坐标,遍历所有边缘格点,以每一个格点为中心,在其周围x×y×z=5×5×3的立方体网格区内找寻空间位置连续的格点三项集{i,j,k},在此三项集的基础上,找寻一个位于肿瘤区外部并与该三项集在空间上连续的节点l,组成四项集{i,j,k,l}。
[0026] 作为优选的技术方案,步骤S502中,肿瘤是否会扩散到l号格点的计算公式为:
[0027]
[0028] 式中P(l)是需要考虑的是否新增的潜在肿瘤扩散点,l,i,j,k为中离散化的网格序号,Freset3和Freset4的值分别表示{i,j,k}和ascent{l,i,j,k}频繁项点集在N例GTV中出现的频数,ascent{l,i,j,k}表示对集合{l,i,j,k}进行升序排列;其中,三项集由肿瘤区域内部的体素格点组成,且至少包含一个以上肿瘤边缘格点,四项集中的新增点为空间上与三项集相邻的肿瘤区域外的点;T表示一个频繁度阈值,多次试验之后,由临床医生根据经验选择0.5作为判断是否扩散的标准阈值;Freset4/Freset3的计算依据为概率统计中的P(B|A)=P(AB)/P(A),即:在A发生的条件下,同时发生B的概率,因此,Freset4(ascent{l,i,j,k})/Freset3(i,j,k)可理解为,在(i,j,k)这三个相邻体素点已被肿瘤侵犯时,与之相邻的体素点l,被包括在肿瘤扩散危险区域的概率,P(l)=1时,表示l体素点属于危险区域,需要被预防照射;反之,则不需要将l体素点勾画进预防照射区域。
[0029] 本发明与现有技术相比,具有如下优点和有益效果:
[0030] 1、与现有方法相比,本发明基于大量的训练集,能够自动精确地勾画出预防照射靶区,在现存的ABAS靶区勾画系统只能实现在三维方向上,硬性扩展用户指定的数值范围作为预防照射靶区。
[0031] 2、与目前人工勾画相比,本系统实现了勾画自动化,提高了医生的工作效率,勾画结果达到医生要求的勾画标准,局部的调整将作为后处理,提供给医生选择。
[0032] 3、本发基于大量的经临床验证治疗有效的训练集,创新性的提出使用互关联规则算法Apriori,用来模拟肿瘤生长的模型。通过Apriori算法猜测顾客的消费习惯的模式,将NPC肿瘤在局部位置之间的扩散行为看作是有互关联性,通过统计找出这一规律,统计频繁的同时出现肿瘤的图像子区域,并挖掘这些子区域之间互现关联的规律,生成频繁项集和互关联关系的数据库;进而,在已知新病人GTV的情况下,预测GTV扩散的行为,最终实现CTV的自动勾画。

附图说明

[0033] 图1是本发明方法的二值图像生成示意图。
[0034] 图2是本发明方法中的频繁项数据集生成示意图。
[0035] 图3是本发明方法中,基于互关联规则的CTV预测过程示意图。
[0036] 图4是本发明方法的一个实施例的程序流程图。

具体实施方式

[0037] 下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
[0038] 本发明中的相关术语如下所示:
[0039] 鼻咽癌(Nasopharyngeal Carclnoma,NPC):是指发生于鼻咽腔顶部和侧壁的恶性肿瘤,也被称为“广东瘤”,根据世界卫生组织调查报告,全球有80%的鼻咽癌患者在中国。
[0040] 肿瘤区(grosstumorvolume,GTV):指临床可见、可通过诊疗检查手段(包括CT和MRI)证实的肿瘤范围。
[0041] 鼻咽癌原发病灶临床靶区(clinicaltargetvolume,CTV):除包含GTV外,还包括显微镜下可见的、亚临床灶以及肿瘤可能侵犯的范围。
[0042] Apriori互关联算法:是一种挖掘关联规则的频繁项集算法,主要包括候选集生成和情节的向下封闭检测两个阶段。
[0043] 计算机断层扫描(ComputedTomography,CT):利用精确准直的X线束、γ射线、超声波等,与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描,具有扫描时间快,图像清晰等特点,可用于多种疾病的检查。
[0044] 像素(pixel):图像元素的简称。像素是构成数码影像的基本单元,是二维空间的最小单位。
[0045] 体素(voxel):三维图像体积元素的简称。数字数据于三维空间分割上的最小单位,用于三维成像、医学影像等领域。概念类似于二维空间的最小单位——像素。
[0046] 实施例
[0047] 本实施例一种基于互关联规则的鼻咽癌原发病灶临床靶区自动勾画方法,包括下述步骤:
[0048] S1、生成鼻咽原发肿瘤区域的二值图像,如图1所示,二值图像生成的具体步骤为:
[0049] S101、读入医生勾画好的肿瘤轮廓文件,对应肿瘤区域的图像像素格点置1,不含肿瘤区域的像素格点置0。
[0050] 所述肿瘤区域将运用判断像素点是否在多边形内的方法(InPolygon),分开非肿瘤区域与肿瘤区域。具体的InPolygon的计算公式为:
[0051] IN=InPolygon(x,y,xv,yv)
[0052] 式中IN为输出的二值图像,其尺寸与原始输入CT图像I(x,y)相同,(x,y)为像素点的坐标,(xv,yv)为GTV轮廓上的点坐标。
[0053] S2、去掉肿瘤外层不稳定数据;
[0054] 所述的不稳定数据,是指肿瘤表面的数据,由于拍片时间不同,会导致肿瘤表面最外层体素联合出现的频数计算出现误差。因此,首先要对N例病人在模板CT图上的肿瘤区域运用腐蚀算法。具体的,肿瘤区域erosion的计算公式为:
[0055]
[0056] 式中B(x)是结构元素,对空间E中的每一点,结构元素B(x)平移之后,X为使B包含于E的点构成的集合。我们所选的结构元素是一个3×3的结构,由此,最外层的数据将会被移除。
[0057] S3、生成基于互关联规则的频繁项集,如图2所示,具体包括:
[0058] S301、生成三维网格;
[0059] 把二值图像序列按照其所在不同的CT层面,生成三维网格。具体的生成方式为:按照每个格子表示2×0.9765625mm物理距离,将图像序列划分为格点数目为width×height×zLen的三维网格。width和height的值,由N例病人中肿瘤所侵犯的区域决定,zLen为模板CT的层数。
[0060] S4、在三维的肿瘤区域内,对体素联合出现的频数进行统计,建立关联规则的数据库。
[0061] S401、基于上述步骤生成的二值图像组成的三维网格,统计频繁项集。
[0062] 具体分为:遍历整个三维网格,统计在N例病人中,单个体素出现的频数(称为频繁一项集),空间上相邻两个体素同时被肿瘤侵犯的频数集合(频繁二项集)、相邻三个体素同时被肿瘤侵犯的频数集合(频繁三项集)及相邻四个体素同时被肿瘤侵犯的频数集合(频繁四项集)。频繁项集保存为:
[0063]
[0064] 式中m的具体计算公式为:
[0065] m=z×(width×height)+(x-1)×(height)+y
[0066] (x,y)为像素点在CT切片中的坐标位置,z为像素点所在的CT层面。num的数值则表示当前频繁项在N例病例中出现的频数。频繁项集合中的具体每一个频繁项存储满足数值升序排列及在空间上相邻。
[0067] S5、读入需要勾画临床靶区的新病人大体肿瘤数据,如图3所示,使用互关联规则,模拟肿瘤生长,勾画CTV,具体包括:
[0068] S501、读入需要勾画临床靶区的新病人大体肿瘤数据,对新病人的肿瘤区域进行网格化处理,生成新病人的频繁三项集。
[0069] 具体分为,计算该病人肿瘤区域的表面格点坐标(三维层面),遍历所有边缘格点,以每一个格点为中心,在其周围x×y×z=5×5×3的立方体网格区内找寻空间位置连续的格点三项集{i,j,k}。在此三项集的基础上,找寻一个位于肿瘤区外部并与该三项集在空间上连续的节点l,组成四项集{i,j,k,l}。
[0070] S502、以肿瘤边界处的三个相邻体素组成的三项集为索引,在频繁项集数据库中,找出与该索引相关联的候选体素,并找出对应频繁四项集的频数。依据互关联规则,判断肿瘤下一步将侵犯的体素位置。
[0071] 具体的肿瘤是否会扩散到l号格点的计算公式为:
[0072]
[0073] 式中P(l)是需要考虑的是否新增的潜在肿瘤扩散点,l,i,j,k为步骤S501中离散化的网格序号。Freset3和Freset4的值,分别表示{i,j,k}和ascent{l,i,j,k}频繁项点集在N例GTV中出现的频数,ascent{l,i,j,k}表示对集合{l,i,j,k}进行升序排列。其中,三项集由肿瘤区域内部的体素格点组成,且至少包含一个以上肿瘤边缘格点,四项集中的新增点为空间上与三项集相邻的肿瘤区域外的点。T表示一个频繁度阈值,多次试验之后,由临床医生根据经验选择0.5作为判断是否扩散的标准阈值。Freset4/Freset3的计算依据为概率统计中的P(B|A)=P(AB)/P(A),即:在A发生的条件下,同时发生B的概率。因此,Freset4(ascent{l,i,j,k})/Freset3(i,j,k)可理解为,在(i,j,k)这三个相邻体素点已被肿瘤侵犯时,与之相邻的体素点l,被包括在肿瘤扩散危险区域的概率。P(l)=1时,表示l体素点属于危险区域,需要被预防照射。反之,则不需要将l体素点勾画进预防照射区域。优选的,步骤S5中,循环上限的次数为m次,如图4所示。
[0074] 第一种情况:
[0075] 即在频繁项集中,当前频繁四项集ascent{l,i,j,k}在M例病人中出现的频数,与肿瘤边界处的空间上相邻的三项集{i,j,k}在M例病人中出现的频数的比例大于0.5;比如说,我们认为在1000例病人中,假设{i,j,k}的频数为900,那么只有当ascent{l,i,j,k}在1000例病人数据中,同时出现的频数大于450例时,我们才会认为肿瘤边界外的体素点l属于会被肿瘤扩散的风险区域。
[0076] 第二种情况:
[0077] 与第一种情况类似。
[0078] 本发明实施方式提供的一种基于互关联规则的自动勾画鼻咽癌放射治疗临床靶区的方法,提供一种基于模拟肿瘤生长模型的全自动计算机勾画方法。该方法首次被应用于肿瘤扩散模型模拟,不仅提高了医生的工作效率,同时能够给后续放疗计划提供精确的预测区域,并对后续治疗方案、剂量体积参数的评估和晚期损伤的相关性研究提供了一个条件一致的评估基础平台。
[0079] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。