一种血浆微生物物种多样性评估方法、装置和存储介质转让专利
申请号 : CN202110612817.4
文献号 : CN113355438B
文献日 : 2022-05-10
发明人 : 陈海新 , 黄毅 , 林小芳 , 刘久成 , 易鑫
申请人 : 深圳吉因加医学检验实验室 , 深圳吉因加信息科技有限公司
摘要 :
权利要求 :
1.一种非疾病诊断目的的血浆微生物物种多样性评估方法,其特征在于,包括:样本采集和测序步骤,包括:采集待测血浆样本,提取样本中的核酸,并将核酸中的RNA反转录为cDNA,对提取的DNA和cDNA进行建库和测序,获得待测血浆样本的测序数据;
还包括在提取的DNA和cDNA中添加非人源的外源参照核酸,获得混合核酸样本,对混合核酸样本进行建库和测序,使得待测血浆样本的测序数据中含有所述外源参照核酸的测序数据;
非人源序列获取步骤,包括:
获取待测血浆样本的测序数据,对测序数据进行质量控制,过滤接头和低质量碱基,以得到经过质控的测序数据;
以人源序列为参考基因组,将经过质控的测序数据和参考基因组进行比对,去除比对到参考基因组上的序列,以获得非人源序列;
非人源序列质控步骤,包括:
判断所述非人源序列的在测序数据中的占比是否在预设范围内;
若非人源序列的在测序数据中的占比不在预设范围内,则重新进行所述样本采集和测序步骤;
信息注释及合并步骤:基于kmer方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释,合并两种方法得到的注释结果,所述注释结果包括微生物物种及其丰度信息;
注释结果质控步骤,包括第一步质控和第二步质控;
所述第一步质控包括:
判断注释结果是否包含对所述外源参照核酸的注释;
若注释结果不包含所述外源参照核酸的注释结果,则重新进行所述信息注释及合并步骤,或者,重新对所述混合核酸样本进行建库和测序;
若注释结果包含外源参照核酸的注释结果,则第一步质控合格,进行第二步质控;
所述第二步质控包括:
将注释结果包含的微生物按丰度由高到低进行排序,获取丰度排序前预设个数的微生物在人群中的丰度分布,若注释结果中丰度排序前预设个数的任一微生物的丰度大于其在人群中最高丰度的2倍,则存在微生物污染,需要重新进行待测血浆样本采集;
若注释结果中丰度排序前预设个数的微生物的丰度均小于或等于其在人群中最高丰度的2倍,则第二步质控合格,进行后续的物种多样性评估步骤;
所述微生物物种多样性指数为Shannon指数;
物种多样性评估步骤:利用注释得到的微生物物种和丰度信息计算微生物物种多样性指数,以此评估待测血浆样本中微生物物种多样性。
2.根据权利要求1所述的血浆微生物物种多样性评估方法,其特征在于,所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基数的比值大于80%的reads或者N的占比小于5%的reads。
3.根据权利要求1所述的血浆微生物物种多样性评估方法,其特征在于,所述非人源序列的在测序数据中的占比的预设范围为0.001%‑1%。
4.根据权利要求1所述的血浆微生物物种多样性评估方法,其特征在于,所述外源参照核酸为pUC19质粒。
5.根据权利要求1所述的血浆微生物物种多样性评估方法,其特征在于,所述预设个数为5个。
6.一种血浆微生物物种多样性评估装置,所述装置包括:存储器,用于存储程序;处理器,用于通过执行所述存储器存储的程序以实现如权利要求1‑5任一项所述的血浆微生物物种多样性评估方法。
7.一种计算机可读存储介质,所述介质用于存储程序,所述程序能够被处理器执行以实现如权利要求1‑5任一项所述的血浆微生物物种多样性评估方法。
说明书 :
一种血浆微生物物种多样性评估方法、装置和存储介质
技术领域
背景技术
DNA,包括来源于宿主的和来源于微生物的游离DNA片段。通过检测人体血浆中微生物游离
DNA的来源和物种多样性,能够评估人体血浆微生物的生态平衡状态,为某些早期没有明显
症状的复杂疾病提供医疗预警。
进一步进行病原体分离鉴定,确定所感染的病原体并进行指导用药。
行培养,对于病毒以及一些较难培养的细菌无法获得培养结果;4)血培养阳性率较低,仅有
30%‑40%的血培养结果为阳性,即仅有30‑40%的血流感染可通过培养发现致病菌,从而
实现检测;5)血培养假阳性率较高,虽然部分样本可以得到血培养阳性结果,但由于皮肤消
毒不彻底或采血操作不规范常常会引起培养的假阳性,影响临床判断。
次也只能检测一个或几个病原体,检测灵敏度有限,对于临床应用具有很大局限。
发明内容
信息进行定量分析,得到微生物物种多样性指数,从而能够通过微生物物种多样性指数对
血浆样本的微生物物种多样性进行定量评估;此外,本申请只需受检者的血浆样本即可进
行液体活检,取样方便快捷,并且测序数据适用于低深度数据,检测成本更低,且支持甲基
化测序数据,可对同一个样本进行多维度分析。
待测血浆样本的测序数据中含有所述外源参照核酸的测序数据;
其在人群中最高丰度的2倍,则存在微生物污染,需要重新进行待测血浆样本采集;
微生物物种及其丰度信息进行定量分析,得到微生物物种多样性指数,从而能够通过微生
物物种多样性指数对血浆样本的微生物物种多样性进行定量评估;此外,本申请只需受检
者的血浆样本即可进行液体活检,取样方便快捷,并且测序数据适用于低深度数据,检测成
本更低,且支持甲基化测序数据,可对同一个样本进行多维度分析。
附图说明
具体实施方式
到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在
某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申
请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作
并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操
作。
见的方式进行顺序调换或调整。因此,说明书中的各种顺序只是为了清楚描述某一个实施
例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
样性,是血浆微生物检测的难点。
kmer是指将非人源序列reads分成包含k个碱基的字符串,一般长短为m的reads可以分成m‑
k+1个kmers,将获得的kmer匹配到微生物kmer数据库中进行快速检索,选择最优匹配结果
作为该非人源序列reads的注释信息,例如,kraken、kraken2、krakenUniq等软件均能通过
kmer方法对非人源序列进行微生物物种注释。蛋白比对方法是指将reads按照六种可能的
蛋白编码阅读框翻译为6种蛋白,与微生物蛋白数据库进行比对,选择最优比对结果作为该
reads的注释信息,如DIAMOND,Kaiju,和MMseqs2等软件均能通过蛋白比对方法对非人源序
列进行微生物物种注释。根据kmer方法和蛋白比对方法的注释结果和注释条数进行整合得
到非人源序列的微生物物种及其丰度信息。
种及其丰度信息之前还包括:
常称为Clean reads),也可以是对待测血浆样本进行预处理后提取核酸,将RNA反转录为
cDNA,对提取的DNA和反转录获得的cDNA构建测序文库,然后基于二代测序方法进行测序后
获得的原始数据(即FASTQ格式的raw data或raw reads,read或reads可翻译为序列或测序
序列),该原始数据还需要进行质控处理(即通常所说的去除低质量reads),具体地,根据原
始数据的序列组成以及序列质量,除去原始数据中包含接头序列的reads并过滤掉低质量
reads,其中,所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基
数的比值大于80%的reads或者N的占比小于5%的reads。
软件去除比对到参考基因组上的序列,获得待测血浆样本的非人源序列。
显著性差异,因而测序数据的非人源序列占比能作为一个质量控制指标,通过样本中非人
源序列的占比判断非人源序列是否满足下一步骤的分析要求。具体地,获得非人源序列之
后还包括非人源序列质控步骤,所述非人源序列质控步骤还包括:
的占比不满足该范围,则说明该非人源序列的占比异常,需要重进行样本采集和测序。
DNA、DNA成环处理、DNA滚环扩增形成DNA纳米球、固定DNA纳米球得到DNA纳米球阵列,对DNA
纳米球阵列进行测序,获得待测血浆样本的测序数据。
核酸样本,对混合核酸样本进行建库和测序,具体包括:DNA分段、末端修复处理、接头连接
处理、分离出单股DNA、DNA成环处理、DNA滚环扩增形成DNA纳米球、固定DNA纳米球得到DNA
纳米球阵列,对DNA纳米球阵列进行测序,使得待测血浆样本的测序数据中含有所述外源参
照核酸的测序数据。
其在人群中最高丰度的2倍,则存在微生物污染需要重新进行待测血浆样本采集;
丰度的2倍,则说明该微生物物种在血浆中的丰度异常,样品在实验过程中有可能受到该微
生物物种的污染,应当重新进行样本采集和测序步骤,或者重新对采集的待测血浆样本进
行DNA或RNA提取,或者排除污染源后重新对所述混合核酸样本进行建库和测序,以进行微
生物污染排查。
采取和待测血浆样本相同的实验操作,并按照上述方法进行微生物物种多样性评估,若所
述空白对照组出现微生物注释结果,则说明实验操作过程引入了微生物,第一步质控和第
二步质控之间还包括第三步质控:在将待测血浆样本的注释结果和空白对照样本的注释结
果进行比较,将待测血浆样本中和空白对照样本相同的注释结果进行剔除,而后对剔除后
的注释结果进行第二步质控,从而避免实验操作过程引入污染对后续分析结果造成影响。
写的程序分析包,例如diversity包。对于健康样本,其微生物物种多样性指数一般在一定
的范围内波动,如果待测血浆样本的微生物物种多样性指数超出该范围,则说明待测血浆
样本的微生物多样性过高或过低。例如,若待测血浆样本的shannon指数<4.5,则说明该样
本的微生物多样性过低,待测血浆样本的微生物平衡状态被打破,需要对待测血浆样本的
微生物分布情况进行进一步分析。
信息进行定量分析,得到微生物物种多样性指数,从而能够通过微生物物种多样性指数对
血浆样本的微生物物种多样性进行定量评估;此外,本申请只需受检者的血浆样本即可进
行液体活检,取样方便快捷,并且测序数据适用于低深度数据,检测成本更低,且支持甲基
化测序数据,可对同一个样本进行多维度分析。
通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可
以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述
功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上
述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现
时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质
中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通
过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
kraken的注释结果得到五列信息,第一列为文件名,第二列为微生物丰度,第三列为reads
条数,第四列为物种ID,第五列为物种的拉丁文名。其中,合并策略为kraken优先,表示当不
同软件注释结果有矛盾时,以kraken的注释结果为准。
知,待测血浆样本的shanon指数在正常范围内,也即待测血浆样本的微生物物种多样性处
于正常水平。
推演、变形或替换。