一种血浆微生物物种多样性评估方法、装置和存储介质转让专利

申请号 : CN202110612817.4

文献号 : CN113355438B

文献日 : 2022-05-10

本申请公开了一种血浆微生物物种多样性评估方法、装置和存储介质，方法包括信息注释及合并步骤、物种多样性评估步骤。本申请通过两种不同的算法对血浆样本的非人源序列进行注释，以获取微生物物种及其丰度信息，并且对血浆样本的微生物物种及其丰度信息进行定量分析，得到微生物物种多样性指数，从而能够通过微生物物种多样性指数对血浆样本的微生物物种多样性进行定量评估；此外，本申请只需受检者的血浆样本即可进行液体活检，取样方便快捷，并且测序数据适用于低深度数据，检测成本更低，且支持甲基化测序数据，可对同一个样本进行多维度分析。

1.一种非疾病诊断目的的血浆微生物物种多样性评估方法，其特征在于，包括：样本采集和测序步骤，包括：采集待测血浆样本，提取样本中的核酸，并将核酸中的RNA反转录为cDNA，对提取的DNA和cDNA进行建库和测序，获得待测血浆样本的测序数据；

还包括在提取的DNA和cDNA中添加非人源的外源参照核酸，获得混合核酸样本，对混合核酸样本进行建库和测序，使得待测血浆样本的测序数据中含有所述外源参照核酸的测序数据；

非人源序列获取步骤，包括：

获取待测血浆样本的测序数据，对测序数据进行质量控制，过滤接头和低质量碱基，以得到经过质控的测序数据；

以人源序列为参考基因组，将经过质控的测序数据和参考基因组进行比对，去除比对到参考基因组上的序列，以获得非人源序列；

非人源序列质控步骤，包括：

判断所述非人源序列的在测序数据中的占比是否在预设范围内；

若非人源序列的在测序数据中的占比不在预设范围内，则重新进行所述样本采集和测序步骤；

信息注释及合并步骤：基于kmer方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释，合并两种方法得到的注释结果，所述注释结果包括微生物物种及其丰度信息；

注释结果质控步骤，包括第一步质控和第二步质控；

所述第一步质控包括：

判断注释结果是否包含对所述外源参照核酸的注释；

若注释结果不包含所述外源参照核酸的注释结果，则重新进行所述信息注释及合并步骤，或者，重新对所述混合核酸样本进行建库和测序；

若注释结果包含外源参照核酸的注释结果，则第一步质控合格，进行第二步质控；

所述第二步质控包括：

将注释结果包含的微生物按丰度由高到低进行排序，获取丰度排序前预设个数的微生物在人群中的丰度分布，若注释结果中丰度排序前预设个数的任一微生物的丰度大于其在人群中最高丰度的2倍，则存在微生物污染，需要重新进行待测血浆样本采集；

若注释结果中丰度排序前预设个数的微生物的丰度均小于或等于其在人群中最高丰度的2倍，则第二步质控合格，进行后续的物种多样性评估步骤；

所述微生物物种多样性指数为Shannon指数；

物种多样性评估步骤：利用注释得到的微生物物种和丰度信息计算微生物物种多样性指数，以此评估待测血浆样本中微生物物种多样性。

2.根据权利要求1所述的血浆微生物物种多样性评估方法，其特征在于，所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基数的比值大于80％的reads或者N的占比小于5％的reads。

3.根据权利要求1所述的血浆微生物物种多样性评估方法，其特征在于，所述非人源序列的在测序数据中的占比的预设范围为0.001%‑1%。

4.根据权利要求1所述的血浆微生物物种多样性评估方法，其特征在于，所述外源参照核酸为pUC19质粒。

5.根据权利要求1所述的血浆微生物物种多样性评估方法，其特征在于，所述预设个数为5个。

6.一种血浆微生物物种多样性评估装置，所述装置包括：存储器，用于存储程序；处理器，用于通过执行所述存储器存储的程序以实现如权利要求1‑5任一项所述的血浆微生物物种多样性评估方法。

7.一种计算机可读存储介质，所述介质用于存储程序，所述程序能够被处理器执行以实现如权利要求1‑5任一项所述的血浆微生物物种多样性评估方法。

一种血浆微生物物种多样性评估方法、装置和存储介质

技术领域

[0001] 本申请涉及微生物检测领域，具体涉及一种血浆微生物物种多样性评估方法、装置和存储介质。

背景技术

[0002] 基于宿主与微生物的关系，宿主中的微生物可分为多种，包括正常菌群、与宿主共生的包括寄生的微生物、引起机体感染致病的微生物——病原体等。宿主的血浆含有游离
DNA，包括来源于宿主的和来源于微生物的游离DNA片段。通过检测人体血浆中微生物游离
DNA的来源和物种多样性，能够评估人体血浆微生物的生态平衡状态，为某些早期没有明显
症状的复杂疾病提供医疗预警。

[0003] 传统的血浆微生物检测方法为血培养，即通过对患者血液进行采集并装入含有培养基的瓶中进行培养，以此来确定使得患者致病的微生物。通常血培养发现阳性后，还需要
进一步进行病原体分离鉴定，确定所感染的病原体并进行指导用药。

[0004] 但是，血培养存在以下不足：1)需要的采血量较大，一般成人需要20‑30ml，婴儿需要2ml以上；2)血培养周期较长，最少需要3‑4天时间；3)血培养只能针对部分细菌或真菌进
行培养，对于病毒以及一些较难培养的细菌无法获得培养结果；4)血培养阳性率较低，仅有
30％‑40％的血培养结果为阳性，即仅有30‑40％的血流感染可通过培养发现致病菌，从而
实现检测；5)血培养假阳性率较高，虽然部分样本可以得到血培养阳性结果，但由于皮肤消
毒不彻底或采血操作不规范常常会引起培养的假阳性，影响临床判断。

[0005] 此外，随着分子生物学的研究和发展，基于核酸序列的病原体检测技术逐渐发展。但其应用于血浆微生物检测的案例较少，绝大部分只针对血液中的病毒进行检测，并且，一
次也只能检测一个或几个病原体，检测灵敏度有限，对于临床应用具有很大局限。

[0006] 由此可见，现有技术往往是针对已经致病的微生物进行检测，并且检测的微生物种类有限，如何对血浆微生物物种多样性进行检测，是血浆微生物检测的难点。

发明内容

[0007] 本申请的目的是提供一种血浆微生物物种多样性评估方法、装置和存储介质。

[0008] 为了实现上述目的，本申请采用了以下技术方案：

[0009] 本申请的第一方面公开了一种血浆微生物物种多样性评估方法，包括：

[0010] 信息注释及合并步骤：基于kmer方法和蛋白比对方法分别对非人源序列进行注释，合并两种方法得到的注释结果，所述注释结果包括微生物物种及其丰度信息；

[0011] 物种多样性评估步骤：利用所述注释结果计算微生物物种多样性指数，根据所述微生物物种多样性指数评估待测血浆样本中微生物物种多样性。

[0012] 值得说明的是，本申请通过两种不同的算法对DNA测序数据的非人源序列进行注释，以获取血浆样本的微生物物种及其丰度信息，并且对血浆样本的微生物物种及其丰度
信息进行定量分析，得到微生物物种多样性指数，从而能够通过微生物物种多样性指数对
血浆样本的微生物物种多样性进行定量评估；此外，本申请只需受检者的血浆样本即可进
行液体活检，取样方便快捷，并且测序数据适用于低深度数据，检测成本更低，且支持甲基
化测序数据，可对同一个样本进行多维度分析。

[0013] 本申请的一种实现方式中，所述信息注释及合并步骤之前还包括非人源序列获取步骤，所述非人源序列获取步骤包括：

[0014] 获取待测血浆样本的测序数据，对测序数据进行质量控制，过滤接头和低质量碱基，以得到经过质控的测序数据；

[0015] 以人源序列为参考基因组，将经过质控的测序数据和参考基因组进行比对，去除比对到参考基因组上的序列，以获得非人源序列；

[0016] 优选的，所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基数的比值大于80％的reads或者N的占比小于5％的reads。

[0017] 本申请的一种实现方式中，所述非人源序列获取步骤之前还包括样本采集和测序步骤，所述样本采集和测序步骤包括：

[0018] 采集待测血浆样本，提取样本中的核酸，将核酸中的RNA反转录为cDNA，对提取的DNA或cDNA进行建库和测序，获得待测血浆样本的测序数据。

[0019] 本申请的一种实现方式中，所述非人源序列获取步骤之后还包括非人源序列质控步骤，所述非人源序列质控步骤还包括：

[0020] 判断所述非人源序列的在测序数据中的占比是否在预设范围内；

[0021] 若非人源序列的在测序数据中的占比不在合预设范围内，则重新进行所述样本采集和测序步骤；

[0022] 优选的，所述非人源序列的在测序数据中的占比的预设范围为0.0001％‑1％。

[0023] 本申请的一种实现方式中，所述样本采集和测序步骤还包括，在提取的DNA或cDNA中添加非人源的外源参照核酸，获得混合核酸样本，对混合核酸样本进行建库和测序，使得
待测血浆样本的测序数据中含有所述外源参照核酸的测序数据；

[0024] 优选的，所述外源参照核酸为pUC19质粒。

[0025] 本申请的一种实现方式中，所述信息注释及合并步骤之后还包括注释结果质控步骤，所述注释结果质控步骤包括第一步质控和第二步质控；

[0026] 所述第一步质控包括：

[0027] 判断注释结果是否包含所述对外源参照核酸的注释；

[0028] 若注释结果不包含所述外源参照核酸的注释结果，则重新进行所述信息注释及合并步骤，或者，重新对所述混合核酸样本进行建库和测序；

[0029] 若注释结果包含外源参照核酸的注释结果，则第一步质控合格，进行第二步质控；

[0030] 所述第二步质控包括：

[0031] 将注释结果包含的微生物按丰度由高到低进行排序，获取丰度排序前预设个数的微生物在人群中的丰度分布，若注释结果中丰度排序前预设个数的任一微生物的丰度大于
其在人群中最高丰度的2倍，则存在微生物污染，需要重新进行待测血浆样本采集；

[0032] 若注释结果中丰度排序前预设个数的微生物的丰度均小于或等于其在人群中最高丰度的2倍，则第二步质控合格，进行后续的物种多样性评估步骤；

[0033] 优选的，所述预设个数为5个。

[0034] 本申请的一种实现方式中，所述微生物物种多样性指数包括Shannon指数、Simpson指数、chao指数中的至少一种。

[0035] 本申请的第二方面公开了一种血浆微生物物种多样性评估装置，其特征在于，包括：

[0036] 信息注释及合并模块：用于基于kmer方法和蛋白比对方法分别对非人源序列进行注释，合并两种方法得到的注释结果，所述注释结果包括微生物物种及其丰度信息；

[0037] 物种多样性评估模块：用于利用注释得到的微生物物种和丰度信息计算微生物物种多样性指数，以此评估待测血浆样本中微生物物种多样性。

[0038] 本申请的第三方面公开了一种血浆微生物物种多样性评估装置，所述装置包括：

[0039] 存储器，用于存储程序；处理器，用于通过执行所述存储器存储的程序以实现上述一种血浆微生物物种多样性评估方法。

[0040] 本申请的第四方面公开了一种计算机可读存储介质，所述介质用于存储程序，所述程序能够被处理器执行以实现上述一种血浆微生物物种多样性评估方法。

[0041] 由于采用以上技术方案，本申请的有益效果在于：

[0042] 本申请的血浆微生物物种多样性评估方法，通过两种不同的算法对DNA测序数据的非人源序列进行注释，以获取血浆样本的微生物物种及其丰度信息，并且对血浆样本的
微生物物种及其丰度信息进行定量分析，得到微生物物种多样性指数，从而能够通过微生
物物种多样性指数对血浆样本的微生物物种多样性进行定量评估；此外，本申请只需受检
者的血浆样本即可进行液体活检，取样方便快捷，并且测序数据适用于低深度数据，检测成
本更低，且支持甲基化测序数据，可对同一个样本进行多维度分析。

附图说明

[0043] 图1为本申请实施例提供的一种血浆微生物物种多样性评估方法的流程框图；

[0044] 图2为本申请实施例中提供的一种血浆微生物物种多样性评估装置的结构框图。

具体实施方式

[0045] 下面通过具体实施方式对本申请作进一步详细说明。在以下的实施方式中，很多细节描述是为了使得本申请能被更好的理解。然而，本领域技术人员可以毫不费力的认识
到，其中部分特征在不同情况下是可以省略的，或者可以由其他元件、材料、方法所替代。在
某些情况下，本申请相关的一些操作并没有在说明书中显示或者描述，这是为了避免本申
请的核心部分被过多的描述所淹没，而对于本领域技术人员而言，详细描述这些相关操作
并不是必要的，他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操
作。

[0046] 另外，说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时，方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易
见的方式进行顺序调换或调整。因此，说明书中的各种顺序只是为了清楚描述某一个实施
例，并不意味着是必须的顺序，除非另有说明其中某个顺序是必须遵循的。

[0047] 现有技术往往是针对已经致病的微生物进行检测，检测周期长，并且检测的微生物种类有限，如何对血浆中所有微生物进行快速检测，并定量分析血浆中微生物物种的多
样性，是血浆微生物检测的难点。

[0048] 为了解决上述问题，如图1所示，本实施例提供了一种血浆微生物物种多样性评估方法，包括：

[0049] S201：基于kmer方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释，合并两种方法得到的注释结果，所述注释结果包括微生物物种及其丰度信息。

[0050] 具体地，血浆样本通过处理血液样本得到，待测血浆样本的非人源序列通过提取血浆中的核酸，对核酸的至少一部分进行序列测定，以获得待测血浆样本的非人源序列。
kmer是指将非人源序列reads分成包含k个碱基的字符串，一般长短为m的reads可以分成m‑
k+1个kmers，将获得的kmer匹配到微生物kmer数据库中进行快速检索，选择最优匹配结果
作为该非人源序列reads的注释信息，例如，kraken、kraken2、krakenUniq等软件均能通过
kmer方法对非人源序列进行微生物物种注释。蛋白比对方法是指将reads按照六种可能的
蛋白编码阅读框翻译为6种蛋白，与微生物蛋白数据库进行比对，选择最优比对结果作为该
reads的注释信息，如DIAMOND，Kaiju，和MMseqs2等软件均能通过蛋白比对方法对非人源序
列进行微生物物种注释。根据kmer方法和蛋白比对方法的注释结果和注释条数进行整合得
到非人源序列的微生物物种及其丰度信息。

[0051] 本实施例的一种实现方式中，所述基于kmer方法和蛋白比对方法分别对待测血浆样本的非人源序列进行注释，合并两种方法得到的注释结果，所述注释结果包括微生物物
种及其丰度信息之前还包括：

[0052] 获取待测血浆样本的测序数据，对测序数据进行质量控制，过滤接头和低质量碱基，以得到经过质控的测序数据；

[0053] 以人源序列为参考基因组，将经过质控的测序数据和参考基因组进行比对，去除比对到参考基因组上的序列，以获得非人源序列。

[0054] 具体的，血浆样本的测序数据为待测血浆样本的高通量测序数据，也即二代测序数据(NGS数据)，此处的待测样本的测序数据可以是已有的经过质控处理后的NGS数据(通
常称为Clean reads)，也可以是对待测血浆样本进行预处理后提取核酸，将RNA反转录为
cDNA，对提取的DNA和反转录获得的cDNA构建测序文库，然后基于二代测序方法进行测序后
获得的原始数据(即FASTQ格式的raw data或raw reads，read或reads可翻译为序列或测序
序列)，该原始数据还需要进行质控处理(即通常所说的去除低质量reads)，具体地，根据原
始数据的序列组成以及序列质量，除去原始数据中包含接头序列的reads并过滤掉低质量
reads，其中，所述低质量碱基包括低质量碱基序列中质量值小于20的碱基数占序列总碱基
数的比值大于80％的reads或者N的占比小于5％的reads。

[0055] 本实施例的一种具体实现方式中，以人源序列hg19或者是grch38为参考基因组，利用比对软件bwa或bowtie2将经过质控的测序数据和参考基因组进行比对，利用samtools
软件去除比对到参考基因组上的序列，获得待测血浆样本的非人源序列。

[0056] 在实际研究中，通过收集五百多个健康样本和癌症样本进行分析统计，计算每个样本的测序数据中非人源序列的占比，发现健康样本和癌症样本之间的非人源序列占比无
显著性差异，因而测序数据的非人源序列占比能作为一个质量控制指标，通过样本中非人
源序列的占比判断非人源序列是否满足下一步骤的分析要求。具体地，获得非人源序列之
后还包括非人源序列质控步骤，所述非人源序列质控步骤还包括：

[0057] 判断所述非人源序列的在测序数据中的占比是否在预设范围内；

[0058] 若非人源序列的在测序数据中的占比不在合预设范围内，则重新进行所述样本采集和测序步骤。

[0059] 本实施例的一个具体实现方式中，所述非人源序列的在测序数据中的占比的预设范围为0.001％‑1％，将该非人源序列占比范围作为非人源序列的质控标准，若非人源序列
的占比不满足该范围，则说明该非人源序列的占比异常，需要重进行样本采集和测序。

[0060] 本实施例的一种实现方式中，获取待测血浆样本的测序数据之前还包括样本采集和测序步骤，所述样本采集和测序步骤包括：

[0061] 采集待测血浆样本并提取样本中的核酸，将RNA反转录为cDNA，对提取的DNA和反转录获得的cDNA依序进行以下处理：DNA分段、末端修复处理、接头连接处理、分离出单股
DNA、DNA成环处理、DNA滚环扩增形成DNA纳米球、固定DNA纳米球得到DNA纳米球阵列，对DNA
纳米球阵列进行测序，获得待测血浆样本的测序数据。

[0062] 本实施例的一种实现方式中，为了确保注释结果的可靠性，所述样本采集和测序步骤还包括，在提取的核酸中，将RNA反转录为cDNA，添加非人源的外源参照核酸，获得混合
核酸样本，对混合核酸样本进行建库和测序，具体包括：DNA分段、末端修复处理、接头连接
处理、分离出单股DNA、DNA成环处理、DNA滚环扩增形成DNA纳米球、固定DNA纳米球得到DNA
纳米球阵列，对DNA纳米球阵列进行测序，使得待测血浆样本的测序数据中含有所述外源参
照核酸的测序数据。

[0063] 本实施例的一种具体实现方式中，所述外源参照核酸为pUC19质粒。

[0064] 本实施例的一种实现方式中，所述信息注释及合并步骤之后还包括注释结果质控步骤，所述注释结果质控步骤包括第一步质控和第二步质控；

[0065] 所述第一步质控包括：

[0066] 判断注释结果是否包含所述对外源参照核酸的注释；

[0067] 若注释结果不包含所述外源参照核酸的注释结果，则重新进行所述信息注释及合并步骤，或者，重新对所述混合核酸样本进行建库和测序；

[0068] 若注释结果包含外源参照核酸的注释结果，则第一步质控合格，进行第二步质控；

[0069] 所述第二步质控包括：

[0070] 将注释结果包含的微生物按丰度由高到低进行排序，获取丰度排序前预设个数的微生物在人群中的丰度分布，若注释结果中丰度排序前预设个数的任一微生物的丰度大于
其在人群中最高丰度的2倍，则存在微生物污染需要重新进行待测血浆样本采集；

[0071] 若注释结果中丰度排序前预设个数的微生物的丰度均小于或等于其在人群中最高丰度的2倍，则第二步质控合格，进行后续的物种多样性评估步骤。

[0072] 本实施例的一种具体实施方式中，所述预设个数为5个，也即将注释结果包含的微生物按丰度由高到低进行排序，丰度前5的微生物中任一微生物丰度大于其在人群中最高
丰度的2倍，则说明该微生物物种在血浆中的丰度异常，样品在实验过程中有可能受到该微
生物物种的污染，应当重新进行样本采集和测序步骤，或者重新对采集的待测血浆样本进
行DNA或RNA提取，或者排除污染源后重新对所述混合核酸样本进行建库和测序，以进行微
生物污染排查。

[0073] 本实施例的的一种实现方式中，为了排除微生物污染是由于采集血浆样本后，在实验操作过程引入的微生物导致的，本实施例还设置有空白对照样本，所述空白对照样本
采取和待测血浆样本相同的实验操作，并按照上述方法进行微生物物种多样性评估，若所
述空白对照组出现微生物注释结果，则说明实验操作过程引入了微生物，第一步质控和第
二步质控之间还包括第三步质控：在将待测血浆样本的注释结果和空白对照样本的注释结
果进行比较，将待测血浆样本中和空白对照样本相同的注释结果进行剔除，而后对剔除后
的注释结果进行第二步质控，从而避免实验操作过程引入污染对后续分析结果造成影响。

[0074] S204：利用所述注释结果计算微生物物种多样性指数，根据所述微生物物种多样性指数评估待测血浆样本中微生物物种多样性。

[0075] 具体的，所述微生物物种多样性指数包括Shannon指数、Simpson指数、chao指数中的至少一种，上述指数可以通过用于分析生物信息的R包计算得到，其中，R包是指R语言编
写的程序分析包，例如diversity包。对于健康样本，其微生物物种多样性指数一般在一定
的范围内波动，如果待测血浆样本的微生物物种多样性指数超出该范围，则说明待测血浆
样本的微生物多样性过高或过低。例如，若待测血浆样本的shannon指数＜4.5，则说明该样
本的微生物多样性过低，待测血浆样本的微生物平衡状态被打破，需要对待测血浆样本的
微生物分布情况进行进一步分析。

[0076] 值得说明的是，本申请通过两种不同的算法对DNA测序数据的非人源序列进行注释，以获取血浆样本的微生物物种及其丰度信息，并且对血浆样本的微生物物种及其丰度
信息进行定量分析，得到微生物物种多样性指数，从而能够通过微生物物种多样性指数对
血浆样本的微生物物种多样性进行定量评估；此外，本申请只需受检者的血浆样本即可进
行液体活检，取样方便快捷，并且测序数据适用于低深度数据，检测成本更低，且支持甲基
化测序数据，可对同一个样本进行多维度分析。

[0077] 本领域技术人员可以理解，上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现，也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能
通过计算机程序的方式实现时，该程序可以存储于一计算机可读存储介质中，存储介质可
以包括：只读存储器、随机存储器、磁盘、光盘、硬盘等，通过计算机执行该程序以实现上述
功能。例如，将程序存储在设备的存储器中，当通过处理器执行存储器中程序，即可实现上
述全部或部分功能。另外，当上述实施方式中全部或部分功能通过计算机程序的方式实现
时，该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质
中，通过下载或复制保存到本地设备的存储器中，或对本地设备的系统进行版本更新，当通
过处理器执行存储器中的程序时，即可实现上述实施方式中全部或部分功能。

[0078] 本申请的第二方面公开了一种血浆微生物物种多样性评估装置，其特征在于，包括：

[0079] 信息注释及合并模块301：用于基于kmer方法和蛋白比对方法分别对非人源序列进行注释，合并两种方法得到的注释结果，所述注释结果包括微生物物种及其丰度信息；

[0080] 物种多样性评估模块302：用于利用所述注释结果计算微生物物种多样性指数，根据所述微生物物种多样性指数评估待测血浆样本中微生物物种多样性。

[0081] 本申请的第三方面公开了一种血浆微生物物种多样性评估装置，所述装置包括：

[0082] 存储器，用于存储程序；处理器，用于通过执行所述存储器存储的程序以实现上述一种血浆微生物物种多样性评估方法。

[0083] 本申请的第四方面公开了一种计算机可读存储介质，所述介质用于存储程序，所述程序能够被处理器执行以实现上述一种血浆微生物物种多样性评估方法。

[0084] 下面将通过具体实施例本发明作进一步说明。应当理解，实施例仅是示例性的，并不构成对本发明保护范围的限制。

[0085] 实施例1

[0086] 1.使用试剂盒提取待测血浆样本的DNA，并进行超声打断；

[0087] 2.加入试剂进行末端修复，接头连接，进行纳米球扩增，上机测序，获得测序数据；

[0088] 3.对测序数据进行质控，并将质控后的测序数据比对到人类基因组，并去掉mapping的reads，以获得非人源序列；

[0089] 4.对非人源序列的fastq文件进行注释，得到非人源序列的微生物物种及丰度信息；

[0090] 具体的，Kaiju和kraken的注释结果均包括三列，第一列为是否分类，C表示是，U表示否；第二列表示reads id，第三列表示注释结果，注释结果包括到的物种id；合并Kaiju和
kraken的注释结果得到五列信息，第一列为文件名，第二列为微生物丰度，第三列为reads
条数，第四列为物种ID，第五列为物种的拉丁文名。其中，合并策略为kraken优先，表示当不
同软件注释结果有矛盾时，以kraken的注释结果为准。

[0091] 5.对合并的注释结果进行质控，然后使用R包的diversity包进行微生物多样性分析，得到待测血浆样本的shanon指数的值为4.95，而健康样本的shanon指数≧4.5，由此可
知，待测血浆样本的shanon指数在正常范围内，也即待测血浆样本的微生物物种多样性处
于正常水平。

[0092] 以上应用了具体个例对本申请进行阐述，只是用于帮助理解本申请，并不用以限制本申请。对于本申请所属技术领域的技术人员，依据本申请的思想，还可以做出若干简单
推演、变形或替换。

一种血浆微生物物种多样性评估方法、装置和存储介质转让专利

申请号 : CN202110612817.4

文献号 : CN113355438B

文献日 : 2022-05-10

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 陈海新 , 黄毅 , 林小芳 , 刘久成 , 易鑫

申请人 : 深圳吉因加医学检验实验室 , 深圳吉因加信息科技有限公司

摘要 :

权利要求 :

说明书 :