基于分子砌块合成规划技术的小分子从头设计方法转让专利

申请号 : CN202211137435.1

文献号 : CN115240788B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 居斌姜菁梅琪

申请人 : 杭州生奥信息技术有限公司

摘要 :

本发明公开了一种基于分子砌块合成规划技术的小分子从头设计方法,包含:将起始分子砌块作为第一个反应物,根据第一个反应物得到最佳合成模板;根据第一个反应物和最佳合成模板得到第二个反应物;根据第一反应物、第二个反应物和最佳合成模板得到第一评分值;根据第一反应物、第二个反应物和最佳合成模板得到迭代分子结构;根据迭代分子结构得到第二评分结果和是否停止操作的done标志;根据迭代分子结构进行反向传播进行参数迭代更新。本发明的基于分子砌块合成规划技术的小分子从头设计方法,采用边计算分子砌块合成路径边采样活性分子空间的de novo方法,可实现高效计算高活性分子,并提供基于分子砌块的分子合成路径。

权利要求 :

1.一种基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,包含以下步骤:将起始分子砌块作为第一个反应物,根据所述第一个反应物得到最佳合成模板;

根据所述第一个反应物和所述最佳合成模板得到第二个反应物;

根据所述第一反应物、所述第二个反应物和所述最佳合成模板得到第一评分值;

根据所述第一反应物、所述第二个反应物和所述最佳合成模板得到迭代分子结构;

根据所述迭代分子结构得到第二评分结果和是否停止操作的done标志;

根据所述迭代分子结构进行反向传播进行参数迭代更新;

所述基于分子砌块合成规划技术的小分子从头设计方法还包含:通过将Zinc lead like库和Drugbank库中的小分子进行拆分得到片段库;

对所述片段库进行人工整理得到整理后片段库;

基于摩根指纹从分子砌块库中搜索出所述整理后片段库中的每个片段对应的最相似的分子,由这些分子构成起始分子砌块库;

遍历所述起始分子砌块库从中选择亲和力值最大的分子砌块作为所述起始分子砌块。

2.根据权利要求1所述的基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,所述将起始分子砌块作为第一个反应物得到最佳合成模板的具体方法为:将所述第一个反应物输入第一合成模板选择单元执行第一策略函数得到所述最佳合成模板。

3.根据权利要求2所述的基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,所述根据所述第一个反应物和所述最佳合成模板得到第二个反应物的具体方法为:将所述第一个反应物和所述最佳合成模板输入第一反应物选择单元,所述第一反应物选择单元通过训练好的神经网络执行第二策略函数得到所述第二个反应物。

4.根据权利要求3所述的基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,所述根据所述第一反应物、所述第二个反应物和所述最佳合成模板得到第一评分值的具体方法为:将所述第一反应物、所述第二个反应物和所述最佳合成模板输入第一Q评价单元执行评价函数Q得到所述第一策略函数和第二策略函数的所述第一评分值。

5.根据权利要求4所述的基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,所述根据所述第一反应物、所述第二个反应物和所述最佳合成模板得到迭代分子结构的具体方法为:将所述第一反应物、所述第二个反应物和所述最佳合成模板输入反应预测器执行Predictor函数得到所述迭代分子结构。

6.根据权利要求5所述的基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,所述根据所述迭代分子结构得到第二评分结果和是否停止操作的done标志的具体方法为:将所述迭代分子结构输入Oracle评价单元执行Oracle函数得到所述第二评分结果和是否停止操作的所述done标志。

7.根据权利要求1所述的基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,将所述迭代分子结构进行反向传播进行参数迭代更新的具体方法为:将所述迭代分子结构经过第二合成模板选择单元、第二反应物选择单元和第二Q评价单元处理后分别将所述第二合成模板选择单元的参数更新至所述第一合成模板选择单元,将所述第二反应物选择单元的参数更新至所述第一反应物选择单元,将所述第二Q评价单元的参数更新至所述Q评价单元,所述第二合成模板选择单元、所述第二反应物选择单元和所述第二Q评价单元分别与所述第一合成模板选择单元、所述第一反应物选择单元和所述第一Q评价单元在初始状态下时完全相同。

8.根据权利要求6所述的基于分子砌块合成规划技术的小分子从头设计方法,其特征在于,所述基于分子砌块合成规划技术的小分子从头设计方法还包含:将所述第一个反应物、所述第二个反应物、所述最佳合成模板、所述迭代分子结构、所述第二评分结果和所述done标志存入缓存。

说明书 :

基于分子砌块合成规划技术的小分子从头设计方法

技术领域

[0001] 本发明涉及一种基于分子砌块合成规划技术的小分子从头设计方法。

背景技术

[0002] 人工智能(Artificial Intelligence,以下简称AI)技术能大幅度减少药物超期发现的时间和投入成本。尤其是以深度学习为代表的分子从头设计(以下简称de novo)技术是当前AI制药技术的核心方法。现有AI分子生成技术包括有基于原子和键逐个生长的方法,以及基于片段组合生成方法(Fragment Based Drug Discovery,以下简称FBDD)。前者方法的主要问题包括:分子生成过程中效率不高,还容易出现自然界不存在的分子结构。而后者FBDD算法重点解决的是分子生成过程的活性、多样性、类药性等问题,不关注实体分子如何合成出来。这导致了以下主要问题:
[0003] 1.分子生成和分子逆合成路径是两阶段分开计算,多数生成的分子很难合成。
[0004] 2.分子逆合成路径不准确或者不合理的合成路径导致合成费用高,药化专家不愿意接受AI推荐的合成路径。
[0005] 3.de novo两阶段的计算量很大,且耗时。
[0006] 本发明能兼顾FBDD的优势,并且能有效解决上述出现的问题。

发明内容

[0007] 本发明提供了一种基于分子砌块合成规划技术的小分子从头设计方法解决上述提到的技术问题,具体采用如下的技术方案:
[0008] 一种基于分子砌块合成规划技术的小分子从头设计方法,包含以下步骤:
[0009] 将起始分子砌块作为第一个反应物,根据第一个反应物得到最佳合成模板;
[0010] 根据第一个反应物和最佳合成模板得到第二个反应物;
[0011] 根据第一反应物、第二个反应物和最佳合成模板得到第一评分值;
[0012] 根据第一反应物、第二个反应物和最佳合成模板得到迭代分子结构;
[0013] 根据迭代分子结构得到第二评分结果和是否停止操作的done标志;
[0014] 根据迭代分子结构进行反向传播进行参数迭代更新。
[0015] 进一步地,将起始分子砌块作为第一个反应物得到最佳合成模板的具体方法为:
[0016] 将第一个反应物输入第一合成模板选择单元执行第一策略函数π得到最佳合成模板。
[0017] 进一步地,根据第一个反应物和最佳合成模板得到第二个反应物的具体方法为:
[0018] 将第一个反应物和最佳合成模板输入第一反应物选择单元,第一反应物选择单元通过训练好的神经网络执行第二策略函数π得到第二个反应物。
[0019] 进一步地,根据第一反应物、第二个反应物和最佳合成模板得到第一评分值的具体方法为:
[0020] 将第一反应物、第二个反应物和最佳合成模板输入第一Q评价单元执行评价函数Q得到第一策略函数π和第二策略函数π的第一评分值。
[0021] 进一步地,根据第一反应物、第二个反应物和最佳合成模板得到迭代分子结构的具体方法为:
[0022] 将第一反应物、第二个反应物和最佳合成模板输入反应预测器执行Predictor函数得到迭代分子结构。
[0023] 进一步地,根据迭代分子结构得到第二评分结果和是否停止操作的done标志的具体方法为:
[0024] 将迭代分子结构输入Oracle评价单元执行Oracle函数得到第二评分结果和是否停止操作的done标志。
[0025] 进一步地,将迭代分子结构进行反向传播进行参数迭代更新的具体方法为:
[0026] 将迭代分子结构经过第二合成模板选择单元、第二反应物选择单元和第二Q评价单元处理后分别将第二合成模板选择单元的参数更新至第一合成模板选择单元,将第二反应物选择单元的参数更新至第一反应物选择单元,将第二Q评价单元的参数更新至第一Q评价单元,第二合成模板选择单元、第二反应物选择单元和第二Q评价单元分别与第一合成模板选择单元、第一反应物选择单元和第一Q评价单元在初始状态下时完全相同对的。
[0027] 进一步地,基于分子砌块合成规划技术的小分子从头设计方法还包含:
[0028] 将第一个反应物、第二个反应物、最佳合成模板、迭代分子结构、第二评分结果和done标志存入缓存。
[0029] 进一步地,基于分子砌块合成规划技术的小分子从头设计方法还包含:
[0030] 遍历起始分子砌块库从中选择亲和力值最大的分子砌块作为所述起始分子砌块。
[0031] 进一步地,通过将Zinc lead like库和Drugbank库中的小分子进行拆分得到片段库;
[0032] 对片段库进行人工整理得到整理后片段库;
[0033] 基于摩根指纹从分子砌块库中搜索出整理后片段库中的每个片段对应的最相似的分子,由这些分子构成起始分子砌块库。
[0034] 本发明的有益之处在于所提供的基于分子砌块合成规划技术的小分子从头设计方法,采用边计算分子砌块合成路径边采样活性分子空间的de novo方法,可实现高效计算高活性分子,并提供基于分子砌块的分子合成路径,从头设计的分子具有靶向靶点口袋的高活性。

附图说明

[0035] 图1是本发明的一种基于分子砌块合成规划技术的小分子从头设计方法的示意图。

具体实施方式

[0036] 以下结合附图和具体实施例对本发明作具体的介绍。
[0037] 如图1所示为本申请的一种基于分子砌块合成规划技术的小分子从头设计方法的流程示意图,通过对应的模块执行相应的步骤来实现本申请的基于分子砌块合成规划技术的小分子从头设计方法。在本申请中,通过模块1得到起始分子砌块库,模块2和模块3进行神经网络的正向推理,再通过模块5进行神经网络参数的反向传播更新。具体地,基于分子砌块合成规划技术的小分子从头设计方法包含以下步骤:
[0038] S1:将起始分子砌块作为第一个反应物,根据第一个反应物得到最佳合成模板。
[0039] 具体而言,从互联网上下载免费的Zinc lead like库和DrugBank库,通过将Zinc lead like库和Drugbank库中的小分子进行拆分得到片段库。对得到的片段库通过去重,分子量大小,logP值和氢键供受体数量进行筛选,然后人工对筛选后的片段进行进一步的检查, 剔除一些不太适合作为首分子的片段,得到整理后片段库。再基于摩根指纹从分子砌块库(能够购买到的现有的分子砌块库)中搜索出所述整理后片段库中的每个片段对应的最相似的分子,由这些分子构成所述起始分子砌块库。最后,遍历起始分子砌块库,通过vina等软件与靶点口袋做分子对接,从中选择亲和力值最大的分子砌块作为起始分子砌块。将这个起始分子砌块作为下述的第一个反应物。
[0040] 将起始分子砌块作为第一个反应物得到最佳合成模板的具体方法为:
[0041] 将第一个反应物输入模块2中的第一合成模板选择单元执行第一策略函数π得到最佳合成模板。
[0042] 第一策略函数 ,第一策略函数π是从状态空间到 动作空间 的概率映射,即每个输入状态根据输入 ,执行策略函数获得最佳合成模板 的最大概率。这里, 为第一个反应物,同 。
[0043] S2:根据第一个反应物和最佳合成模板得到第二个反应物。
[0044] 根据第一个反应物 和最佳合成模板T得到第二个反应物 的具体方法为:
[0045] 将第一个反应物 和最佳合成模板T输入模块2中的第一反应物选择单元,第一反应物选择单元通过训练好的神经网络执行第二策略函数π得到第二个反应物 。
[0046] 具体地,输入 训练数据集以训练神经网络,从而获得 的参数。推理时,输入 获得此策略函数返回的最大值,以选择第二个反应物 。
[0047] S3:根据第一反应物、第二个反应物和最佳合成模板T得到第一评分值。
[0048] 根据第一反应物 、第二个反应物 和最佳合成模板T得到第一评分值的具体方法为:
[0049] 将第一反应物 、第二个反应物 和最佳合成模板T输入模块3中的第一Q评价单元执行评价函数Q,即 ,得到第一策略函数π和第二策略函数π的第一评分值。即第一评分值是同时针对第一策略函数π和第二策略函数π的评分。
[0050] S4:根据第一反应物、第二个反应物和最佳合成模板得到迭代分子结构。
[0051] 具体而言,根据第一反应物 、第二个反应物 和最佳合成模板T得到迭代分子结构 的具体方法为:
[0052] 将第一反应物 、第二个反应物 和最佳合成模板T输入模块4中的反应预测器执行Predictor函数得到迭代分子结构。
[0053] 在本申请中,用RDKit工具包的rxn函数做反应预测器,定义为 ,按照公式 执行反应预测器,得到新的下一轮算法迭代的输入参数物。Predictor函数是RDKit工具包的内置函数,输入的 就是模块2输出的

[0054] S5:根据迭代分子结构得到第二评分结果和是否停止操作的done标志。
[0055] 根据迭代分子结构 得到第二评分结果 和是否停止操作的done标志的具体方法为:
[0056] 将迭代分子结构 输入模块4中的Oracle评价单元执行Oracle函数得到第二评分结果 和是否停止操作的done标志。可以理解的是,是否停止操作除了会由Oracle函数输出,还有另两个决定因素:迭代次数和迭代分子的分子量。当迭代次数和迭代分子的分子量超过预设的阈值,则也会返回任务停止信号。
[0057] 具体而言,按照公式 执行Oracle函数,并且采由贝叶斯优化器软件内置的采集函数进行优化。Oracle函数是以Vina分子对接软件为一类的函数包,输入上一步的分子结构 ,输出评分结果 和对应分子结构,以及是否停止操作的done标志。
[0058] 在完成上述步骤后,将第一个反应物 、第二个反应物 、最佳合成模板T、迭代分子结构 、第二评分结果 和done标志存入缓存中供模块5调用。
[0059] S6:根据迭代分子结构进行反向传播进行参数迭代更新。
[0060] 本申请中,将迭代分子结构 进行反向传播进行参数迭代更新的具体方法为:
[0061] 将迭代分子结构 经过第二合成模板选择单元、第二反应物选择单元和第二Q评价单元处理后分别将第二合成模板选择单元的参数更新至第一合成模板选择单元,将第二反应物选择单元的参数更新至第一反应物选择单元,将第二Q评价单元的参数更新至第一Q评价单元,第二合成模板选择单元、第二反应物选择单元和第二Q评价单元分别与第一合成模板选择单元、第一反应物选择单元和第一Q评价单元在初始状态下时完全相同对的。
[0062] 具体而言,模块2和模块3是神经网络的正向推理过程,而模块5是神经网络参数的反向传播更新过程,其输入参数是模块4输出的buffer样本数据。
[0063] 可以理解的是,为了避免神经网络训练的不稳定,因此模块5中创建有和模块2执行者对象一致的副本,定义为 ,模块2执行者对象定义为 。按照和模块2一样的工作方式进行预测,获得第2个反应物和反应模板。当完成一个批次数据的网络参数更新后,执行网络对象替换,即 ,将第
二合成模板选择单元的参数更新至第一合成模板选择单元,将第二反应物选择单元的参数更新至第一反应物选择单元。
[0064] 同理地,为了避免神经网络训练的不稳定,模块5中创建有和模块3一样的两个评论者对象,每次更新评论者网络参数时,选择最小值的评论者作为输出,按照公式。当完成一个批次数据的网络参数更新后,执行网络对象替换,即
,从而将第二Q
评价单元的参数更新至第一Q评价单元。
[0065] 通过上述步骤,每次从buffer采样一批样本,计算真实亲和力数据和预测数据的最小误差,然后通过pytorch软件反向传播,更新相应步骤1和步骤2的模块的参数。
[0066] 以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。