医学与健康科技创新工程

您所在的位置: 首页 - 医学与健康科技创新工程 - 进展快报
进展快报
【医学与健康科技创新工程项目进展快报第240期】

药物所汪小涧课题组在人工智能辅助药物发现研究中取得新进展

2023728中国医学科学院药物研究所汪小涧课题组与合作团队在生物信息学领域国际期刊Briefings in Bioinformatics《生物信息学简报》发表题为CMGN: a conditional molecular generation net to design target-specific molecules with desired propertiesCMGN:一个可用于条件分子生成的药物设计方法)的研究论文,报道了双向自回归转换器条件分子生成模型应用于药物发现研究

生成式人工智能(Artificial Intelligence Generated ContentAIGC)是目前人工智能研究与应用的重点方向。课题组采用预训练+微调的训练模式建立CMGN模型基于大规模数据集预训练开展分子生成规则学习,在特定任务的小数据集上做迁移学习,以适应不同的下游任务。CMGN采用条件分子生成训练策略,训练模型学习分子片段和分子性质信息进而生成完整分子结构,通过输入特定的分子片段引导模型具备结构改造与优化的能力。为了评估模型的条件分子生成能力,CMGN在包含5000分子的数据集上进行预训练,评估结果显示,模型能够结合分子片段和分子性质信息生成分子,分子回复率达到85.74%,且显示了基于片段的分子多性质优化能力。课题组进一步应用模型开展布鲁顿酪氨酸激酶BTK抑制剂的分子设计,发现具有较好活性的先导化合物具有良好的开发前景这一通用模型框架也可应用于碳谱的结构解析研究该研究Analytical Chemistry《分析化学》期刊封底文章发表,并应邀在期刊perspective(观点)栏目撰写综述。

1. CMGN与传统药物设计对比及其通过迁移学习及性质调节解决分子逆问题的应用策略

2. (左)GMGNet模型基于13C NMR结构解析的工作流程(右)AI四大光谱中的应用

药物所汪小涧研究员,碳硅智慧公司邓亚峰博士为本论文的共同通讯作者。药物所杨敏健博士和硕士生孙涵宇为共同第一作者。该工作获得中国医学科学院医学与健康科技创新工程(CIFMS, No. 2021-I2M-1-028)和国家自然科学基金(NSFC, No. 82073692)的资助。

Briefings in Bioinformatics链接:https://academic.oup.com/bib/article/24/4/bbad185/7165252

Analytical Chemistry链接:https://pubs.acs.org/doi/10.1021/acs.analchem.2c05817

Analytical Chemistry Perspective链接:https://pubs.acs.org/doi/10.1021/acs.analchem.3c02540