-
公开(公告)号:CN119152976A
公开(公告)日:2024-12-17
申请号:CN202411112493.8
申请日:2024-08-14
Applicant: 南京邮电大学
Abstract: 本发明公开了一种融合全局和局部信息的联合虚拟筛选方法,属于人工智能药物发现领域,包括以下步骤:首先准备待筛选靶标的活性和非活性分子的SMILES数据集以及随机分子的SMILES数据集;然后选用融合了子结构和物化属性信息的编码方式,分别训练GBDT的全局模型和局部模型;接着使用全局模型预测待筛选数据集,选取预测概率高的TopK1分子;并使用局部模型预测TopK1分子,选取TopK1分子中全局模型预测概率和局部模型预测概率的乘积高的TopK2分子;最后训练预测IC50值的GBDT的回归模型,根据预测值对TopK2分子进行重排序。本发明极大地减少了模型预测的分子数量,具有快速的筛选速度和高筛选精度,适用于小规模和超大规模的虚拟筛选,显著地降低了药物研发的成本和时间。