多模态药物虚拟筛选方法
    1.
    发明公开

    公开(公告)号:CN116759017A

    公开(公告)日:2023-09-15

    申请号:CN202310702816.8

    申请日:2023-06-14

    Abstract: 本发明提供了一种多模态药物虚拟筛选方法,包括以下步骤:选择预训练好的图形变换器GT模型,基于公开数据集进行微调图形变换器GT模型;使用主动学习策略挑选分子,并进行Vina‑GPU+对接,利用分子对接得分对图形变换器GT模型进行微调;使用目标靶标的生物活性实验数据对模型微调;对预筛选化合物库分子进行推理;根据分子得分进行排序,根据需要选取前N个分子作为候选化合物。本发明在对大规模的化合物库进行虚拟筛选时,极大地减少了需要对接的分子数目,缩短了虚拟筛选需要的时间,同时可以提高虚拟筛选的精度,显著地降低药物研发的成本和时间。

    跨模态知识蒸馏方法
    2.
    发明公开

    公开(公告)号:CN116720581A

    公开(公告)日:2023-09-08

    申请号:CN202310707697.5

    申请日:2023-06-14

    Abstract: 本发明提供了一种跨模态知识蒸馏方法,包括以下步骤:选取基于分子图输入的图形变换器GT模型作为教师模型,选取自定义的基于分子序列输入的轻量级的分子线性输入规范变换器ST模型作为学生模型;选取小分子数据集,同时进行SMILES预转换并将处理后的小分子SMILES表示输入分子线性输入规范变换器ST模型;分别选取图形变换器GT模型和分子线性输入规范变换器ST模型的最后三个编码层,进行层层对应的逐层知识蒸馏;训练过程中同时优化注意力迁移器、值关系迁移器与监督任务损失,更新分子线性输入规范变换器ST模型整体权重参数。本发明有效提高了特征的可迁移性,同时极大提高了学生模型的泛化能力。

Patent Agency Ranking