一种基于自回归式模型的药物设计方法

    公开(公告)号:CN118588196B

    公开(公告)日:2025-04-25

    申请号:CN202410754023.5

    申请日:2024-06-12

    Abstract: 本发明公开了一种基于自回归式模型的药物设计方法,属于药物设计技术领域。该方法包括:将子词分词算法应用于生物学文本处理,对数据集中的蛋白质与配体信息进行训练,得到蛋白质和配体的分词器,并在此基础上构建自回归模型的分词器;处理并转化数据集中的原始数据为适用于自回归模型的文本形式,再通过所得分词器进行编码,构建自回归模型所需的训练数据集;利用训练数据集训练自回归模型,使其能理解配体的SMILES表示,并学习蛋白质与配体之间的相互作用模式;利用训练过的自回归模型生成预测的配体数据,并通过化学信息工具进行后处理,以获得具有具体化学结构的候选配体;对得到的候选配体进行评估和优化,以确定有潜力成为有效药物的候选分子。

    一种基于自回归式模型的药物设计方法

    公开(公告)号:CN118588196A

    公开(公告)日:2024-09-03

    申请号:CN202410754023.5

    申请日:2024-06-12

    Abstract: 本发明公开了一种基于自回归式模型的药物设计方法,属于药物设计技术领域。该方法包括:将子词分词算法应用于生物学文本处理,对数据集中的蛋白质与配体信息进行训练,得到蛋白质和配体的分词器,并在此基础上构建自回归模型的分词器;处理并转化数据集中的原始数据为适用于自回归模型的文本形式,再通过所得分词器进行编码,构建自回归模型所需的训练数据集;利用训练数据集训练自回归模型,使其能理解配体的SMILES表示,并学习蛋白质与配体之间的相互作用模式;利用训练过的自回归模型生成预测的配体数据,并通过化学信息工具进行后处理,以获得具有具体化学结构的候选配体;对得到的候选配体进行评估和优化,以确定有潜力成为有效药物的候选分子。

    一种基于自回归式模型的药物设计方法

    公开(公告)号:CN116779060A

    公开(公告)日:2023-09-19

    申请号:CN202310711607.X

    申请日:2023-06-15

    Abstract: 一种基于自回归式模型的药物设计方法,将子词分词算法应用于生物学文本处理,对数据集中的蛋白质与配体信息进行训练,得到蛋白质和配体的分词器,并在此基础上构建自回归模型的分词器;处理并转化数据集中的原始数据为适用于自回归模型的文本形式,再通过所得分词器进行编码,构建自回归模型所需的训练数据集;利用训练数据集训练自回归模型,使其能理解配体的SMILES表示,并学习蛋白质与配体之间的相互作用模式;利用训练过的自回归模型生成预测的配体数据,并通过化学信息工具进行后处理,以获得具有具体化学结构的候选配体;对得到的候选配体进行评估和优化,利用化学或生物信息工具进行结构优化和活性预测,以确定有潜力成为有效药物的候选分子。

Patent Agency Ranking