一种基于对比学习的生物合成表征方法及模型

    公开(公告)号:CN117558355A

    公开(公告)日:2024-02-13

    申请号:CN202311496800.2

    申请日:2023-11-10

    Abstract: 本发明公开了一种基于对比学习的生物合成表征方法及模型,属于生物合成反应的表征领域,包括:构建包含酶、酶的EC编号以及生物合成反应的训练样本集;采用对比学习方法,基于训练样本集构建包含酶的表征模型和小分子表征模型的生物合成表征模型,训练过程中使化学反应底物和产物间的损失函数、酶和EC编号间的损失函数、小分子和酶相互作用的损失函数最小化,完成对生物合成表征模型的训练;将下游任务的分子输入训练好的生物合成表征模型进行表征,得到酶的功能表征。本发明基于对比学习方法,构建了包含酶的表征模型和小分子表征模型的生物合成表征模型,能够同时实现小分子和酶的表征,从而实现多种酶的多种功能的通用性预测。

    先导化合物优化方法、装置、电子装置和存储介质

    公开(公告)号:CN117316330A

    公开(公告)日:2023-12-29

    申请号:CN202311158775.7

    申请日:2023-09-08

    Abstract: 本申请涉及一种先导化合物优化方法、装置、电子装置和存储介质,其中,该方法包括:将蛋白小分子掩码训练对数据输入至待训练先导化合物优化模型;调用多个网络层对先导化合物的训练样本数据进行预测,得到与蛋白口袋匹配的新生成原子的信息;基于新生成原子的信息,计算得到待训练先导化合物优化模型的损失值;确定损失值在预设的阈值范围内的待训练先导化合物优化模型为目标先导化合物优化模型;将待优化蛋白口袋数据和待优化分子片段数据输入至目标先导化合物优化模型,得到优化后的先导化合物。通过本申请解决了传统先导化合物优化方法受限于事先准备的化合物库所表达的活性化合物空间的问题。

Patent Agency Ranking