一种基于三元组和差额度量的域自适应方法

    公开(公告)号:CN112819098A

    公开(公告)日:2021-05-18

    申请号:CN202110220887.5

    申请日:2021-02-26

    Abstract: 本发明提供了一种基于三元组和差额度量的域自适应方法,从目标域随机抽取样本,形成目标域batch,输入特征提取器获得样本特征;将样本特征输入至多分类器,进行熵最小化处理;同时输入至多二分类器,根据输出确定k个临界样本以及k对相似类;然后利用三元组损失triplet loss筛选有效样本构建源域batch,通过提取好的源域batch样本训练多二分类器和多分类器;最后将目标域batch和源域batch送入域对抗网络,进行域对齐操作;本发明通过使用三元组损失函数,并且合理设计该损失中正负样本对之间的差额margin,利用域对抗网络进行域对齐,使得源域和目标域的样本分布趋于一致,间接地让目标域靠近分类边界的样本远离边界,以使得能够将目标域靠近分类边界的样本进行正确分类。

    一种基于多任务图神经网络的分子毒性预测方法和装置

    公开(公告)号:CN113257369B

    公开(公告)日:2022-08-30

    申请号:CN202110542907.0

    申请日:2021-05-18

    Abstract: 本发明揭示了一种基于多任务图神经网络的分子毒性预测方法和装置,该方法包括以下步骤:S1:毒性数据集的准备,得到用化学分子规范表达式表示的毒性数据;S2:使用S1步骤中得到的用化学分子规范表达式的毒性数据,生成原子节点特征向量;S3:使用S1步骤中得到的用化学分子规范表达式的毒性数据,生成边信息特征向量;S4:基于S2步骤得到的原子节点特征向量和和S3步骤得到的边信息特征向量,构建基于多任务图神经网络的分子毒性预测模型;S5:对模型进行性能验证。针对分子毒性数据集设计的多任务图神经网络,构建自动学习分子图结构信息模型,能够结合分子毒性任务间的关联性,使用多任务学习方法来提升毒性预测任务的性能。

    一种基于GPU加速AutoDock Vina的方法

    公开(公告)号:CN114373509A

    公开(公告)日:2022-04-19

    申请号:CN202111569787.X

    申请日:2021-12-21

    Abstract: 本发明公开了一种基于GPU加速AutoDock Vina的方法及实现,该方法通过增加初始随机配体构象的数目来扩展蒙特卡罗的迭代局部搜索方法中对接线程的并行规模,减少蒙特卡罗的迭代局部搜索方法中的搜索步数,利用OpenCL实现AutoDock Vina中CPU和GPU异构并行结构以此达到更高水平的并行和加速能力。现代药物筛选需要面对海量的化合物数据,目前的分子对接技术无法满足现实需求。采用本发明的方法,可以在保证不损失对接精度的同时大幅加快分子对接和虚拟筛选的速度,满足大型化合物数据库分子对接的实际需求。

    一种基于图注意机制迁移学习的小分子药物hERG毒性预测方法和装置

    公开(公告)号:CN113192571A

    公开(公告)日:2021-07-30

    申请号:CN202110477984.2

    申请日:2021-04-29

    Abstract: 本发明揭示了一种基于图注意机制迁移学习的小分子药物hERG毒性预测方法和装置,该方法包括以下步骤:S1:数据集预处理,将待检测的类药化合物通过分子指纹生成软件生成指纹序列;S2:通过S1步骤生成的指纹序列得到原子及化学键特征,将原子及化学键特征构建分子图及图特征;S3:通过图注意力机制对S2步骤得到的分子图进行处理,生成分子中每个原子特征向量;S4:通过图注意力机制及每个原子的特征生成分子特征向量。该方法基于图注意力机制对分子图结构进行处理,有效获取对预测属性值贡献大的子结构,基于迁移学习对源域和目标域数据集进行处理,有效解决样本量不足的问题。

    基于部分可观测马尔可夫决策过程的引导式学习方法

    公开(公告)号:CN113298261A

    公开(公告)日:2021-08-24

    申请号:CN202110556080.9

    申请日:2021-05-21

    Abstract: 一种基于部分可观察马尔科夫决策过程的引导式学习方法,方法具体为:当训练次数t=1时,设置训练N个用户的总训练样本为M,初始化N个用户训练样本的概率分布pt,N个用户的训练得分ot,N个用户的累计值Qt;根据pt的概率分布形成N个用户的训练样本,对N个用户进行训练,训练完成后,测试训练效果,得到N个用户的训练得分ot。如果满足N个用户的训练成绩要求,或者训练次数t达到预定值T,就结束算法,否则继续下一步;用ot减去ot‑1得到N个用户的变动值Rt;利用指数加权移动平均方法,根据Rt去更新N个用户的累计值Qt;根据累计值Qt获取累计值最大的用户,并根据优先级用户,生成N个用户训练样本的概率分布pt+1。本发明有效解决传统引导式学习方式存在的问题。

    一种基于分子相似性和半监督学习的药物虚拟筛选方法和装置

    公开(公告)号:CN113192572A

    公开(公告)日:2021-07-30

    申请号:CN202110478484.0

    申请日:2021-04-29

    Abstract: 本发明揭示了一种基于分子相似性和半监督学习的药物虚拟筛选方法和装置,该方法包括以下步骤:S1:收集数据集,得到有生物活性值的配体分子样本和无生物活性值的配体分子样本;S2:使用S1步骤中得到的有生物活性值的配体分子样本构建回归模型;S3:计算数据集中分子间的相似度;S4:利用S3步骤中得到的分子相似度和S2步骤中得到的回归模型,计算三元组损失;S5:根据S2步骤和S4步骤得到的损失函数训练模型。基于半监督学习方法,在模型训练中引入大量的无实验生物活性值样本,使用分子相似度和三元组损失对无实验生物活性值样本的模型预测值进行约束,解决实际应用场景中大量无生物活性值的样本无法有效参与模型训练的难题。

    一种基于分子相似性和半监督学习的药物虚拟筛选方法和装置

    公开(公告)号:CN113192572B

    公开(公告)日:2022-08-23

    申请号:CN202110478484.0

    申请日:2021-04-29

    Abstract: 本发明揭示了一种基于分子相似性和半监督学习的药物虚拟筛选方法和装置,该方法包括以下步骤:S1:收集数据集,得到有生物活性值的配体分子样本和无生物活性值的配体分子样本;S2:使用S1步骤中得到的有生物活性值的配体分子样本构建回归模型;S3:计算数据集中分子间的相似度;S4:利用S3步骤中得到的分子相似度和S2步骤中得到的回归模型,计算三元组损失;S5:根据S2步骤和S4步骤得到的损失函数训练模型。基于半监督学习方法,在模型训练中引入大量的无实验生物活性值样本,使用分子相似度和三元组损失对无实验生物活性值样本的模型预测值进行约束,解决实际应用场景中大量无生物活性值的样本无法有效参与模型训练的难题。

    基于端到端的分布式深度哈希检索方法

    公开(公告)号:CN112905599A

    公开(公告)日:2021-06-04

    申请号:CN202110288629.0

    申请日:2021-03-18

    Abstract: 本发明公开了基于端到端的分布式深度哈希检索方法,利用“二次前传”技术和交替方向乘子法ADMM来交互式更新分布式网络中的每个参数。本发明解决了传统的人工提取的特征在用于分布式环境下图像检索性能较差的问题。而且通过微调的ResNet网络,并不会损失太多分类性能,统一了分类与检索,同时采用了分布式架构,便于数据的并行式计算与存储。此外,通过卷积神经网络提取到的图像特征更具语义相似性。更重要的是,利用“二次前传”技术和ADMM算法实现参数的交互式更新,使得深度哈希技术与分布式架构完美结合。

    一种基于GPU加速AutoDock Vina的方法

    公开(公告)号:CN114373509B

    公开(公告)日:2024-10-29

    申请号:CN202111569787.X

    申请日:2021-12-21

    Abstract: 本发明公开了一种基于GPU加速AutoDock Vina的方法及实现,该方法通过增加初始随机配体构象的数目来扩展蒙特卡罗的迭代局部搜索方法中对接线程的并行规模,减少蒙特卡罗的迭代局部搜索方法中的搜索步数,利用OpenCL实现AutoDock Vina中CPU和GPU异构并行结构以此达到更高水平的并行和加速能力。现代药物筛选需要面对海量的化合物数据,目前的分子对接技术无法满足现实需求。采用本发明的方法,可以在保证不损失对接精度的同时大幅加快分子对接和虚拟筛选的速度,满足大型化合物数据库分子对接的实际需求。

    基于端到端的分布式深度哈希检索方法

    公开(公告)号:CN112905599B

    公开(公告)日:2022-10-14

    申请号:CN202110288629.0

    申请日:2021-03-18

    Abstract: 本发明公开了基于端到端的分布式深度哈希检索方法,利用“二次前传”技术和交替方向乘子法ADMM来交互式更新分布式网络中的每个参数。本发明解决了传统的人工提取的特征在用于分布式环境下图像检索性能较差的问题。而且通过微调的ResNet网络,并不会损失太多分类性能,统一了分类与检索,同时采用了分布式架构,便于数据的并行式计算与存储。此外,通过卷积神经网络提取到的图像特征更具语义相似性。更重要的是,利用“二次前传”技术和ADMM算法实现参数的交互式更新,使得深度哈希技术与分布式架构完美结合。

Patent Agency Ranking