一种基于结构特征的DNA绑定残基预测方法

    公开(公告)号:CN112837740B

    公开(公告)日:2024-03-26

    申请号:CN202110081107.3

    申请日:2021-01-21

    摘要: 一种基于结构特征的DNA绑定残基预测方法,首先,根据输入的待进行DNA绑定残基预测的蛋白质结构信息,以任一残基为球心,R为半径,通过以下四步获取该残基的特征向量:1)统计该球内20种常见类型残基出现的频率,记作#imgabs0#2)统计该球内三类二级结构类别的残基出现的频率,记作#imgabs1#3)统计该球内三类溶剂可及性类别的残基出现的频率,记作#imgabs2#4)将步骤1)至3)中的#imgabs3#串联成一个特征向量;然后,构建样本集并训练所搭建的一维卷积神经网络;最后,将蛋白质结构中残基的特征向量输入训练的模型中,根据模型输出概率是否大于阈值threshold,进而判断对应残基是否为DNA绑定残基。本发明计算代价小、预测精度高。

    一种基于蛋白质序列比对的分子虚拟筛选方法

    公开(公告)号:CN112820355B

    公开(公告)日:2024-03-22

    申请号:CN202011483191.3

    申请日:2020-12-16

    IPC分类号: G16B35/20 G16B30/10 G06F18/22

    摘要: 一种基于蛋白质序列比对的分子虚拟筛选方法,根据输入的待进行分子筛选的蛋白质序列,使用HHblits程序获取蛋白质的多序列联配信息;计算待预测的蛋白质序列和多序列联配信息对应位置出现相同残基的频率PSFM;使用同样的方法,生成蛋白质‑配体相互作用数据库BioLiP中每条蛋白质序列的PSFM;计算待预测蛋白质与BioLiP中每条蛋白质的残基对齐得分与相似度匹配质量,根据匹配质量得分取得潜在种子分子集;计算分子数据库中每个分子与种子分子集中的所有分子的二维指纹图谱值之和,根据得分对DrugBank中所有分子进行排序,取得分靠前的x·NDrugBank个分子为待分子筛选蛋白质序列的分子筛选集。本发明可用于任何筛选场景。

    一种基于结构特征的DNA绑定残基预测方法

    公开(公告)号:CN112837740A

    公开(公告)日:2021-05-25

    申请号:CN202110081107.3

    申请日:2021-01-21

    摘要: 一种基于结构特征的DNA绑定残基预测方法,首先,根据输入的待进行DNA绑定残基预测的蛋白质结构信息,以任一残基为球心,R为半径,通过以下四步获取该残基的特征向量:1)统计该球内20种常见类型残基出现的频率,记作2)统计该球内三类二级结构类别的残基出现的频率,记作3)统计该球内三类溶剂可及性类别的残基出现的频率,记作4)将步骤1)至3)中的串联成一个特征向量;然后,构建样本集并训练所搭建的一维卷积神经网络;最后,将蛋白质结构中残基的特征向量输入训练的模型中,根据模型输出概率是否大于阈值threshold,进而判断对应残基是否为DNA绑定残基。本发明计算代价小、预测精度高。

    一种基于循环网络的蛋白质与蛋白质相互作用预测方法

    公开(公告)号:CN112837742B

    公开(公告)日:2024-03-26

    申请号:CN202110086831.5

    申请日:2021-01-22

    摘要: 一种基于循环网络的蛋白质与蛋白质相互作用预测方法,首先,根据输入的待测定蛋白质‑蛋白质作用的蛋白质序列信息,生成蛋白质序列的残基组成特征、残基过渡特征、残基分布特征;其次,生成蛋白质序列的残基组成特征、残基过渡特征、残基分布特征;然后,生成蛋白质序列的残基组成特征、残基过渡特征、残基分布特征;再次,搭建循环神经网络框架,从PDB库中收集已有蛋白质‑蛋白质界面相互作用的蛋白质序列和标签,计算蛋白质序列的特征张量,与对应的标签组成数据集,使用循环神经网络框架在数据集上学习预测模型;最后,将待进行蛋白质‑蛋白质界面相互作用预测的特征向量输入模型中,得到界面作用预测结果。本发明计算代价低、预测精度高。

    一种基于蛋白质序列比对的分子虚拟筛选方法

    公开(公告)号:CN112820355A

    公开(公告)日:2021-05-18

    申请号:CN202011483191.3

    申请日:2020-12-16

    IPC分类号: G16B35/20 G16B30/10 G06K9/62

    摘要: 一种基于蛋白质序列比对的分子虚拟筛选方法,根据输入的待进行分子筛选的蛋白质序列,使用HHblits程序获取蛋白质的多序列联配信息;计算待预测的蛋白质序列和多序列联配信息对应位置出现相同残基的频率PSFM;使用同样的方法,生成蛋白质‑配体相互作用数据库BioLiP中每条蛋白质序列的PSFM;计算待预测蛋白质与BioLiP中每条蛋白质的残基对齐得分与相似度匹配质量,根据匹配质量得分取得潜在种子分子集;计算分子数据库中每个分子与种子分子集中的所有分子的二维指纹图谱值之和,根据得分对DrugBank中所有分子进行排序,取得分靠前的x·NDrugBank个分子为待分子筛选蛋白质序列的分子筛选集。本发明可用于任何筛选场景。

    一种基于深度卷积神经网络的DNA绑定残基预测方法

    公开(公告)号:CN111785321A

    公开(公告)日:2020-10-16

    申请号:CN202010533489.4

    申请日:2020-06-12

    摘要: 一种基于深度卷积神经网络的DNA绑定残基预测方法,首先,根据输入的残基数为L待进行配体绑定残基预测的蛋白质序列信息,使用psi-blast程序和PSSpred程序获取矩阵PSSM和PSS;然后,将两个矩阵组合为一个特征矩阵F;其次,我们将蛋白质序列处理成残基样本;再次,搭建深度卷积神经网络,利用已知绑定残基的蛋白质序列构建数据集,并将数据集划分为M组数据子集,利用这十组数据子集训练出M个网络模型;最后,将待进行预测的蛋白质序列处理成残基样本,并输入到被训练过的M个网络模型中,综合这M个模型的预测结果,预测蛋白质序列中的残基是否为绑定残基。本发明计算代价小、预测精度高。

    一种基于多序列联配信息的配体绑定残基预测方法

    公开(公告)号:CN111081312A

    公开(公告)日:2020-04-28

    申请号:CN201911225431.7

    申请日:2019-12-04

    IPC分类号: G16B15/30

    摘要: 一种基于多序列联配信息的配体绑定残基预测方法,首先,根据输入的待进行配体绑定残基预测的蛋白质序列和绑定残基的个数,使用HHblits程序获取蛋白质的多序列联配信息;然后,计算待预测的蛋白质序列和多序列联配信息对应位置出现相同残基的频率;再次,根据计算得到的频率以及输入的绑定残基个数,计算得到伪协相关性系数矩阵;最后,取得伪协相关性系数矩阵中的最大值,根据最大值对应位置输出待预测蛋白质序列中绑定同一配体的残基信息。本发明提出一种计算代价小、预测精度高的基于多序列联配信息的配体绑定残基预测方法。

    一种基于深度卷积网络的ATP绑定残基预测方法

    公开(公告)号:CN112466392B

    公开(公告)日:2024-03-22

    申请号:CN202011262890.5

    申请日:2020-11-12

    IPC分类号: G16B15/20 G06N3/0464 G06N3/06

    摘要: 一种基于深度卷积网络的ATP绑定残基预测方法,根据输入待进行ATP绑定残基预测的蛋白质序列信息P,其残基个数为L,使用HHblits程序获取包含M条序列的多序列联配信息;计算这M条序列的对应位置与20种残基对应位置出现相同类型的频率,得到位置特异性频率矩阵;采用滑动窗口技术对位置特异性频率矩阵中的每个残基进行特征视图处理,并将这些特征视图扩展为特征张量;搭建深度卷积网络并利用已知ATP绑定残基的蛋白质序列生成对应的特征张量对该网络进行训练;将待预测的蛋白质序列生成的特征张量输入到训练好的深度卷积网络模型中,预测蛋白质序列中的残基是否为ATP绑定残基。本发明计算代价小、预测精度高。

    一种基于卷积神经网络的DNA绑定残基预测方法

    公开(公告)号:CN112149881B

    公开(公告)日:2023-12-29

    申请号:CN202010918314.5

    申请日:2020-09-03

    摘要: 一种基于卷积神经网络的DNA绑定残基预测方法,首先,根据输入残基数为L的待进行DNA绑定残基预测的蛋白质序列信息,分别使用HHblits、PSIPRED、SANN和I‑LBR程序获取特征矩阵PSFM、PSS、PSA和ILBR;然后,将以上四个矩阵组合为一个特征矩阵F并将其转化为特征张量;其次,我们将蛋白质序列处理成残基样本;再次,搭建卷积神经网络,利用已知绑定残基的蛋白质序列构建数据集并训练所搭建的网络;最后,将待进行预测的蛋白质序列的残基样本输入到训练的模型中,根据模型输出概率是否大于判定阈值threshold,进而判断对应的残基是否为DNA绑定残基。本发明计算代价小、预测精度高。

    一种基于深度卷积神经网络的DNA绑定残基预测方法

    公开(公告)号:CN111785321B

    公开(公告)日:2022-04-05

    申请号:CN202010533489.4

    申请日:2020-06-12

    摘要: 一种基于深度卷积神经网络的DNA绑定残基预测方法,首先,根据输入的残基数为L待进行配体绑定残基预测的蛋白质序列信息,使用psi‑blast程序和PSSpred程序获取矩阵PSSM和PSS;然后,将两个矩阵组合为一个特征矩阵F;其次,我们将蛋白质序列处理成残基样本;再次,搭建深度卷积神经网络,利用已知绑定残基的蛋白质序列构建数据集,并将数据集划分为M组数据子集,利用这十组数据子集训练出M个网络模型;最后,将待进行预测的蛋白质序列处理成残基样本,并输入到被训练过的M个网络模型中,综合这M个模型的预测结果,预测蛋白质序列中的残基是否为绑定残基。本发明计算代价小、预测精度高。