-
公开(公告)号:CN113724780B
公开(公告)日:2023-10-13
申请号:CN202111084566.3
申请日:2021-09-16
Applicant: 上海交通大学
IPC: G16B5/00 , G16B30/10 , G16B40/00 , G16B50/00 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 一种基于深度学习的蛋白质卷曲螺旋结构特征预测实现方法,使用两层卷积网络和两层双向长短时记忆网络分别提取序列的局部特征以及全局特征,经拼接后通过残差网络预处理,再分别经卷曲螺旋区域预测网络、七元标记位置预测网络以及寡聚体状态预测网络预测得到卷曲螺旋的卷曲螺旋区域、七元标记位置以及寡聚体状态。本发明采用自注意力机制使得模型自动关注卷曲螺旋中对预测至关重要的位置,并采用多类别交叉熵作为损失函数。模型最终的损失函数是三个网络损失函数的加权,以及网络参数的正则项。
-
公开(公告)号:CN113205855B
公开(公告)日:2022-08-05
申请号:CN202110636292.8
申请日:2021-06-08
Applicant: 上海交通大学
Abstract: 一种基于知识能量函数优化的膜蛋白三维结构预测方法,分别根据输入序列的多序列比对结果结合统计知识得到对残基距离的约束、根据输入序列的二级结构预测结果结合蛋白质结构数据库PDB中的已知结构,构建结构片段查询库、根据输入序列的残基接触预测结果计算知识基础的能量函数;然后在能量函数和残基距离约束的条件下对初始结构迭代地进行片段替换并得到若干候选结构;最后对候选结构进行筛选得到最终预测膜蛋白三维结构。本发明基于从头预测方法,使用多序列比对(MSA)、二级结构预测、残基接触预测等多项技术,具有操作方便,准确度高等优点。
-
-
公开(公告)号:CN110390995B
公开(公告)日:2022-03-11
申请号:CN201910585644.4
申请日:2019-07-01
Applicant: 上海交通大学
Abstract: 一种α螺旋跨膜蛋白质拓扑结构预测方法,根据跨膜α螺旋TMH的定义组织训练集、验证集和测试集;对训练集、验证集和测试集中的序列提取位置特异性打分矩阵PSSM、HMM、水溶性、二级结构、扭转角和亲水指数特征;使用训练集训练基于整条序列的深度残差网络模型和基于滑动窗口的深度残差网络模型。将两种网络的输出取平均值集成后,采用动态阈值算法得到TMH区域;使用训练集训练支持向量机模型。模型的输入是其他区域non‑TMH和TMH区域的交界部分;输出是non‑TMH相对于细胞膜的位置。首先预测蛋白质中的TMH区域,然后预测non‑TMH的位置,结合两部分的预测结果,就可以得到蛋白质最终的拓扑结构。
-
公开(公告)号:CN113205855A
公开(公告)日:2021-08-03
申请号:CN202110636292.8
申请日:2021-06-08
Applicant: 上海交通大学
Abstract: 一种基于知识能量函数优化的膜蛋白三维结构预测方法,分别根据输入序列的多序列比对结果结合统计知识得到对残基距离的约束、根据输入序列的二级结构预测结果结合蛋白质结构数据库PDB中的已知结构,构建结构片段查询库、根据输入序列的残基接触预测结果计算知识基础的能量函数;然后在能量函数和残基距离约束的条件下对初始结构迭代地进行片段替换并得到若干候选结构;最后对候选结构进行筛选得到最终预测膜蛋白三维结构。本发明基于从头预测方法,使用多序列比对(MSA)、二级结构预测、残基接触预测等多项技术,具有操作方便,准确度高等优点。
-
公开(公告)号:CN110390995A
公开(公告)日:2019-10-29
申请号:CN201910585644.4
申请日:2019-07-01
Applicant: 上海交通大学
Abstract: 一种α螺旋跨膜蛋白质拓扑结构预测方法,根据跨膜α螺旋TMH的定义组织训练集、验证集和测试集;对训练集、验证集和测试集中的序列提取位置特异性打分矩阵PSSM、HMM、水溶性、二级结构、扭转角和亲水指数特征;使用训练集训练基于整条序列的深度残差网络模型和基于滑动窗口的深度残差网络模型。将两种网络的输出取平均值集成后,采用动态阈值算法得到TMH区域;使用训练集训练支持向量机模型。模型的输入是其他区域non-TMH和TMH区域的交界部分;输出是non-TMH相对于细胞膜的位置。首先预测蛋白质中的TMH区域,然后预测non-TMH的位置,结合两部分的预测结果,就可以得到蛋白质最终的拓扑结构。
-
公开(公告)号:CN109637580B
公开(公告)日:2023-06-13
申请号:CN201811484434.8
申请日:2018-12-06
Applicant: 上海交通大学
IPC: G16B15/20
Abstract: 一种蛋白质氨基酸关联矩阵预测方法,包括:S1、组建蛋白质氨基酸关联图预测训练数据集;S2、在训练集中从蛋白质氨基酸序列中提取6种特征,并将每一个序列的6种特征合并,同时生成标签文件和权重掩模矩阵;S3、在改进的残差网络的基础上使用合并的特征、标签文件和权重掩模矩阵进行训练;S4、根据测试序列搜索同源序列列表,并得到这些同源序列的合并特征、标签文件、和权重掩模矩阵;S5、在步骤S3中得到的模型的基础上,使用步骤S4中得到的同源序列的合并特征、标签文件和权重掩模矩阵进行进一步训练;S6、根据测试氨基酸序列得到测试序列的合并特征,然后输入步骤S5中得到的预测模型进行预测。
-
公开(公告)号:CN113707213A
公开(公告)日:2021-11-26
申请号:CN202111047262.X
申请日:2021-09-08
Applicant: 上海交通大学
Abstract: 一种基于深度学习的蛋白质‑配体结合位点预测方法,提取待预测蛋白质中所有残基的α碳原子在三维空间中的全局坐标,然后根据全局坐标计算得到邻接矩阵和原始节点特征,输入基于动量对比学习框架的神经网络模型从而得到蛋白质结构的描述子。本发明将深度学习技术与蛋白质结构的领域的知识相结合,生成更有鉴别力的描述子,从而更准确地识别目标蛋白质的相似结构,并且可提升蛋白质结构分类的精度。
-
公开(公告)号:CN113724780A
公开(公告)日:2021-11-30
申请号:CN202111084566.3
申请日:2021-09-16
Applicant: 上海交通大学
Abstract: 一种基于深度学习的蛋白质卷曲螺旋结构特征预测实现方法,使用两层卷积网络和两层双向长短时记忆网络分别提取序列的局部特征以及全局特征,经拼接后通过残差网络预处理,再分别经卷曲螺旋区域预测网络、七元标记位置预测网络以及寡聚体状态预测网络预测得到卷曲螺旋的卷曲螺旋区域、七元标记位置以及寡聚体状态。本发明采用自注意力机制使得模型自动关注卷曲螺旋中对预测至关重要的位置,并采用多类别交叉熵作为损失函数。模型最终的损失函数是三个网络损失函数的加权,以及网络参数的正则项。
-
公开(公告)号:CN109637580A
公开(公告)日:2019-04-16
申请号:CN201811484434.8
申请日:2018-12-06
Applicant: 上海交通大学
IPC: G16B15/20
Abstract: 一种蛋白质氨基酸关联矩阵预测方法,包括:S1、组建蛋白质氨基酸关联图预测训练数据集;S2、在训练集中从蛋白质氨基酸序列中提取6种特征,并将每一个序列的6种特征合并,同时生成标签文件和权重掩模矩阵;S3、在改进的残差网络的基础上使用合并的特征、标签文件和权重掩模矩阵进行训练;S4、根据测试序列搜索同源序列列表,并得到这些同源序列的合并特征、标签文件、和权重掩模矩阵;S5、在步骤S3中得到的模型的基础上,使用步骤S4中得到的同源序列的合并特征、标签文件和权重掩模矩阵进行进一步训练;S6、根据测试氨基酸序列得到测试序列的合并特征,然后输入步骤S5中得到的预测模型进行预测。
-
-
-
-
-
-
-
-
-