-
公开(公告)号:CN112185466A
公开(公告)日:2021-01-05
申请号:CN202011016871.4
申请日:2020-09-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种直接利用蛋白质多序列联配信息构建蛋白质结构的方法和系统,包括:使用第一编码器为蛋白质多序列联配信息中每个残基位置提取上下文表示作为该残基位置所处的结构环境;使用聚合器根据该结构环境聚合每个残基对编码特征向量,将得到该蛋白质多序列联配信息中残基对的聚合特征作为初始关联性;根据所有残基对的全局上下文,使用第二编码器细化该初始关联性,得到该蛋白质多序列联配信息中每一个残基对的最终关联性,根据该最终关联性生成该蛋白质多序列联配信息中残基间距离,基于该残基间距离构建蛋白质的三级结构。本发明直接从多序列联配学习残基间距离,因此可以提高残基间距离预测的精度,显著提高了蛋白质空间结构的预测精度。
-
公开(公告)号:CN112185466B
公开(公告)日:2023-05-23
申请号:CN202011016871.4
申请日:2020-09-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种直接利用蛋白质多序列联配信息构建蛋白质结构的方法和系统,包括:使用第一编码器为蛋白质多序列联配信息中每个残基位置提取上下文表示作为该残基位置所处的结构环境;使用聚合器根据该结构环境聚合每个残基对编码特征向量,将得到该蛋白质多序列联配信息中残基对的聚合特征作为初始关联性;根据所有残基对的全局上下文,使用第二编码器细化该初始关联性,得到该蛋白质多序列联配信息中每一个残基对的最终关联性,根据该最终关联性生成该蛋白质多序列联配信息中残基间距离,基于该残基间距离构建蛋白质的三级结构。本发明直接从多序列联配学习残基间距离,因此可以提高残基间距离预测的精度,显著提高了蛋白质空间结构的预测精度。
-