基于深度学习表征的蛋白质结构搜索实现方法

    公开(公告)号:CN118098361A

    公开(公告)日:2024-05-28

    申请号:CN202410228813.X

    申请日:2024-02-29

    Inventor: 柳源 沈红斌 张颖

    Abstract: 一种基于深度学习表征的蛋白质结构搜索实现方法,通过从蛋白质结构文件中提取蛋白质序列和三级结构并分别通过蛋白质语言模型提取出序列嵌入、通过采用多层图注意力神经网络提取出三级结构嵌入,经特征融合和归一化处理得到最终结构表征后,将最终结构表征与结构表征数据库进行比较,输出搜索到的相似结构。本发明显著提高了搜索的速度和精度。

    基于深度学习的蛋白质卷曲螺旋结构特征预测实现方法

    公开(公告)号:CN113724780B

    公开(公告)日:2023-10-13

    申请号:CN202111084566.3

    申请日:2021-09-16

    Abstract: 一种基于深度学习的蛋白质卷曲螺旋结构特征预测实现方法,使用两层卷积网络和两层双向长短时记忆网络分别提取序列的局部特征以及全局特征,经拼接后通过残差网络预处理,再分别经卷曲螺旋区域预测网络、七元标记位置预测网络以及寡聚体状态预测网络预测得到卷曲螺旋的卷曲螺旋区域、七元标记位置以及寡聚体状态。本发明采用自注意力机制使得模型自动关注卷曲螺旋中对预测至关重要的位置,并采用多类别交叉熵作为损失函数。模型最终的损失函数是三个网络损失函数的加权,以及网络参数的正则项。

    基于神经网络的药物分子结构辅助设计方法

    公开(公告)号:CN115798632A

    公开(公告)日:2023-03-14

    申请号:CN202211475314.8

    申请日:2022-11-23

    Abstract: 一种基于神经网络的药物分子结构辅助设计方法,使用多目标强化学习模型批量生成小分子;以数据库中收录的药物分子作为正样本,强化学习模型生成的质量较低的分子作为负样本,构建基准数据集;输入图神经网络模型GIN中训练,得到训练好的分子质量评估QA模型;构建分数库,根据QA模型对新分子的预测分数在分数库中的秩重新定义质量评估得分QAscore;加入QAscore作为多目标强化学习模型的优化目标之一,重新生成分子;将多目标强化学习模型生成的分子反馈到QA模型中重新训练;反复迭代至多目标强化学习模型生成的分子类药性等指标不再有明显的提高。本发明实现多目标的并行优化的同时将强化学习和质量评估图神经网络的有机结合。

    基于知识能量函数优化的膜蛋白三维结构预测方法

    公开(公告)号:CN113205855B

    公开(公告)日:2022-08-05

    申请号:CN202110636292.8

    申请日:2021-06-08

    Abstract: 一种基于知识能量函数优化的膜蛋白三维结构预测方法,分别根据输入序列的多序列比对结果结合统计知识得到对残基距离的约束、根据输入序列的二级结构预测结果结合蛋白质结构数据库PDB中的已知结构,构建结构片段查询库、根据输入序列的残基接触预测结果计算知识基础的能量函数;然后在能量函数和残基距离约束的条件下对初始结构迭代地进行片段替换并得到若干候选结构;最后对候选结构进行筛选得到最终预测膜蛋白三维结构。本发明基于从头预测方法,使用多序列比对(MSA)、二级结构预测、残基接触预测等多项技术,具有操作方便,准确度高等优点。

    基于傅里叶功率谱的冷冻电镜单颗粒图像配准方法

    公开(公告)号:CN112614170B

    公开(公告)日:2022-08-05

    申请号:CN202110022500.5

    申请日:2021-01-08

    Inventor: 陈宇轩 沈红斌

    Abstract: 一种基于傅里叶功率谱的冷冻电镜单颗粒图像配准方法,通过对待测冷冻电镜单颗粒图片集进行功率谱高通滤波器参数估计,然后计算待配准图像的傅里叶功率谱,并提取特征点,根据特征点对待配准图像进行反旋转后对图像进行矫正;基于傅里叶功率谱的旋转周期性,再次根据特征点计算另一相对旋转角后进行相对反旋转和相对矫正,最后根据矫正以及相对矫正得到的矫正图像与目标图像进行相似性计算,取相似性最高的矫正图像作为配准参数结果。本发明使用傅里叶功率谱域的分析对噪声、颗粒以及背景进行了有效分离,同时基于快速傅里叶变换的有效实现大大提高了算法的计算性能,无需进行迭代修正可直接计算出配准参数,使得配准无论从计算速度还是精度与鲁棒性上都得到了提升。

    一种基于深度学习的蛋白质-配体结合位点预测方法

    公开(公告)号:CN110689920B

    公开(公告)日:2022-02-11

    申请号:CN201910879922.7

    申请日:2019-09-18

    Abstract: 本发明公开了一种基于深度学习的蛋白质‑配体结合位点预测算法,对于待预测的蛋白质,首先提取其序列特征和距离矩阵,然后将序列特征通过滑动窗口方法分配到每个残基上,然后将残基所对应的特征逐个输入到残差神经网络和混合神经网络中,并将残差神经网络和混合神经网络的输出结果输入到Logistic回归分类器中,最终结果即为蛋白质中每个残基对应的结合概率。本发明将经典的双向长短时记忆网络和残差神经网络进行了融合,融合后的网络可以同时处理异构的蛋白质序列和结构数据,并挖掘出了序列特征和结构特征的互补性。与现有方法相比,有着更高的预测精度,且针对不同配体的数据集都有着不错的泛化性能。

    一种基于深度学习的长链非编码RNA亚细胞位置预测方法

    公开(公告)号:CN107577924B

    公开(公告)日:2021-05-11

    申请号:CN201710951364.1

    申请日:2017-10-13

    Inventor: 曹真 杨旸 沈红斌

    Abstract: 本发明涉及RNA生物学领域,具体涉及一种基于深度学习的长链非编码RNA(long noncoding RNA,lncRNA)亚细胞位置预测算法。针对多分类问题训练样本中存在的类别不均衡性,本发明提出了一种新型的上采样方法来对训练样本进行预处理。采用堆叠的栈式自编码器来对序列的原始特征进行特征提取。本发明采用了基于深度学习的融合算法来整合多个分类器的预测效果。采用上采样方法大大减小了数据集的不平衡性对分类器效果的影响。在原始特征中有效提取出了区分度较高的更高层次特征。采用基于深度学习的融合算法整合各个分类器的预测结果,提高了鲁棒性,更加适应亚细胞位置多样性和复杂性的具体情形。

    基于融合领域规则和深度学习的蛋白质信号肽及其切割位点预测实现方法

    公开(公告)号:CN111091871A

    公开(公告)日:2020-05-01

    申请号:CN201911317226.3

    申请日:2019-12-19

    Abstract: 一种基于融合领域规则和深度学习的蛋白质信号肽及其切割位点预测实现方法,以待测氨基酸序列的PSSM和HMM合成其氨基酸序列表征后,依次通过序列级分类和残基级分类得到待测氨基酸序列是否包含信号肽、跨膜螺旋或属于非分泌蛋白以及每个残基具体属于信号肽、切割位点或成熟蛋白质,再根据预测结果进行加权合并后以最大统计分数对应的位点作为最终预测出的信号肽切割位点。本发明利用深度模型直接分类信号肽、跨膜螺旋及非分泌蛋白,通过在biLSTM网络上结合自注意力机制显著提升了识别蛋白质信号肽切割位点识别的精度。

    一种基于深度学习的蛋白质-配体结合位点预测算法

    公开(公告)号:CN110689920A

    公开(公告)日:2020-01-14

    申请号:CN201910879922.7

    申请日:2019-09-18

    Abstract: 本发明公开了一种基于深度学习的蛋白质-配体结合位点预测算法,对于待预测的蛋白质,首先提取其序列特征和距离矩阵,然后将序列特征通过滑动窗口方法分配到每个残基上,然后将残基所对应的特征逐个输入到残差神经网络和混合神经网络中,并将残差神经网络和混合神经网络的输出结果输入到Logistic回归分类器中,最终结果即为蛋白质中每个残基对应的结合概率。本发明将经典的双向长短时记忆网络和残差神经网络进行了融合,融合后的网络可以同时处理异构的蛋白质序列和结构数据,并挖掘出了序列特征和结构特征的互补性。与现有方法相比,有着更高的预测精度,且针对不同配体的数据集都有着不错的泛化性能。

Patent Agency Ranking