-
公开(公告)号:CN118351929A
公开(公告)日:2024-07-16
申请号:CN202410447093.6
申请日:2024-04-15
Applicant: 南京工业大学
IPC: G16B15/20 , G16B20/00 , G16B40/20 , G06F18/21 , G06F18/243 , G06F18/214 , G06N3/042
Abstract: 本发明涉及基于图注意力网络的蛋白质可溶性预测方法,以氨基酸序列中的每一个氨基酸为节点,对节点提取特征作为节点属性,基于氨基酸的α碳原子间的距离建立边,构建蛋白质图;将蛋白质图输入图注意力网络进行特征提取,提取的特征向量经池化后,输入多层感知机生成可溶性预测结果。本发明的方法能够筛选出高可溶性方案从而降低研究成本,且极大地提高蛋白质相关性质的预测效果。
-
公开(公告)号:CN118351930A
公开(公告)日:2024-07-16
申请号:CN202410447095.5
申请日:2024-04-15
Applicant: 南京工业大学
IPC: G16B15/20 , G16B20/00 , G16B40/20 , G06F18/21 , G06F18/243 , G06F18/214 , G06N3/045 , G06N3/0464 , G06N3/0442
Abstract: 本发明涉及基于混合深度学习模型的蛋白质溶解度预测方法,包括:获取用于模型训练的氨基酸序列,并对其进行初步的可溶性标记,获取标记化的氨基酸序列;将标记化的氨基酸序列分别通过BERT‑CNN模型和双向LSTM神经网络进行特征提取,获取第一特征向量和第二特征向量;所述BERT‑CNN模型由BERT模型和一维CNN神经网络构成,所述双向LSTM神经网络为含隐藏层的双向LSTM神经网络;对未标记的氨基酸序列提取伪氨基酸组成特征和k间隔氨基酸对组成特征,形成第三特征向量;基于第一特征向量、第二特征向量和第三特征向量的组合特征进行可溶性判别,实现预测模型训练;利用训练好的预测模型进行待预测蛋白质的溶解度预测。本发明的方法可实现更准确的蛋白质溶解度预测。
-