-
公开(公告)号:CN119028436B
公开(公告)日:2025-04-11
申请号:CN202410945326.5
申请日:2024-07-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G16B25/00 , G16B5/00 , G16B40/00 , G16B30/10 , G06F18/213 , G06N3/042 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于异构网络的多物种蛋白质功能预测方法及系统,所述方法包括:使用ESM‑2模型对蛋白质序列进行特征提取,得到序列特征;构建蛋白质的结构接触图,基于图卷积和层次图池化的结构模型对结构接触图训练,提取结构特征;将序列特征和结构特征进行拼接,根据PPI网络和同源相似性网络构建跨物种的异构网络;在训练阶段,使用结构特征和序列特征在异构网络上传播,并在传播时使用图注意力机制更新节点向量;在预测阶段,加入训练集的GO标签进行网络传播,将蛋白质表示和GO标签的传播结果进行线性组合,得到最终的GO标签预测概率。本发明提高了多物种蛋白质功能预测的预测效果,实现了功能标签的跨物种传播。
-
公开(公告)号:CN116884473B
公开(公告)日:2024-04-26
申请号:CN202310581243.8
申请日:2023-05-22
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G16B15/20 , G16B40/00 , G06F18/214 , G06F18/241
Abstract: 本发明公开了一种蛋白质功能预测模型生成方法及装置,包括获取训练蛋白质的氨基酸三维原子坐标,并根据其进行图论方法生成蛋白质二维接触图;对训练蛋白质的氨基酸三维原子坐标进行算法处理获取第一特征矩阵,对蛋白质二维接触图进行算法处理获取第二特征矩阵,第一特征矩阵与训练蛋白质的氨基酸三维原子坐标中序列作用位点对应,第二特征矩阵与训练蛋白质的氨基酸三维原子坐标中结构作用折叠结构对应;根据第一特征矩阵和第二特征矩阵分别对应的数据标签训练预先构建的蛋白质功能分类器,得到蛋白质功能预测模型。通过将训练蛋白质的氨基酸结构和序列作为信息源提取特征,提高了预测模型对蛋白质功能的预测精度。
-
公开(公告)号:CN117133436A
公开(公告)日:2023-11-28
申请号:CN202311346273.7
申请日:2023-10-17
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于多源数据融合的药物疾病关联预测方法、装置及设备,该方法包括:基于预设元路径在异构网络中进行随机单向游走获得源药物节点的邻域和目标疾病节点的邻域;计算邻域间的嵌入表示,确定虚拟节点之间的归一化的注意力系数;基于归一化的注意力系数确定的邻域间的相互作用表示的标准化注意力值;将标准化注意力值与虚拟节点的嵌入表示融合,将融合获得的药物疾病节点对间边的嵌入表示与对应的初始嵌入特征进行拼接,施加一个多层感知机获得药物疾病对的预测结果。如此,基于预设元路径进行随机游走取样,并基于邻域间嵌入表示、邻域内相互作用结果进行结果预测,提取了异构网络的丰富语义信息,提高模型对药物疾病的预测性能。
-
公开(公告)号:CN119028436A
公开(公告)日:2024-11-26
申请号:CN202410945326.5
申请日:2024-07-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G16B25/00 , G16B5/00 , G16B40/00 , G16B30/10 , G06F18/213 , G06N3/042 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于异构网络的多物种蛋白质功能预测方法及系统,所述方法包括:使用ESM‑2模型对蛋白质序列进行特征提取,得到序列特征;构建蛋白质的结构接触图,基于图卷积和层次图池化的结构模型对结构接触图训练,提取结构特征;将序列特征和结构特征进行拼接,根据PPI网络和同源相似性网络构建跨物种的异构网络;在训练阶段,使用结构特征和序列特征在异构网络上传播,并在传播时使用图注意力机制更新节点向量;在预测阶段,加入训练集的GO标签进行网络传播,将蛋白质表示和GO标签的传播结果进行线性组合,得到最终的GO标签预测概率。本发明提高了多物种蛋白质功能预测的预测效果,实现了功能标签的跨物种传播。
-
公开(公告)号:CN116884473A
公开(公告)日:2023-10-13
申请号:CN202310581243.8
申请日:2023-05-22
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G16B15/20 , G16B40/00 , G06F18/214 , G06F18/241
Abstract: 本发明公开了一种蛋白质功能预测模型生成方法及装置,包括获取训练蛋白质的氨基酸三维原子坐标,并根据其进行图论方法生成蛋白质二维接触图;对训练蛋白质的氨基酸三维原子坐标进行算法处理获取第一特征矩阵,对蛋白质二维接触图进行算法处理获取第二特征矩阵,第一特征矩阵与训练蛋白质的氨基酸三维原子坐标中序列作用位点对应,第二特征矩阵与训练蛋白质的氨基酸三维原子坐标中结构作用折叠结构对应;根据第一特征矩阵和第二特征矩阵分别对应的数据标签训练预先构建的蛋白质功能分类器,得到蛋白质功能预测模型。通过将训练蛋白质的氨基酸结构和序列作为信息源提取特征,提高了预测模型对蛋白质功能的预测精度。
-
-
-
-