-
公开(公告)号:CN119724367B
公开(公告)日:2025-04-22
申请号:CN202510201883.0
申请日:2025-02-24
Applicant: 西北农林科技大学
IPC: G16B40/00 , G16B15/20 , G16B20/00 , G16B30/10 , G06N3/042 , G06N3/045 , G06N3/084 , G06N3/0985 , G06N5/01 , G06F18/22 , G06F18/2413 , G06F18/25
Abstract: 本发明涉及基因编辑领域和人工智能领域,公开了一种基于图神经网络的Anti‑CRISPR蛋白识别方法。该方法通过构建异构网络对蛋白质之间的相似关系进行建模,利用图神经网络学习蛋白质特征,从而实现对Anti‑CRISPR蛋白的识别。本方法通过整合多种蛋白特征,包括组成特征、进化特征、重复和分布特征、序列相关性特征、结构相关特征以及ESM‑2蛋白质语言模型生成的嵌入表示,并结合图注意力机制(GAT)和基于空域的图神经网络(GraphSAGE),提高了识别性能。本发明在多个基准测试上表现出优异的准确性和鲁棒性,尤其在独立测试数据集上展现出更高的识别准确性,能够有效区分正负样本。此模型在Anti‑CRISPR蛋白的研究中具有重要的应用价值。
-
公开(公告)号:CN119724367A
公开(公告)日:2025-03-28
申请号:CN202510201883.0
申请日:2025-02-24
Applicant: 西北农林科技大学
IPC: G16B40/00 , G16B15/20 , G16B20/00 , G16B30/10 , G06N3/042 , G06N3/045 , G06N3/084 , G06N3/0985 , G06N5/01 , G06F18/22 , G06F18/2413 , G06F18/25
Abstract: 本发明涉及基因编辑领域和人工智能领域,公开了一种基于图神经网络的Anti‑CRISPR蛋白识别方法。该方法通过构建异构网络对蛋白质之间的相似关系进行建模,利用图神经网络学习蛋白质特征,从而实现对Anti‑CRISPR蛋白的识别。本方法通过整合多种蛋白特征,包括组成特征、进化特征、重复和分布特征、序列相关性特征、结构相关特征以及ESM‑2蛋白质语言模型生成的嵌入表示,并结合图注意力机制(GAT)和基于空域的图神经网络(GraphSAGE),提高了识别性能。本发明在多个基准测试上表现出优异的准确性和鲁棒性,尤其在独立测试数据集上展现出更高的识别准确性,能够有效区分正负样本。此模型在Anti‑CRISPR蛋白的研究中具有重要的应用价值。
-