-
公开(公告)号:CN119229982B
公开(公告)日:2025-02-25
申请号:CN202411719296.2
申请日:2024-11-28
Applicant: 三亚中国农业科学院国家南繁研究院 , 中国农业科学院农业信息研究所
IPC: G16B40/20 , G16B30/10 , G06N3/0442 , G06N3/0455 , G06F18/213 , G06F18/241 , G06F18/25
Abstract: 本发明提供了一种基于ESM‑2和双路径神经网络的DNA结合蛋白和RNA结合蛋白分类方法,具体表现为将ESM‑2与双路径神经网络相结合的分阶段分类方法,称为DRBP‑EDP;在第一阶段训练中,将蛋白质序列分类为核酸结合蛋白或非核酸结合蛋白;在第二阶段训练中,进一步将核酸结合蛋白分类为DNA结合蛋白或RNA结合蛋白;同时,本发明还构建了精细的数据集构建方法,从而创建了高质量的蛋白质分类数据集,通过这种方法,DRBP‑EDP模型取得了很好的性能,第一阶段对核酸结合蛋白和非核酸结合蛋白的分类准确率为90.03%,第二阶段对DNA结合蛋白和RNA结合蛋白的分类准确率为89.56%,不仅为蛋白质分类提出了新的见解和方法,还为研究蛋白质功能提供了创新工具,从而为生命科学的发展提供了新的机遇。
-
公开(公告)号:CN119229982A
公开(公告)日:2024-12-31
申请号:CN202411719296.2
申请日:2024-11-28
Applicant: 三亚中国农业科学院国家南繁研究院 , 中国农业科学院农业信息研究所
IPC: G16B40/20 , G16B30/10 , G06N3/0442 , G06N3/0455 , G06F18/213 , G06F18/241 , G06F18/25
Abstract: 本发明提供了一种基于ESM‑2和双路径神经网络的DNA结合蛋白和RNA结合蛋白分类方法,具体表现为将ESM‑2与双路径神经网络相结合的分阶段分类方法,称为DRBP‑EDP;在第一阶段训练中,将蛋白质序列分类为核酸结合蛋白或非核酸结合蛋白;在第二阶段训练中,进一步将核酸结合蛋白分类为DNA结合蛋白或RNA结合蛋白;同时,本发明还构建了精细的数据集构建方法,从而创建了高质量的蛋白质分类数据集,通过这种方法,DRBP‑EDP模型取得了很好的性能,第一阶段对核酸结合蛋白和非核酸结合蛋白的分类准确率为90.03%,第二阶段对DNA结合蛋白和RNA结合蛋白的分类准确率为89.56%,不仅为蛋白质分类提出了新的见解和方法,还为研究蛋白质功能提供了创新工具,从而为生命科学的发展提供了新的机遇。
-