-
公开(公告)号:CN119207581A
公开(公告)日:2024-12-27
申请号:CN202411248190.9
申请日:2024-09-06
Applicant: 安徽农业大学
IPC: G16B40/00 , G16B30/00 , G06N3/0455
Abstract: 本发明公开了一种基于集成学习的RNA中2OM位点预测方法,属于生物信息学技术领域。本发明针对RNA序列特性,对Promoter‑BERT模型进行特定任务的微调,使其能够更有效地捕捉特定任务中RNA序列的复杂模式,从而获取高质量的生物学特征表示;采用ANOVA技术对提取的特征进行选择,剔除冗余特征,保留最具影响力的特征,此外,结合传统的序列特征与通过Word2Vec模型得到的嵌入特征,以增强模型的表达能力;结合轻量级梯度提升机与深度学习模型的预测结果,通过软投票机制形成最终的预测模型,这种集成方法不仅提高了模型的泛化能力,还增加了预测的稳定性。
-
公开(公告)号:CN118761412B
公开(公告)日:2025-04-01
申请号:CN202410768730.X
申请日:2024-06-14
Applicant: 安徽农业大学
IPC: G06F40/284 , G16B25/00 , G06F18/214 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了一种基于生物分词的抗病毒肽预测方法,属于抗病毒肽药物预测技术领域,包括以下步骤:S1:构建数据集;S2:生物分词处理;S3:生物分词特征表示;S4:构建生物分词预测模型;S5:模型训练;S6:利用模型进行预测。本发明使用生物分词将肽序列表示为自然语言处理中的句子,然后使用Word2Vec来获取这些生物分词的嵌入表示,基于生物分词的嵌入表示,构建了生物分词预测模型,实现了对抗病毒肽更高的预测精度,并通过将本发明生物分词预测模型与其他最先进的模型进行比较,证明了所提出的生物分词方法的有效性。
-
公开(公告)号:CN118761412A
公开(公告)日:2024-10-11
申请号:CN202410768730.X
申请日:2024-06-14
Applicant: 安徽农业大学
IPC: G06F40/284 , G16B25/00 , G06F18/214 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了一种基于生物分词的抗病毒肽预测方法,属于抗病毒肽药物预测技术领域,包括以下步骤:S1:构建数据集;S2:生物分词处理;S3:生物分词特征表示;S4:构建生物分词预测模型;S5:模型训练;S6:利用模型进行预测。本发明使用生物分词将肽序列表示为自然语言处理中的句子,然后使用Word2Vec来获取这些生物分词的嵌入表示,基于生物分词的嵌入表示,构建了生物分词预测模型,实现了对抗病毒肽更高的预测精度,并通过将本发明生物分词预测模型与其他最先进的模型进行比较,证明了所提出的生物分词方法的有效性。
-
-