-
公开(公告)号:CN115295081A
公开(公告)日:2022-11-04
申请号:CN202211085757.6
申请日:2022-09-06
Applicant: 东北林业大学
Abstract: 一种植物抗盐碱基因的识别方法及系统,具体涉及一种基于机器学习的植物抗盐碱基因的识别方法及系统,为解决抗盐碱基因识别方法依赖植物同源基因的识别,识别结果假阳性率和假阴性率都很高,导致植物抗盐碱功能基因识别准确率低的问题,它包括获取若干条已知是否为抗盐碱基因的植物蛋白序列;获取植物蛋白序列的特征向量;构建C4.5算法模型,用特征向量对C4.5算法模型进行训练,输出基因是否为抗盐碱基因,得到训练好的C4.5算法模型;对待识别的植物蛋白序列执行S2,得到特征向量,将特征向量输入训练好的C4.5算法模型,得到待识别的植物蛋白序列是否含有抗盐碱基因。所述系统执行如所述方法的任一步骤。属于基因识别领域。
-
公开(公告)号:CN116259363A
公开(公告)日:2023-06-13
申请号:CN202310255871.7
申请日:2023-03-16
Applicant: 东北林业大学
Abstract: 一种基于深度学习的植物抗旱基因的识别方法,为了解决现有的植物抗旱基因识别方法耗时长,成本大或过度依赖序列同源性,导致预测结果准确率低的问题。它包括以下步骤:首先获取不同植物的氨基酸序列及其对应的样本标签,样本标签为是否具有抗旱基因;将每条氨基酸序列分为多个长度为2的kmer,根据kmer提取每条氨基酸序列的特征;构建的BiLSTM‑Attention模型依次包括输入层、词嵌入层、特征提取层、注意力层和输出层,将每条氨基酸序列的特征输入BiLSTM‑Attention模型中进行训练,输出所述氨基酸序列是否具有抗旱基因。属于基因识别领域。
-