-
公开(公告)号:CN117668693A
公开(公告)日:2024-03-08
申请号:CN202311681898.9
申请日:2023-12-08
Applicant: 南京农业大学
IPC: G06F18/2415 , G06F18/22 , G06F18/214 , G06F18/25 , G06F18/213 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08 , G16B30/00 , G16B40/00
Abstract: 本发明公开了一种根据全基因组序列特征准确识别有益菌的方法,其包括:步骤1、数据获取及分类标记;步骤2、数据预处理;步骤3、使用k‑mer频率的方法,构建k‑mer频率特征作为输入特征;步骤4、构建网络预测模型,并利用模型进行预测识别:使用积分梯度方法获取基因权重定位关键基因。本发明为基于细菌基因组规模的有益性的精准识别提供新的思路和手段;同时,能够得到模型对每个基因的重视程度,定位到影响模型分类的关键基因;本方法的完善和推广具有广阔的前景和非凡的意义。