-
公开(公告)号:CN113838520B
公开(公告)日:2024-03-29
申请号:CN202111136236.4
申请日:2021-09-27
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/00 , G06F18/22 , G06F18/241
Abstract: 本发明提供一种III型分泌系统效应蛋白识别方法及装置,方法为导入III型分泌系统效应蛋白序列数据文件,获取原始III型分泌系统效应蛋白数据集;从原始III型分泌系统效应蛋白数据集中提取数据特征,根据数据特征构建特征矩阵;对特征矩阵进行标签设置,得到第一III型分泌系统效应蛋白基分类器;构建特征相似度评分矩阵;通过特征相似度评分矩阵构建第二III型分泌系统效应蛋白基分类器;根据集成策略将第一III型分泌系统效应蛋白基分类器和第二III型分泌系统效应蛋白基分类器集成III型分泌系统效应蛋白模型;本发明提出了一种全新的III型分泌系统效应蛋白识别方法,生成了综合性能更优,得到应用更加广泛的III型分泌系统效应蛋白模型。
-
公开(公告)号:CN113837293A
公开(公告)日:2021-12-24
申请号:CN202111138369.5
申请日:2021-09-27
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种mRNA亚细胞定位模型的训练方法包括以下步骤:获取mRNA亚细胞位置序列样本集;根据多种特征提取算法对mRNA亚细胞位置序列样本集进行特征提取,利用基分类器分别对特征识别,并对基分类器一层以上集成,再根据特征提取算法和集成分类器,得到目标mRNA亚细胞定位模型。本发明通过对多个分类器集成学习训练,不但可以提高训练的效率,使得模型在训练过程更容易得到全局最优解,从而得到训练完成后的目标模型会有更优秀的预测能力和泛化能力。
-
公开(公告)号:CN113823356B
公开(公告)日:2024-05-28
申请号:CN202111136225.6
申请日:2021-09-27
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B40/20 , G16B20/30 , G06F18/241
Abstract: 本发明提供一种甲基化位点识别方法及装置,方法包括:导入甲基化位点识别序列数据文件,并从甲基化位点识别序列数据文件中获取待处理的原始甲基化位点数据集;从原始甲基化位点数据集中提取数据特征,得到特征矩阵;对所述特征矩阵进行特征选择,选择得到多个特征和与其关联的实例类别,根据多个特征和与其关联的实例类别得到特征子集基于所述特征子集中的多个目标特征分别生成对应的基分类器;将多个基分类器进行集成,得到可识别甲基化位点的甲基化位点识别模型。本发明能够实现对甲基化位点的准确识别,为相应药物开发提供了理论基础,通过对基分类器进行集成进而构建甲基化位点识别模型,提升了甲基化位点识别精度。
-
公开(公告)号:CN113971985A
公开(公告)日:2022-01-25
申请号:CN202111517151.0
申请日:2021-12-13
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 基于集成学习的嗜热蛋白的识别方法、存储介质及设备,属于蛋白质识别技术和计算机技术交叉领域。为了解决目前的嗜热蛋白的识别方法的识别精度还有待于提高的问题。本发明首先获取待处理的嗜热蛋白数据,并提取嗜热蛋白数据集的数据特征,利用嗜热蛋白的分类模型进行识别;在嗜热蛋白的分类模型的构建过程中,采用M种特征提取方法提取嗜热蛋白数据集的数据特征,采用MRMD算法分别对每个特征文件中的特征进行特征选择,得到特征与实例类别具有相关性的特征子集;引入个机器学习算法与选择后的特征子集进行结合以生成基分类器;然后对基分类器进行筛选并进行集成,通过投票法生成最终的分类结果,进而确定分类模型。主要用于嗜热蛋白的识别。
-
公开(公告)号:CN113838520A
公开(公告)日:2021-12-24
申请号:CN202111136236.4
申请日:2021-09-27
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供一种III型分泌系统效应蛋白识别方法及装置,方法为导入III型分泌系统效应蛋白序列数据文件,获取原始III型分泌系统效应蛋白数据集;从原始III型分泌系统效应蛋白数据集中提取数据特征,根据数据特征构建特征矩阵;对特征矩阵进行标签设置,得到第一III型分泌系统效应蛋白基分类器;构建特征相似度评分矩阵;通过特征相似度评分矩阵构建第二III型分泌系统效应蛋白基分类器;根据集成策略将第一III型分泌系统效应蛋白基分类器和第二III型分泌系统效应蛋白基分类器集成III型分泌系统效应蛋白模型;本发明提出了一种全新的III型分泌系统效应蛋白识别方法,生成了综合性能更优,得到应用更加广泛的III型分泌系统效应蛋白模型。
-
公开(公告)号:CN113837293B
公开(公告)日:2024-08-27
申请号:CN202111138369.5
申请日:2021-09-27
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G06F18/241 , G06F18/214 , G06N20/20 , G16B30/00
Abstract: 本发明提供了一种mRNA亚细胞定位模型的训练方法包括以下步骤:获取mRNA亚细胞位置序列样本集;根据多种特征提取算法对mRNA亚细胞位置序列样本集进行特征提取,利用基分类器分别对特征识别,并对基分类器一层以上集成,再根据特征提取算法和集成分类器,得到目标mRNA亚细胞定位模型。本发明通过对多个分类器集成学习训练,不但可以提高训练的效率,使得模型在训练过程更容易得到全局最优解,从而得到训练完成后的目标模型会有更优秀的预测能力和泛化能力。
-
公开(公告)号:CN113823356A
公开(公告)日:2021-12-21
申请号:CN202111136225.6
申请日:2021-09-27
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供一种甲基化位点识别方法及装置,方法包括:导入甲基化位点识别序列数据文件,并从甲基化位点识别序列数据文件中获取待处理的原始甲基化位点数据集;从原始甲基化位点数据集中提取数据特征,得到特征矩阵;对所述特征矩阵进行特征选择,选择得到多个特征和与其关联的实例类别,根据多个特征和与其关联的实例类别得到特征子集基于所述特征子集中的多个目标特征分别生成对应的基分类器;将多个基分类器进行集成,得到可识别甲基化位点的甲基化位点识别模型。本发明能够实现对甲基化位点的准确识别,为相应药物开发提供了理论基础,通过对基分类器进行集成进而构建甲基化位点识别模型,提升了甲基化位点识别精度。
-
-
-
-
-
-