-
公开(公告)号:CN118609644A
公开(公告)日:2024-09-06
申请号:CN202411080541.X
申请日:2024-08-08
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/00 , G16B30/00 , G16B40/00 , G06F18/213 , G06F18/241 , G06F18/2136 , G06N3/045 , G06N3/0442 , G06N3/084
Abstract: 本发明提供了一种基于相关熵核稀疏表示模型的生物序列预测方法及其系统,包括:准备生物序列数据集;将生物序列输入至堆叠双向长短记忆网络,以对生物序列进行特征提取,得到第二特征向量;将第二特征向量输入至神经正切核模型中,生成核矩阵;以核矩阵为输入利用相关熵损失函数训练核稀疏表示分类器以生成最终的分类模型。该方案为解决治疗肽等序列特征提取难的问题以及噪音序列对分类器的影响,使用了堆叠的双向长短记忆网和神经正切核来提取治疗肽序列同时利用相关熵损失函数来训练分类器,可有效减少噪音序列对分类器的影响,提高分类器的泛化能力。
-
公开(公告)号:CN118609644B
公开(公告)日:2024-11-05
申请号:CN202411080541.X
申请日:2024-08-08
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/00 , G16B30/00 , G16B40/00 , G06F18/213 , G06F18/241 , G06F18/2136 , G06N3/045 , G06N3/0442 , G06N3/084
Abstract: 本发明提供了一种基于相关熵核稀疏表示模型的生物序列预测方法及其系统,包括:准备生物序列数据集;将生物序列输入至堆叠双向长短记忆网络,以对生物序列进行特征提取,得到第二特征向量;将第二特征向量输入至神经正切核模型中,生成核矩阵;以核矩阵为输入利用相关熵损失函数训练核稀疏表示分类器以生成最终的分类模型。该方案为解决治疗肽等序列特征提取难的问题以及噪音序列对分类器的影响,使用了堆叠的双向长短记忆网和神经正切核来提取治疗肽序列同时利用相关熵损失函数来训练分类器,可有效减少噪音序列对分类器的影响,提高分类器的泛化能力。
-
公开(公告)号:CN117953973B
公开(公告)日:2024-06-25
申请号:CN202410326309.3
申请日:2024-03-21
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种基于序列同源性的特定生物序列预测方法及其系统,包括,准备特定生物序列相关的原始序列数据集;原始序列数据集包括训练集和测试集,训练集用于训练模型,测试集则用于对训练的模型进行测试;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据特征向量输出预测结果;使用原始序列数据集训练深度模糊回声状态网络。本方案提出基于序列同源性评分的模糊隶属函数将序列数据转化成特征向量,无需手动提取特征,并且可直接处理字符串序列,无需进行特征编码,通过整合序列进化信息有效优化特征空间,不仅减少了模型的训练时间,同时提高了模型的分类性能。
-
公开(公告)号:CN117953973A
公开(公告)日:2024-04-30
申请号:CN202410326309.3
申请日:2024-03-21
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种基于序列同源性的特定生物序列预测方法及其系统,包括,准备特定生物序列相关的原始序列数据集;原始序列数据集包括训练集和测试集,训练集用于训练模型,测试集则用于对训练的模型进行测试;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据特征向量输出预测结果;使用原始序列数据集训练深度模糊回声状态网络。本方案提出基于序列同源性评分的模糊隶属函数将序列数据转化成特征向量,无需手动提取特征,并且可直接处理字符串序列,无需进行特征编码,通过整合序列进化信息有效优化特征空间,不仅减少了模型的训练时间,同时提高了模型的分类性能。
-
-
-