-
公开(公告)号:CN117953973B
公开(公告)日:2024-06-25
申请号:CN202410326309.3
申请日:2024-03-21
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种基于序列同源性的特定生物序列预测方法及其系统,包括,准备特定生物序列相关的原始序列数据集;原始序列数据集包括训练集和测试集,训练集用于训练模型,测试集则用于对训练的模型进行测试;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据特征向量输出预测结果;使用原始序列数据集训练深度模糊回声状态网络。本方案提出基于序列同源性评分的模糊隶属函数将序列数据转化成特征向量,无需手动提取特征,并且可直接处理字符串序列,无需进行特征编码,通过整合序列进化信息有效优化特征空间,不仅减少了模型的训练时间,同时提高了模型的分类性能。
-
公开(公告)号:CN117831638A
公开(公告)日:2024-04-05
申请号:CN202410020804.1
申请日:2024-01-04
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B40/20 , G16B20/30 , G06N3/042 , G06N3/043 , G06N3/044 , G06N3/0495 , G06N3/0985 , G06N5/048 , G06F18/2132 , G06F18/2136 , G06F18/241
Abstract: 本发明涉及生物信息学技术领域,尤其涉及一种鉴定DNA N6‑甲基腺嘌呤位点的深度模糊神经网络方法。该鉴定DNA N6‑甲基腺嘌呤位点的深度模糊神经网络方法,包括如下步骤:收集并下载原始序列数据集;基于获取的原始序列数据集,使用特征提取方法将序列数据转化为特征向量,得到特征集;将模糊层次回声状态分类模型作为分类器模型,利用网格搜索法和5折交叉验证方法确定模型的最优参数;采用训练好的分类模型构建DNAN6‑甲基腺嘌呤位点识别器,并将最佳特征集输入识别器中,完成对DNAN6‑甲基腺嘌呤位点的识别。本发明逐层挖掘和捕获隐藏特征,同时结合易于解释的模糊推理系统,分类性能更加优越,进一步提高了N6‑甲基腺嘌呤位点识别的准确率。
-
公开(公告)号:CN117953973A
公开(公告)日:2024-04-30
申请号:CN202410326309.3
申请日:2024-03-21
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种基于序列同源性的特定生物序列预测方法及其系统,包括,准备特定生物序列相关的原始序列数据集;原始序列数据集包括训练集和测试集,训练集用于训练模型,测试集则用于对训练的模型进行测试;构造基于序列同源性评分的模糊隶属函数,用于将序列数据转化成特征向量;构造深度模糊回声状态网络,用于根据特征向量输出预测结果;使用原始序列数据集训练深度模糊回声状态网络。本方案提出基于序列同源性评分的模糊隶属函数将序列数据转化成特征向量,无需手动提取特征,并且可直接处理字符串序列,无需进行特征编码,通过整合序列进化信息有效优化特征空间,不仅减少了模型的训练时间,同时提高了模型的分类性能。
-
-