一种基于字典学习的氨基酸序列特征提取方法

    公开(公告)号:CN112908418B

    公开(公告)日:2024-06-28

    申请号:CN202110143746.8

    申请日:2021-02-02

    Abstract: 本发明公开了一种基于字典学习的氨基酸序列特征提取方法。本发明首先给定一种AAindex,每条氨基酸肽序列数据都可用P=R1R2......RL表示,通过给定的AAindex,可将上述序列编码成PE=E1E2......EL。其中Ei为氨基酸残基的Ri的属性值;接着,对肽序列使用n‑gram模型分解成单词并分割成不同长度的片段,之后对同一长度的片段聚类生成字典;最后将样本基于欧氏距离的词频学习字典的特征构成样本特征矩阵。本发明能够有效的对氨基酸序列进行特征提取,实现降维,得到氨基酸中潜在的规律,特征选择的结果对样本类别判定具有重要意义,有效提高样本类别判定的准确率。

    一种基于深度学习和机器学习的抗病毒肽预测方法

    公开(公告)号:CN114093427A

    公开(公告)日:2022-02-25

    申请号:CN202111342907.2

    申请日:2021-11-12

    Abstract: 本发明公开了一种基于深度学习和机器学习领域的抗病毒肽预测方法,该方法的具体步骤如下:步骤1、获取序列数据,其中所获取的序列数据为待预测的肽序列;步骤2、对待预测的肽序列进行预处理;步骤3、将步骤2中得到的数据进行预测,并输出预测结果。其融合模型选择将神经网络和机器分类相结合,并采取两步走的预测方法,在交叉实验和独立测试集上的评估结果显示,FusedModel相比于其他模型,有着良好的分类结果,为抗病毒肽的识别提供了快速而又准确的方法,方便现代医疗的研究以及治疗。

    一种基于字典学习的氨基酸序列特征提取方法

    公开(公告)号:CN112908418A

    公开(公告)日:2021-06-04

    申请号:CN202110143746.8

    申请日:2021-02-02

    Abstract: 本发明公开了一种基于字典学习的氨基酸序列特征提取方法。本发明首先给定一种AAindex,每条氨基酸肽序列数据都可用P=R1R2......RL表示,通过给定的AAindex,可将上述序列编码成PE=E1E2......EL。其中Ei为氨基酸残基的Ri的属性值;接着,对肽序列使用n‑gram模型分解成单词并分割成不同长度的片段,之后对同一长度的片段聚类生成字典;最后将样本基于欧氏距离的词频学习字典的特征构成样本特征矩阵。本发明能够有效的对氨基酸序列进行特征提取,实现降维,得到氨基酸中潜在的规律,特征选择的结果对样本类别判定具有重要意义,有效提高样本类别判定的准确率。

Patent Agency Ranking