一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法

    公开(公告)号:CN119479908A

    公开(公告)日:2025-02-18

    申请号:CN202411600974.3

    申请日:2024-11-11

    Abstract: 本发明提供一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法,包括:获取鲜味肽数据,并对所述鲜味肽数据进行预处理;通过分子指纹、分子描述符和氨基酸矩阵对预处理后的鲜味肽数据进行数字化表征;通过皮尔森相关性、F回归、互信息和包裹式对数字化表征后的鲜味肽数据进行特征筛选,得到筛选后的分子描述符、氨基酸计数和分子指纹;通过筛选后的分子描述符、氨基酸计数和分子指纹进行构建子模型,并通过回归模型评价指标进行评价,选择效果最好的前6个子模型进行集成模型构建,集成模型通过梯度提升机模型进行拟合;通过构建好的集成模型进行鲜味肽识别阈值预测。本发明可以为大量鲜味肽进行定量预测,从而为大批量筛选鲜味肽提供定量参考。

    一种鲜味肽筛选方法及筛选模型
    4.
    发明公开

    公开(公告)号:CN116798544A

    公开(公告)日:2023-09-22

    申请号:CN202211523847.9

    申请日:2022-11-30

    Abstract: 本发明公开了一种鲜味肽筛选方法及筛选模型,所述筛选方法包括以下步骤,S1:整理现有的鲜味肽数据,建立数据库;S2:基于现有的鲜味肽本身的结构碎片构建鲜味肽的分子指纹特征数据;S3:基于分子对接技术解析的鲜味肽与鲜味受体T1R1/T1R3相互作用方式构建分子间互作残基特征数据;S4:基于分子描述符,获得鲜味肽理化性质的分子描述符特征数据;S5:使用机器学习算法对步骤S2‑S4中得到的数据分别建立鲜味肽筛选子模型;S6:使用支持向量机算法对三个鲜味肽筛选子模型进行集成,建立鲜味肽筛选模型;S7:利用步骤S6中建立的鲜味肽筛选模型对鲜味肽进行筛选。本发明中的筛选方法能够对鲜味肽进行快速,精确的筛选,且该筛选方法可重复使用。

Patent Agency Ranking