一种蛋白质相互作用位点识别方法

    公开(公告)号:CN110265085A

    公开(公告)日:2019-09-20

    申请号:CN201910686641.X

    申请日:2019-07-29

    Abstract: 本发明公开了一种蛋白质相互作用位点识别方法,属于生物信息学分析领域。本发明的方法为:先采集蛋白质链数据并对蛋白质链数据进行预处理,再将预处理后的蛋白质链数据分为界面残基和非界面残基;而后从数据库中提取特征,并将提取的特征进行融合得到数据集,再对数据集的不平衡性进行处理,然后将处理后的数据集分为训练集和测试集,再利用训练集训练XGBoost模型,最后利用XGBoost模型得到蛋白质相互作用位点。本发明目的在于克服现有技术中,对蛋白质相互作用位点进行预测时持有不同程度的“假阳性”、“假阴性”特征,使得结果分析比较困难的不足,本发明可以克服以上不足,且可以提高蛋白质相互作用位点的识别精度。

Patent Agency Ranking