-
公开(公告)号:CN110265085A
公开(公告)日:2019-09-20
申请号:CN201910686641.X
申请日:2019-07-29
Applicant: 安徽工业大学
Abstract: 本发明公开了一种蛋白质相互作用位点识别方法,属于生物信息学分析领域。本发明的方法为:先采集蛋白质链数据并对蛋白质链数据进行预处理,再将预处理后的蛋白质链数据分为界面残基和非界面残基;而后从数据库中提取特征,并将提取的特征进行融合得到数据集,再对数据集的不平衡性进行处理,然后将处理后的数据集分为训练集和测试集,再利用训练集训练XGBoost模型,最后利用XGBoost模型得到蛋白质相互作用位点。本发明目的在于克服现有技术中,对蛋白质相互作用位点进行预测时持有不同程度的“假阳性”、“假阴性”特征,使得结果分析比较困难的不足,本发明可以克服以上不足,且可以提高蛋白质相互作用位点的识别精度。