-
公开(公告)号:CN106529204A
公开(公告)日:2017-03-22
申请号:CN201610905670.7
申请日:2016-10-18
Applicant: 中国科学院计算技术研究所
IPC: G06F19/16
CPC classification number: G06F19/16
Abstract: 本发明提供一种基于半监督学习的交联质谱多谱排序方法,包括:1)分别对每个谱图进行单谱匹配和排序,得到对应的最优的交联二肽单谱匹配结果;提取当前每一个肽谱匹配结果的多谱匹配特征向量,其中包括SVM分数、母离子误差比例特征和修饰比例特征等动态特征;2)在所得到的交联二肽匹配结果中,取FDR在预设的FDR阈值以内的属于正样本的结果构建正样本库,取所有负样本的结果构建反样本库;基于新的训练样本更新各个多谱匹配特征向量;3)训练SVM分类器;4)用本轮训练后的SVM分类器对所有交联二肽结果进行重打分;5)根据预设的迭代条件判断是否继续进行迭代,结束迭代时基于当前SVM分数输出多谱排序结果。本发明的多谱排序方法灵敏度高且性能稳定。
-
公开(公告)号:CN106529204B
公开(公告)日:2019-05-07
申请号:CN201610905670.7
申请日:2016-10-18
Applicant: 中国科学院计算技术研究所
IPC: G16B15/00
Abstract: 本发明提供一种基于半监督学习的交联质谱多谱排序方法,包括:1)分别对每个谱图进行单谱匹配和排序,得到对应的最优的交联二肽单谱匹配结果;提取当前每一个肽谱匹配结果的多谱匹配特征向量,其中包括SVM分数、母离子误差比例特征和修饰比例特征等动态特征;2)在所得到的交联二肽匹配结果中,取FDR在预设的FDR阈值以内的属于正样本的结果构建正样本库,取所有负样本的结果构建反样本库;基于新的训练样本更新各个多谱匹配特征向量;3)训练SVM分类器;4)用本轮训练后的SVM分类器对所有交联二肽结果进行重打分;5)根据预设的迭代条件判断是否继续进行迭代,结束迭代时基于当前SVM分数输出多谱排序结果。本发明的多谱排序方法灵敏度高且性能稳定。
-
公开(公告)号:CN114049915A
公开(公告)日:2022-02-15
申请号:CN202111437089.4
申请日:2021-11-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种可断裂交联肽段鉴定方法,针对可断裂交联肽段的每一张二级谱图,所述方法包括如下步骤:S1、提取谱图中质量差为交联剂对应固定质量差的特征双峰,以特征双峰对应的质量为α肽段质量,基于可断裂交联肽段对应的母离子质量获取与α肽段质量互补的β肽段质量得到α肽段质量和β肽段质量组成的候选质量对;其中,所述母离子质量通过可断裂交联肽段的一级谱图校准获得;S2、根据步骤S1得到的候选质量对,分别以候选质量对中的α肽段质量和β肽段质量为依据,从蛋白质数据库中筛选出多条分别与α肽段质量和β肽段质量相等的候选肽段,并将α肽段质量的所有候选肽段与β肽段质量的所有候选肽段分别组成成对的候选交联肽段形成候选交联肽段集合,根据预设的碎片离子对候选交联肽段集合中的交联肽段进行匹配打分,选取其中打分最高的交联肽段。
-
-