一种对多肽交联肽段进行质谱鉴定的假发现率控制方法

    公开(公告)号:CN106198706B

    公开(公告)日:2019-02-01

    申请号:CN201610497295.7

    申请日:2016-06-29

    Abstract: 本发明提供一种对多肽交联肽段进行质谱鉴定的假发现率控制方法,包括:1)对于每张谱图,基于肽段匹配模型,在存储了单条肽段结构的数据库中进行搜索,得出匹配的n肽交联的鉴定结果;数据库既包括真实肽段结构也包括诱饵肽段结构;2)对于每个谱图的鉴定结果,根据该鉴定结果中分别匹配到真实肽段结构和诱饵假肽段结构的肽段数目,将该鉴定结果归类至鉴定结果集合Rk,其中Rk来表示n肽交联鉴定结果中,有k条肽段为诱饵肽段结构,(n‑k)条肽段为真实肽段结构的鉴定结果集合,0≤k≤n,n为不小于3的自然数;3)计算n肽交联的假发现率FDR(n)。本发明更加准确地估计多肽交联肽段质谱鉴定的假发现率;能够帮助提高鉴定的准确率和鉴定率。

    一种基于半监督学习的交联质谱多谱排序方法

    公开(公告)号:CN106529204A

    公开(公告)日:2017-03-22

    申请号:CN201610905670.7

    申请日:2016-10-18

    CPC classification number: G06F19/16

    Abstract: 本发明提供一种基于半监督学习的交联质谱多谱排序方法,包括:1)分别对每个谱图进行单谱匹配和排序,得到对应的最优的交联二肽单谱匹配结果;提取当前每一个肽谱匹配结果的多谱匹配特征向量,其中包括SVM分数、母离子误差比例特征和修饰比例特征等动态特征;2)在所得到的交联二肽匹配结果中,取FDR在预设的FDR阈值以内的属于正样本的结果构建正样本库,取所有负样本的结果构建反样本库;基于新的训练样本更新各个多谱匹配特征向量;3)训练SVM分类器;4)用本轮训练后的SVM分类器对所有交联二肽结果进行重打分;5)根据预设的迭代条件判断是否继续进行迭代,结束迭代时基于当前SVM分数输出多谱排序结果。本发明的多谱排序方法灵敏度高且性能稳定。

    一种交联二肽快速鉴定方法

    公开(公告)号:CN106033501B

    公开(公告)日:2018-11-30

    申请号:CN201510112890.X

    申请日:2015-03-16

    Abstract: 本发明提供一种交联二肽快速鉴定方法,包括:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。本发明不需使用特殊交联剂;搜索速度快,鉴定效率高;搜索灵敏度高。

    一种对多肽交联肽段进行质谱鉴定的假发现率控制方法

    公开(公告)号:CN106198706A

    公开(公告)日:2016-12-07

    申请号:CN201610497295.7

    申请日:2016-06-29

    CPC classification number: G01N33/6848

    Abstract: 本发明提供一种对多肽交联肽段进行质谱鉴定的假发现率控制方法,包括:1)对于每张谱图,基于肽段匹配模型,在存储了单条肽段结构的数据库中进行搜索,得出匹配的n肽交联的鉴定结果;数据库既包括真实肽段结构也包括诱饵肽段结构;2)对于每个谱图的鉴定结果,根据该鉴定结果中分别匹配到真实肽段结构和诱饵假肽段结构的肽段数目,将该鉴定结果归类至鉴定结果集合Rk,其中Rk来表示n肽交联鉴定结果中,有k条肽段为诱饵肽段结构,(n-k)条肽段为真实肽段结构的鉴定结果集合,0≤k≤n,n为不小于3的自然数;3)计算n肽交联的假发现率FDR(n)。本发明更加准确地估计多肽交联肽段质谱鉴定的假发现率;能够帮助提高鉴定的准确率和鉴定率。

    一种交联二肽快速鉴定方法

    公开(公告)号:CN106033501A

    公开(公告)日:2016-10-19

    申请号:CN201510112890.X

    申请日:2015-03-16

    Abstract: 本发明提供一种交联二肽快速鉴定方法,包括:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。本发明不需使用特殊交联剂;搜索速度快,鉴定效率高;搜索灵敏度高。

    电子转运裂解质谱预处理与鉴定方法

    公开(公告)号:CN102043011B

    公开(公告)日:2012-10-31

    申请号:CN201010515241.1

    申请日:2010-10-20

    Abstract: 本发明提供一种电子转运裂解质谱预处理方法,包括:计算母离子的质荷比和电荷状态;计算母离子峰及其同位素峰在电子转运裂解质谱中可能出现的区域;计算母离子的系列衍生峰在电子转运裂解质谱中可能出现的区域;计算母离子的中性丢失峰在电子转运裂解质谱中可能出现的区域;将所述电子转运裂解质谱中由计算得到的区域中的谱峰去除,以去除未碎裂的母离子峰、母离子的系列衍生峰以及母离子的中性丢失峰。

    一种基于半监督学习的交联质谱多谱排序方法

    公开(公告)号:CN106529204B

    公开(公告)日:2019-05-07

    申请号:CN201610905670.7

    申请日:2016-10-18

    Abstract: 本发明提供一种基于半监督学习的交联质谱多谱排序方法,包括:1)分别对每个谱图进行单谱匹配和排序,得到对应的最优的交联二肽单谱匹配结果;提取当前每一个肽谱匹配结果的多谱匹配特征向量,其中包括SVM分数、母离子误差比例特征和修饰比例特征等动态特征;2)在所得到的交联二肽匹配结果中,取FDR在预设的FDR阈值以内的属于正样本的结果构建正样本库,取所有负样本的结果构建反样本库;基于新的训练样本更新各个多谱匹配特征向量;3)训练SVM分类器;4)用本轮训练后的SVM分类器对所有交联二肽结果进行重打分;5)根据预设的迭代条件判断是否继续进行迭代,结束迭代时基于当前SVM分数输出多谱排序结果。本发明的多谱排序方法灵敏度高且性能稳定。

    一种检测差异表达蛋白质的方法

    公开(公告)号:CN103776891B

    公开(公告)日:2017-03-29

    申请号:CN201310397694.2

    申请日:2013-09-04

    Abstract: 本发明涉及一种检测差异表达蛋白质的方法,面向定量蛋白质组学中的基于一级谱图信息的标记和非标记的相对定量数据分析,包括肽谱匹配、可信度评价、肽段信号提取、肽段比值计算、蛋白质比值计算、统计学分析,根据某蛋白质在两种或多种样品中对应的质谱信号强度比值判断其是否是差异表达蛋白质。对于近百GB的规模的质谱实验采集的数据,快速地自动化分析,对不同蛋白质在质谱仪中的信号尽可能精准地提取蛋白质信号;从统计学意义上确定蛋白质差异表达,并对结果的准确性进行评价。

    一种基于HCD与ETD质谱图的肽段从头测序方法及系统

    公开(公告)号:CN103852513B

    公开(公告)日:2016-01-06

    申请号:CN201210501813.X

    申请日:2012-11-29

    Abstract: 本发明提供一种基于HCD与ETD质谱图的肽段从头测序方法及系统,该方法包括:步骤1,将HCD与ETD的质谱图对应起来形成一个新质谱图,对所述新质谱图进行预处理,检测出有效谱峰并删除干扰谱峰;步骤2,根据所述有效谱峰构建有向无环图;步骤3,在所述有向无环图中寻找符合权重规则的路径,并根据所述路径生成候选肽段;步骤4,将所述候选肽段与所述新质谱图进行匹配打分,按照打分结果将所述候选肽段进行排序并输出。本发明弥补了单种碎裂类型引起的谱峰不全的缺点,结合HCD与ETD谱图各自的优点,提高从头测序的准确度。同时在从头测序之前进行预处理,去除大量同位素谱峰与噪音谱峰,避免其对从头测序算法造成干扰。并利用更加有区分度的打分算法,提高了从头测序的性能。

    一种基于HCD与ETD质谱图的肽段从头测序方法及系统

    公开(公告)号:CN103852513A

    公开(公告)日:2014-06-11

    申请号:CN201210501813.X

    申请日:2012-11-29

    Abstract: 本发明提供一种基于HCD与ETD质谱图的肽段从头测序方法及系统,该方法包括:步骤1,将HCD与ETD的质谱图对应起来形成一个新质谱图,对所述新质谱图进行预处理,检测出有效谱峰并删除干扰谱峰;步骤2,根据所述有效谱峰构建有向无环图;步骤3,在所述有向无环图中寻找符合权重规则的路径,并根据所述路径生成候选肽段;步骤4,将所述候选肽段与所述新质谱图进行匹配打分,按照打分结果将所述候选肽段进行排序并输出。本发明弥补了单种碎裂类型引起的谱峰不全的缺点,结合HCD与ETD谱图各自的优点,提高从头测序的准确度。同时在从头测序之前进行预处理,去除大量同位素谱峰与噪音谱峰,避免其对从头测序算法造成干扰。并利用更加有区分度的打分算法,提高了从头测序的性能。

Patent Agency Ranking