一种规模化蛋白质鉴定中的索引加速方法及相应的系统

    公开(公告)号:CN101714187B

    公开(公告)日:2011-09-28

    申请号:CN200810223683.1

    申请日:2008-10-07

    Abstract: 本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列在各个计数窗口内的数量;根据计算机内存的大小得到在计算机内存中一次可处理的肽序列的数量,结合肽序列在各个计数窗口内的数量,得到在计算机内存中一次处理的肽序列的质量范围段;对蛋白质数据库做模拟酶切,将所得到的在一个质量范围段内的肽序列保存在计算机内存中,并在计算机内存中完成对所保存肽序列的排序、去冗余以及建立词典和倒排表的操作;为每个质量范围段建立词典和倒排表。

    一种使用串联质谱数据鉴定肽的方法

    公开(公告)号:CN1769891A

    公开(公告)日:2006-05-10

    申请号:CN200410088779.3

    申请日:2004-11-03

    Abstract: 本发明公开了一种使用串联质谱数据鉴定肽的方法,包括步骤:将要被鉴定的肽进行实验碎裂以生成实验串联质谱;将数据库中的多个候选肽进行理论碎裂以生成多个理论串联质谱;用径向基函数核分别计算多个理论串联质谱与实验串联质谱的相似度,该径向基函数包括一指数部分;根据所计算的相似度选取出与实验串联质谱最相似的理论串联质谱所对应的肽作为鉴定结果。本发明的使用串联质谱数据鉴定肽的方法采用径向基函数核来评价多个理论串联质谱与实验串联质谱的相似度,并进一步在径向基函数核的指数部分通过对连续碎片离子的求和来强调连续碎片离子的正相关特性,比现有技术中鉴定肽的方法具有更高的准确率,明显降低了假阳性结果。

    一种规模化蛋白质鉴定中的索引加速方法及相应的系统

    公开(公告)号:CN101714187A

    公开(公告)日:2010-05-26

    申请号:CN200810223683.1

    申请日:2008-10-07

    Abstract: 本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列在各个计数窗口内的数量;根据计算机内存的大小得到在计算机内存中一次可处理的肽序列的数量,结合肽序列在各个计数窗口内的数量,得到在计算机内存中一次处理的肽序列的质量范围段;对蛋白质数据库做模拟酶切,将所得到的在一个质量范围段内的肽序列保存在计算机内存中,并在计算机内存中完成对所保存肽序列的排序、去冗余以及建立词典和倒排表的操作;为每个质量范围段建立词典和倒排表。

    一种使用串联质谱数据鉴定肽的方法

    公开(公告)号:CN100376895C

    公开(公告)日:2008-03-26

    申请号:CN200410088779.3

    申请日:2004-11-03

    Abstract: 本发明公开了一种使用串联质谱数据鉴定肽的方法,包括步骤:将要被鉴定的肽进行实验碎裂以生成实验串联质谱;将数据库中的多个候选肽进行理论碎裂以生成多个理论串联质谱;用径向基函数核分别计算多个理论串联质谱与实验串联质谱的相似度,该径向基函数包括一指数部分;根据所计算的相似度选取出与实验串联质谱最相似的理论串联质谱所对应的肽作为鉴定结果。本发明的使用串联质谱数据鉴定肽的方法采用径向基函数核来评价多个理论串联质谱与实验串联质谱的相似度,并进一步在径向基函数核的指数部分通过对连续碎片离子的求和来强调连续碎片离子的正相关特性,比现有技术中鉴定肽的方法具有更高的准确率,明显降低了假阳性结果。

Patent Agency Ranking