一种规模化蛋白质鉴定中的索引加速方法及相应的系统

    公开(公告)号:CN101714187A

    公开(公告)日:2010-05-26

    申请号:CN200810223683.1

    申请日:2008-10-07

    Abstract: 本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列在各个计数窗口内的数量;根据计算机内存的大小得到在计算机内存中一次可处理的肽序列的数量,结合肽序列在各个计数窗口内的数量,得到在计算机内存中一次处理的肽序列的质量范围段;对蛋白质数据库做模拟酶切,将所得到的在一个质量范围段内的肽序列保存在计算机内存中,并在计算机内存中完成对所保存肽序列的排序、去冗余以及建立词典和倒排表的操作;为每个质量范围段建立词典和倒排表。

    用串联质谱中碎片离子的同位素峰预测离子分子式的方法

    公开(公告)号:CN100390537C

    公开(公告)日:2008-05-28

    申请号:CN200410090806.0

    申请日:2004-11-12

    Abstract: 本发明公开了一种用串联质谱中碎片离子的同位素峰预测离子分子式的方法,该方法从串联质谱和从各元素的原子个数待定的通用分子式中分别获取碎片离子的单同位素的质量以及各同位素谱峰相对于单同位素的相对丰度;将分别获取的质量和相对丰度做匹配以获得所述通用分子式中待定的各元素的原子个数的非负整数解,得到碎片离子的分子式。本发明的方法利用串联质谱中碎片离子的同位素谱峰信息,通过串联质谱碎片离子的同位素谱峰的模式计算此碎片离子对应的分子式。本发明的方法可以提供碎片离子准确的分子式信息,可对鉴定多肽序列的数据库搜索方法提供的候选序列进行鉴别;以及为求解多肽序列的de novo方法产生高可靠候选序列提供依据。

    一种规模化蛋白质鉴定中的索引加速方法及相应的系统

    公开(公告)号:CN101714187B

    公开(公告)日:2011-09-28

    申请号:CN200810223683.1

    申请日:2008-10-07

    Abstract: 本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列在各个计数窗口内的数量;根据计算机内存的大小得到在计算机内存中一次可处理的肽序列的数量,结合肽序列在各个计数窗口内的数量,得到在计算机内存中一次处理的肽序列的质量范围段;对蛋白质数据库做模拟酶切,将所得到的在一个质量范围段内的肽序列保存在计算机内存中,并在计算机内存中完成对所保存肽序列的排序、去冗余以及建立词典和倒排表的操作;为每个质量范围段建立词典和倒排表。

    一种对字符串排序和查找的方法

    公开(公告)号:CN101751416A

    公开(公告)日:2010-06-23

    申请号:CN200810227539.5

    申请日:2008-11-28

    Abstract: 本发明提供一种对字符串进行排序的方法,包括:为所要排序的所有字符串中的字符分类,为一个类别的字符赋予一个数值,不同类别的字符所赋予的数值互不相同;结合各个字符所赋予的值,采用哥德尔编码方法对所要排序的各个字符串分别进行编码,一个字符串得到一个用数字表示的哥德尔编码值;对所要排序的所有字符串比较它们的哥德尔编码值,根据所述哥德尔编码值间的大小,对所述字符串做排序操作。本发明采用哥德尔编码方法将字符串映射成用浮点数表示的哥德尔编码值,然后通过对所述的哥德尔编码值的排序实现对字符串的排序,显著提高了排序效率。

    一种蛋白质翻译后修饰的发现方法

    公开(公告)号:CN101477089B

    公开(公告)日:2012-06-13

    申请号:CN200910076588.8

    申请日:2009-01-09

    Abstract: 本发明提供一种蛋白质翻译后修饰的发现方法,包括:利用蛋白质样品的实验串联质谱数据中的肽色谱保留时间以及肽质量计算所有谱图之间的谱图差异向量;建立可能包含修饰质量的候选修饰质量区间;在每个所述的候选修饰质量区间上,估计所述谱图差异向量的混合分布,计算所述混合分布中各个分布的标准差,由所述标准差确定所述候选修饰质量区间内由所述蛋白质翻译后修饰导致的分布;计算由所述蛋白质翻译后修饰导致的分布的均值,由所述均值的质量分量得到所述蛋白质翻译后修饰的精确质量实验值,由所述均值的保留时间分量得到所述蛋白质翻译后修饰对肽色谱保留时间的影响。本发明的方法具有高效、准确、鲁棒的优点。

    一种蛋白质翻译后修饰的发现方法

    公开(公告)号:CN101477089A

    公开(公告)日:2009-07-08

    申请号:CN200910076588.8

    申请日:2009-01-09

    Abstract: 本发明提供一种蛋白质翻译后修饰的发现方法,包括:利用蛋白质样品的实验串联质谱数据中的肽色谱保留时间以及肽质量计算所有谱图之间的谱图差异向量;建立可能包含修饰质量的候选修饰质量区间;在每个所述的候选修饰质量区间上,估计所述谱图差异向量的混合分布,计算所述混合分布中各个分布的标准差,由所述标准差确定所述候选修饰质量区间内由所述蛋白质翻译后修饰导致的分布;计算由所述蛋白质翻译后修饰导致的分布的均值,由所述均值的质量分量得到所述蛋白质翻译后修饰的精确质量实验值,由所述均值的保留时间分量得到所述蛋白质翻译后修饰对肽色谱保留时间的影响。本发明的方法具有高效、准确、鲁棒的优点。

    用串联质谱中碎片离子的同位素峰预测离子分子式的方法

    公开(公告)号:CN1773276A

    公开(公告)日:2006-05-17

    申请号:CN200410090806.0

    申请日:2004-11-12

    Abstract: 本发明公开了一种用串联质谱中碎片离子的同位素峰预测离子分子式的方法,该方法从串联质谱和从各元素的原子个数待定的通用分子式中分别获取碎片离子的单同位素的质量以及各同位素谱峰相对于单同位素的相对丰度;将分别获取的质量和相对丰度做匹配以获得所述通用分子式中待定的各元素的原子个数的非负整数解,得到碎片离子的分子式。本发明的方法利用串联质谱中碎片离子的同位素谱峰信息,通过串联质谱碎片离子的同位素谱峰的模式计算此碎片离子对应的分子式。本发明的方法可以提供碎片离子准确的分子式信息,可对鉴定多肽序列的数据库搜索方法提供的候选序列进行鉴别;以及为求解多肽序列的de novo方法产生高可靠候选序列提供依据。

Patent Agency Ranking