一种蛋白质鉴定的大规模分布式并行加速方法及其系统

    公开(公告)号:CN102411680A

    公开(公告)日:2012-04-11

    申请号:CN201010292032.5

    申请日:2010-09-26

    Abstract: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,用并行处理方法,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。

    一种开放式蛋白质鉴定的分布式加速方法及其系统

    公开(公告)号:CN103678950A

    公开(公告)日:2014-03-26

    申请号:CN201210316345.9

    申请日:2012-08-30

    Abstract: 本发明公开了一种开放式蛋白质鉴定的分布式加速方法及其系统,其中开放式蛋白质鉴定的分布式加速系统包括:蛋白库索引建立模块、谱图数据准备模块、查询打分模块、结果汇总输出模块。本发明提供的一种开放式蛋白质鉴定的分布式加速方法和系统,能有效利用集群资源,允许用户在蛋白质大库下不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,有效的提高了蛋白质谱鉴定速度和解析率。

    一种蛋白质鉴定的大规模分布式并行加速方法及其系统

    公开(公告)号:CN102411666A

    公开(公告)日:2012-04-11

    申请号:CN201010292060.7

    申请日:2010-09-26

    Abstract: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,用并行处理方法,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。

    一种蛋白质鉴定的大规模分布式并行加速方法及其系统

    公开(公告)号:CN102411679B

    公开(公告)日:2014-04-16

    申请号:CN201010292031.0

    申请日:2010-09-26

    Abstract: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,该方法包括:步骤1,用并行处理方法,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,用并行处理方法,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。

    一种蛋白质鉴定的大规模分布式并行加速方法及其系统

    公开(公告)号:CN102411666B

    公开(公告)日:2014-04-16

    申请号:CN201010292060.7

    申请日:2010-09-26

    Abstract: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,用并行处理方法,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。

    一种蛋白质鉴定的大规模分布式并行加速方法及其系统

    公开(公告)号:CN102411680B

    公开(公告)日:2014-03-26

    申请号:CN201010292032.5

    申请日:2010-09-26

    Abstract: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,用并行处理方法,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。

    一种对字符串排序和查找的方法

    公开(公告)号:CN101751416A

    公开(公告)日:2010-06-23

    申请号:CN200810227539.5

    申请日:2008-11-28

    Abstract: 本发明提供一种对字符串进行排序的方法,包括:为所要排序的所有字符串中的字符分类,为一个类别的字符赋予一个数值,不同类别的字符所赋予的数值互不相同;结合各个字符所赋予的值,采用哥德尔编码方法对所要排序的各个字符串分别进行编码,一个字符串得到一个用数字表示的哥德尔编码值;对所要排序的所有字符串比较它们的哥德尔编码值,根据所述哥德尔编码值间的大小,对所述字符串做排序操作。本发明采用哥德尔编码方法将字符串映射成用浮点数表示的哥德尔编码值,然后通过对所述的哥德尔编码值的排序实现对字符串的排序,显著提高了排序效率。

    一种开放式蛋白质鉴定的分布式加速方法及其系统

    公开(公告)号:CN103678950B

    公开(公告)日:2016-05-18

    申请号:CN201210316345.9

    申请日:2012-08-30

    Abstract: 本发明公开了一种开放式蛋白质鉴定的分布式加速方法及其系统,其中开放式蛋白质鉴定的分布式加速系统包括:蛋白库索引建立模块、谱图数据准备模块、查询打分模块、结果汇总输出模块。本发明提供的一种开放式蛋白质鉴定的分布式加速方法和系统,能有效利用集群资源,允许用户在蛋白质大库下不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,有效的提高了蛋白质谱鉴定速度和解析率。

    开放式蛋白质鉴定的数据库搜索方法及其系统

    公开(公告)号:CN103810200B

    公开(公告)日:2016-03-30

    申请号:CN201210451907.0

    申请日:2012-11-12

    Abstract: 本发明有关于一种开放式蛋白质鉴定的数据库搜索方法及其系统,其中该方法包括:步骤1,输入蛋白质序列,模拟切分每一条蛋白质序列,并将所有生成的子序列按照质量排序,生成肽序列数据表,并根据该肽序列数据表建立索引文件;步骤2,输入质谱图,对每张质谱图,提取谱峰生成查询集合,查询所述索引文件,得到序列集合;步骤3,对每张质谱图及其对应的序列集合,根据修饰组合,生成候选肽段并打分;步骤4,对打分结果进行整合,并进行肽段到蛋白质的推断,得到鉴定结果。本发明允许用户不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,用于解决任意类型的酶切和修饰的鉴定问题。

    开放式蛋白质鉴定的数据库搜索方法及其系统

    公开(公告)号:CN103810200A

    公开(公告)日:2014-05-21

    申请号:CN201210451907.0

    申请日:2012-11-12

    CPC classification number: G06F19/18

    Abstract: 本发明有关于一种开放式蛋白质鉴定的数据库搜索方法及其系统,其中该方法包括:步骤1,输入蛋白质序列,模拟切分每一条蛋白质序列,并将所有生成的子序列按照质量排序,生成肽序列数据表,并根据该肽序列数据表建立索引文件;步骤2,输入质谱图,对每张质谱图,提取谱峰生成查询集合,查询所述索引文件,得到序列集合;步骤3,对每张质谱图及其对应的序列集合,根据修饰组合,生成候选肽段并打分;步骤4,对打分结果进行整合,并进行肽段到蛋白质的推断,得到鉴定结果。本发明允许用户不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,用于解决任意类型的酶切和修饰的鉴定问题。

Patent Agency Ranking