- 专利标题: 一种蛋白质鉴定的大规模分布式并行加速方法及其系统
- 专利标题(英): Large-scale distributed parallel acceleration method and system for protein identification
-
申请号: CN201010292032.5申请日: 2010-09-26
-
公开(公告)号: CN102411680B公开(公告)日: 2014-03-26
- 发明人: 王乐珩 , 王文平 , 迟浩 , 吴妍洁 , 周郴 , 付岩 , 孙瑞祥 , 贺思敏
- 申请人: 中国科学院计算技术研究所
- 申请人地址: 北京市海淀区中关村科学院南路6号
- 专利权人: 中国科学院计算技术研究所
- 当前专利权人: 中国科学院计算技术研究所
- 当前专利权人地址: 北京市海淀区中关村科学院南路6号
- 代理机构: 北京律诚同业知识产权代理有限公司
- 代理商 祁建国; 梁挥
- 主分类号: G06F19/18
- IPC分类号: G06F19/18
摘要:
本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,用并行处理方法,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。
公开/授权文献
- CN102411680A 一种蛋白质鉴定的大规模分布式并行加速方法及其系统 公开/授权日:2012-04-11