-
公开(公告)号:CN114049915A
公开(公告)日:2022-02-15
申请号:CN202111437089.4
申请日:2021-11-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种可断裂交联肽段鉴定方法,针对可断裂交联肽段的每一张二级谱图,所述方法包括如下步骤:S1、提取谱图中质量差为交联剂对应固定质量差的特征双峰,以特征双峰对应的质量为α肽段质量,基于可断裂交联肽段对应的母离子质量获取与α肽段质量互补的β肽段质量得到α肽段质量和β肽段质量组成的候选质量对;其中,所述母离子质量通过可断裂交联肽段的一级谱图校准获得;S2、根据步骤S1得到的候选质量对,分别以候选质量对中的α肽段质量和β肽段质量为依据,从蛋白质数据库中筛选出多条分别与α肽段质量和β肽段质量相等的候选肽段,并将α肽段质量的所有候选肽段与β肽段质量的所有候选肽段分别组成成对的候选交联肽段形成候选交联肽段集合,根据预设的碎片离子对候选交联肽段集合中的交联肽段进行匹配打分,选取其中打分最高的交联肽段。
-
公开(公告)号:CN106033501B
公开(公告)日:2018-11-30
申请号:CN201510112890.X
申请日:2015-03-16
Applicant: 中国科学院计算技术研究所
IPC: G06F19/18
Abstract: 本发明提供一种交联二肽快速鉴定方法,包括:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。本发明不需使用特殊交联剂;搜索速度快,鉴定效率高;搜索灵敏度高。
-
公开(公告)号:CN107622184A
公开(公告)日:2018-01-23
申请号:CN201710904787.8
申请日:2017-09-29
Applicant: 中国科学院计算技术研究所
IPC: G06F19/24
Abstract: 本发明提供了一种氨基酸可信度评估模型训练方法。该方法包括:根据包含待训练氨基酸的训练肽段产生所述待训练氨基酸的背景肽段集合;从所述训练肽段和所述待训练氨基酸提取多个特征;以所提取的多个特征作为输入向量,以所述待训练氨基酸是否正确作为输出,训练分类模型,得到氨基酸可信度评估模型。本发明获得氨基酸可信度评估模型可用于氨基酸可信度评估和修饰位点定位的评估,提高了氨基酸可信度评估的准确率并且改善了修饰位点定位的评估性能。
-
公开(公告)号:CN104134015B
公开(公告)日:2017-05-03
申请号:CN201410360277.5
申请日:2014-07-25
Applicant: 中国科学院计算技术研究所
IPC: G06F19/10
Abstract: 本发明提供一种蛋白质翻译后修饰的定位方法,包括对于一条蛋白质序列,计算发生的修饰的总质量,得到该总质量对应的一个或多个修饰组合;将与所述蛋白质序列上的每个氨基酸对应的一个或多个修饰集合作为图中的顶点,根据所述一个或多个修饰组合连接该顶点,并且根据与所述蛋白质序列对应的谱图设置该顶点的权值。其中,所述修饰集合是从所述蛋白质序列的第一个氨基酸到对应的氨基酸上能够发生的修饰的集合并且是所述一个或多个修饰组合中的一个修饰组合的子集。所述方法还包括根据路径上所有顶点的权值选择所述图中的路径,并且将该路径转换为修饰位点信息。本发明提高了对修饰位点的定位速度,并且同时支持用户指定的任意修饰。
-
公开(公告)号:CN106198706A
公开(公告)日:2016-12-07
申请号:CN201610497295.7
申请日:2016-06-29
Applicant: 中国科学院计算技术研究所
IPC: G01N27/62
CPC classification number: G01N33/6848
Abstract: 本发明提供一种对多肽交联肽段进行质谱鉴定的假发现率控制方法,包括:1)对于每张谱图,基于肽段匹配模型,在存储了单条肽段结构的数据库中进行搜索,得出匹配的n肽交联的鉴定结果;数据库既包括真实肽段结构也包括诱饵肽段结构;2)对于每个谱图的鉴定结果,根据该鉴定结果中分别匹配到真实肽段结构和诱饵假肽段结构的肽段数目,将该鉴定结果归类至鉴定结果集合Rk,其中Rk来表示n肽交联鉴定结果中,有k条肽段为诱饵肽段结构,(n-k)条肽段为真实肽段结构的鉴定结果集合,0≤k≤n,n为不小于3的自然数;3)计算n肽交联的假发现率FDR(n)。本发明更加准确地估计多肽交联肽段质谱鉴定的假发现率;能够帮助提高鉴定的准确率和鉴定率。
-
公开(公告)号:CN103678950A
公开(公告)日:2014-03-26
申请号:CN201210316345.9
申请日:2012-08-30
Applicant: 中国科学院计算技术研究所
IPC: G06F19/18
Abstract: 本发明公开了一种开放式蛋白质鉴定的分布式加速方法及其系统,其中开放式蛋白质鉴定的分布式加速系统包括:蛋白库索引建立模块、谱图数据准备模块、查询打分模块、结果汇总输出模块。本发明提供的一种开放式蛋白质鉴定的分布式加速方法和系统,能有效利用集群资源,允许用户在蛋白质大库下不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,有效的提高了蛋白质谱鉴定速度和解析率。
-
公开(公告)号:CN102445544B
公开(公告)日:2013-10-30
申请号:CN201010508217.5
申请日:2010-10-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种提高单同位素峰判断准确率的方法和系统。所述方法,包括下列步骤:根据选定的串联质谱,确定候选同位素峰簇;根据所述候选同位素峰簇的色谱流出曲线的相似度和强度比值,确定同位素峰簇的起止;根据所述同位素峰簇的起止,确定单同位素峰的质量;判断是否还有串联质谱没有确定单同位素峰,若是,则返回选择新的串联质谱,确定候选同位素峰簇,否则,结束。
-
公开(公告)号:CN102411666A
公开(公告)日:2012-04-11
申请号:CN201010292060.7
申请日:2010-09-26
Applicant: 中国科学院计算技术研究所
Abstract: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,用并行处理方法,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。
-
公开(公告)号:CN101196498A
公开(公告)日:2008-06-11
申请号:CN200610164852.X
申请日:2006-12-06
Applicant: 中国科学院计算技术研究所
IPC: G01N30/72
Abstract: 本发明公开了一种质谱质量测量误差的预测方法,包括如下步骤:步骤一,将物质的测量误差分解为系统误差与随机误差;步骤二,在质谱中计算样本点的测量误差,样本点包括质谱中的离子、离子之和或者离子之差;步骤三,使随机误差的目标函数取最值来确定系统误差分布函数的参数取值。所述在质谱中计算样本点的测量误差是通过预测离子分子式的方法获得。本发明的优点是:不需要额外的内标或外标参考,不需要进行预先的鉴定;既可以预测单个质谱的误差情况,也可以预测整个样品的所有质谱的误差分布情况;预测准确度高。
-
公开(公告)号:CN1933441A
公开(公告)日:2007-03-21
申请号:CN200510102968.6
申请日:2005-09-16
Applicant: 中国科学院计算技术研究所
IPC: H04L12/56
Abstract: 本发明公开了一种支持均匀交换的路由器交换结构,包括输入端口、输出端口和交换内核,输入端口通过交换内核与输出端口相连,交换内核的每个交叉点设有缓冲区,输入端口由输入缓冲区和调度器组成,一个输入缓冲区对应一种流,调度器将缓存在输入缓冲区中的流的信元发送到交换内核;交叉点缓冲区缓存特定流中的信元,每个交叉点缓冲区容量大小为4个信元;输出端口设有调度器,将对应交叉点缓冲区的信元均匀复用成一个流并输出。本发明的路由器交换结构无需采用交叉点缓冲区状态信息反馈机制,允许线卡至交换内核任意大小的往返延迟,保证100%的吞吐率,没有信元丢失,并且带宽公平性、信元的延迟和抖动均有界。
-
-
-
-
-
-
-
-
-