一种可断裂交联肽段鉴定方法、鉴定结果评估筛选方法

    公开(公告)号:CN114049915A

    公开(公告)日:2022-02-15

    申请号:CN202111437089.4

    申请日:2021-11-30

    Abstract: 本发明提供一种可断裂交联肽段鉴定方法,针对可断裂交联肽段的每一张二级谱图,所述方法包括如下步骤:S1、提取谱图中质量差为交联剂对应固定质量差的特征双峰,以特征双峰对应的质量为α肽段质量,基于可断裂交联肽段对应的母离子质量获取与α肽段质量互补的β肽段质量得到α肽段质量和β肽段质量组成的候选质量对;其中,所述母离子质量通过可断裂交联肽段的一级谱图校准获得;S2、根据步骤S1得到的候选质量对,分别以候选质量对中的α肽段质量和β肽段质量为依据,从蛋白质数据库中筛选出多条分别与α肽段质量和β肽段质量相等的候选肽段,并将α肽段质量的所有候选肽段与β肽段质量的所有候选肽段分别组成成对的候选交联肽段形成候选交联肽段集合,根据预设的碎片离子对候选交联肽段集合中的交联肽段进行匹配打分,选取其中打分最高的交联肽段。

    一种交联二肽快速鉴定方法

    公开(公告)号:CN106033501B

    公开(公告)日:2018-11-30

    申请号:CN201510112890.X

    申请日:2015-03-16

    Abstract: 本发明提供一种交联二肽快速鉴定方法,包括:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。本发明不需使用特殊交联剂;搜索速度快,鉴定效率高;搜索灵敏度高。

    氨基酸可信度和修饰位点定位的评估方法

    公开(公告)号:CN107622184A

    公开(公告)日:2018-01-23

    申请号:CN201710904787.8

    申请日:2017-09-29

    Abstract: 本发明提供了一种氨基酸可信度评估模型训练方法。该方法包括:根据包含待训练氨基酸的训练肽段产生所述待训练氨基酸的背景肽段集合;从所述训练肽段和所述待训练氨基酸提取多个特征;以所提取的多个特征作为输入向量,以所述待训练氨基酸是否正确作为输出,训练分类模型,得到氨基酸可信度评估模型。本发明获得氨基酸可信度评估模型可用于氨基酸可信度评估和修饰位点定位的评估,提高了氨基酸可信度评估的准确率并且改善了修饰位点定位的评估性能。

    一种蛋白质翻译后修饰的定位方法及系统

    公开(公告)号:CN104134015B

    公开(公告)日:2017-05-03

    申请号:CN201410360277.5

    申请日:2014-07-25

    Abstract: 本发明提供一种蛋白质翻译后修饰的定位方法,包括对于一条蛋白质序列,计算发生的修饰的总质量,得到该总质量对应的一个或多个修饰组合;将与所述蛋白质序列上的每个氨基酸对应的一个或多个修饰集合作为图中的顶点,根据所述一个或多个修饰组合连接该顶点,并且根据与所述蛋白质序列对应的谱图设置该顶点的权值。其中,所述修饰集合是从所述蛋白质序列的第一个氨基酸到对应的氨基酸上能够发生的修饰的集合并且是所述一个或多个修饰组合中的一个修饰组合的子集。所述方法还包括根据路径上所有顶点的权值选择所述图中的路径,并且将该路径转换为修饰位点信息。本发明提高了对修饰位点的定位速度,并且同时支持用户指定的任意修饰。

    一种对多肽交联肽段进行质谱鉴定的假发现率控制方法

    公开(公告)号:CN106198706A

    公开(公告)日:2016-12-07

    申请号:CN201610497295.7

    申请日:2016-06-29

    CPC classification number: G01N33/6848

    Abstract: 本发明提供一种对多肽交联肽段进行质谱鉴定的假发现率控制方法,包括:1)对于每张谱图,基于肽段匹配模型,在存储了单条肽段结构的数据库中进行搜索,得出匹配的n肽交联的鉴定结果;数据库既包括真实肽段结构也包括诱饵肽段结构;2)对于每个谱图的鉴定结果,根据该鉴定结果中分别匹配到真实肽段结构和诱饵假肽段结构的肽段数目,将该鉴定结果归类至鉴定结果集合Rk,其中Rk来表示n肽交联鉴定结果中,有k条肽段为诱饵肽段结构,(n-k)条肽段为真实肽段结构的鉴定结果集合,0≤k≤n,n为不小于3的自然数;3)计算n肽交联的假发现率FDR(n)。本发明更加准确地估计多肽交联肽段质谱鉴定的假发现率;能够帮助提高鉴定的准确率和鉴定率。

    一种开放式蛋白质鉴定的分布式加速方法及其系统

    公开(公告)号:CN103678950A

    公开(公告)日:2014-03-26

    申请号:CN201210316345.9

    申请日:2012-08-30

    Abstract: 本发明公开了一种开放式蛋白质鉴定的分布式加速方法及其系统,其中开放式蛋白质鉴定的分布式加速系统包括:蛋白库索引建立模块、谱图数据准备模块、查询打分模块、结果汇总输出模块。本发明提供的一种开放式蛋白质鉴定的分布式加速方法和系统,能有效利用集群资源,允许用户在蛋白质大库下不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,有效的提高了蛋白质谱鉴定速度和解析率。

    一种蛋白质鉴定的大规模分布式并行加速方法及其系统

    公开(公告)号:CN102411666A

    公开(公告)日:2012-04-11

    申请号:CN201010292060.7

    申请日:2010-09-26

    Abstract: 本发明有关于一种蛋白质鉴定的大规模分布式并行加速方法及其系统,其中该方法包括:步骤1,用并行处理方法,对蛋白质序列进行理论酶切得到肽序列,对肽序列进行排序、去冗余处理,以创建肽索引文件块;步骤2,对质谱谱图进行排序,并将排序后的质谱谱图进行平均划分,得到多个谱图数据块;步骤3,将谱图数据块平均分配给多个主进程,各主进程对所分配的谱图数据块进行排序,依次指派给空闲的从进程进行肽谱匹配鉴定;步骤4,用并行处理方法,汇总鉴定结果,利用鉴定得到的肽序列推断对应的蛋白质序列,生成输出文件。本发明在处理器核规模达到几百甚至超过千个以上,进行蛋白质鉴定能取得满意的加速效率。

    肽段-谱图匹配可信度检验方法、系统、存储介质及装置

    公开(公告)号:CN110349621B

    公开(公告)日:2021-08-27

    申请号:CN201910482412.6

    申请日:2019-06-04

    Abstract: 本发明提出一种肽段‑谱图匹配可信度检验方法、系统、存储介质及装置,包括:将待检测结果中图谱数据输入至开放式搜索引擎,得到待检测结果的鉴定结果;获取限定式搜索引擎对待检测结果的打分,得到第一分值,同时提取第一分值排前n名候选肽段;获取开放式搜索引擎对鉴定结果的打分,得到第二分值,同时提取第二分值排前n名候选肽段;预测每个候选肽段的理论谱图,计算每张理论谱图与待检测结果中图谱数据的余弦相似度,并统计余弦相似度中的最高值;提取由待检测结果的第一分值、第二分值、余弦相似度和最高余弦相似度值组成的四维特征;将四维特征输入至使用SVM训练的离线模型,得到待检测结果的可信度检验结果。

    一种从头测序方法
    9.
    发明授权

    公开(公告)号:CN107729719B

    公开(公告)日:2020-05-26

    申请号:CN201710913734.2

    申请日:2017-09-30

    Abstract: 本发明提一种从头测序方法,该方法包括:在通过酶切产生的两个数据集中查找镜像肽段对应的镜像谱图;从所述镜像谱图中检测高可信谱峰和普通谱峰;根据所述高可信谱峰和普通谱峰构建有向无环图,其中,所述高可信谱峰对应的结点是高可信结点,普通谱峰对应的结点是普通结点;基于所构建的有向无环图生成候选肽段。本发明的方法利用镜像谱图相互佐证,能够提高肽段从头测序的准确率。

    氨基酸可信度和修饰位点定位的评估方法

    公开(公告)号:CN107622184B

    公开(公告)日:2020-01-21

    申请号:CN201710904787.8

    申请日:2017-09-29

    Abstract: 本发明提供了一种氨基酸可信度评估模型训练方法。该方法包括:根据包含待训练氨基酸的训练肽段产生所述待训练氨基酸的背景肽段集合;从所述训练肽段和所述待训练氨基酸提取多个特征;以所提取的多个特征作为输入向量,以所述待训练氨基酸是否正确作为输出,训练分类模型,得到氨基酸可信度评估模型。本发明获得氨基酸可信度评估模型可用于氨基酸可信度评估和修饰位点定位的评估,提高了氨基酸可信度评估的准确率并且改善了修饰位点定位的评估性能。

Patent Agency Ranking