从头测序方法及装置
    11.
    发明授权

    公开(公告)号:CN106770605B

    公开(公告)日:2019-03-26

    申请号:CN201611019740.5

    申请日:2016-11-14

    Abstract: 本发明提供了从头测序方法,其包括将待解析的谱图转化为质谱连接图,统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修改路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;以及对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。该方法可以支持上千种意外修饰的发现,而且不会对肽段鉴定的速度有较大影响。另外,还可以更细粒度地区分相似肽段序列,改善了肽段鉴定的准确率。

    一种肽段液相色谱保留时间预测方法及系统

    公开(公告)号:CN106248844A

    公开(公告)日:2016-12-21

    申请号:CN201610941299.X

    申请日:2016-10-25

    CPC classification number: G01N30/86

    Abstract: 本发明提出一种肽段液相色谱保留时间预测方法及系统,涉及生物信息学,该方法包括对原始质谱数据文件进行搜索,获取肽段-谱图匹配作为鉴定结果,对于所述鉴定结果中FDR小于1%的来自目标库的肽段-谱图匹配,提取肽段-谱图匹配中相应肽段的实验保留时间,并设置训练样本与测试样本;使用所述训练样本,将带有修饰的氨基酸作为新氨基酸,建立多元线性回归模型,使用梯度下降法求解每种氨基酸的保留系数;对所述训练样本中的每条肽段,提取56维特征,并计算相应的特征值;建立预测模型,对所述测试样本中已知序列的肽段进行保留时间预测。本发明可以用于不同色谱条件下带有修饰的肽段的保留时间预测,大大提升了速度,在不同的数据集合上与Elude对比,速度加快了30倍以上。

    一种检测差异表达蛋白质的方法

    公开(公告)号:CN103776891A

    公开(公告)日:2014-05-07

    申请号:CN201310397694.2

    申请日:2013-09-04

    Abstract: 本发明涉及一种检测差异表达蛋白质的方法,面向定量蛋白质组学中的基于一级谱图信息的标记和非标记的相对定量数据分析,包括肽谱匹配、可信度评价、肽段信号提取、肽段比值计算、蛋白质比值计算、统计学分析,根据某蛋白质在两种或多种样品中对应的质谱信号强度比值判断其是否是差异表达蛋白质。对于近百GB的规模的质谱实验采集的数据,快速地自动化分析,对不同蛋白质在质谱仪中的信号尽可能精准地提取蛋白质信号;从统计学意义上确定蛋白质差异表达,并对结果的准确性进行评价。

    氨基酸可信度和修饰位点定位的评估方法

    公开(公告)号:CN107622184A

    公开(公告)日:2018-01-23

    申请号:CN201710904787.8

    申请日:2017-09-29

    Abstract: 本发明提供了一种氨基酸可信度评估模型训练方法。该方法包括:根据包含待训练氨基酸的训练肽段产生所述待训练氨基酸的背景肽段集合;从所述训练肽段和所述待训练氨基酸提取多个特征;以所提取的多个特征作为输入向量,以所述待训练氨基酸是否正确作为输出,训练分类模型,得到氨基酸可信度评估模型。本发明获得氨基酸可信度评估模型可用于氨基酸可信度评估和修饰位点定位的评估,提高了氨基酸可信度评估的准确率并且改善了修饰位点定位的评估性能。

    一种肽段液相色谱保留时间预测方法及系统

    公开(公告)号:CN106248844B

    公开(公告)日:2018-05-04

    申请号:CN201610941299.X

    申请日:2016-10-25

    Abstract: 本发明提出一种肽段液相色谱保留时间预测方法及系统,涉及生物信息学,该方法包括对原始质谱数据文件进行搜索,获取肽段‑谱图匹配作为鉴定结果,对于所述鉴定结果中FDR小于1%的来自目标库的肽段‑谱图匹配,提取肽段‑谱图匹配中相应肽段的实验保留时间,并设置训练样本与测试样本;使用所述训练样本,将带有修饰的氨基酸作为新氨基酸,建立多元线性回归模型,使用梯度下降法求解每种氨基酸的保留系数;对所述训练样本中的每条肽段,提取56维特征,并计算相应的特征值;建立预测模型,对所述测试样本中已知序列的肽段进行保留时间预测。本发明可以用于不同色谱条件下带有修饰的肽段的保留时间预测,大大提升了速度,在不同的数据集合上与Elude对比,速度加快了30倍以上。

    一种从头测序方法
    19.
    发明公开

    公开(公告)号:CN107729719A

    公开(公告)日:2018-02-23

    申请号:CN201710913734.2

    申请日:2017-09-30

    Abstract: 本发明提一种从头测序方法,该方法包括:在通过酶切产生的两个数据集中查找镜像肽段对应的镜像谱图;从所述镜像谱图中检测高可信谱峰和普通谱峰;根据所述高可信谱峰和普通谱峰构建有向无环图,其中,所述高可信谱峰对应的结点是高可信结点,普通谱峰对应的结点是普通结点;基于所构建的有向无环图生成候选肽段。本发明的方法利用镜像谱图相互佐证,能够提高肽段从头测序的准确率。

    一种基于离子索引的整体蛋白质鉴定方法与系统

    公开(公告)号:CN107563148A

    公开(公告)日:2018-01-09

    申请号:CN201710701999.6

    申请日:2017-08-16

    Abstract: 本发明涉及一种基于离子索引的整体蛋白质鉴定方法与系统,包括统计碎裂位点,挖掘碎裂模式。在待测蛋白质样品的完整数据集鉴定结果中统计强度最高多根谱峰匹配到的氨基酸位点,用于离子索引表的创建。对C端碎裂的位点和N端碎裂的位点处产生的碎片离子建立倒排索引表。对于每张谱图,去除母离子峰后,提取强度最高的多根谱峰作为查询谱峰,检索离子索引表获取候选蛋白质。粗打分过滤候选蛋白质,其中粗打分采用了改进的BM25算法,并考虑了N/C端可变修饰和互补离子。本发明通过上述技术点,能兼顾高效蛋白质鉴定效率和解析率,尤其对于碎裂不是很充分的质谱数据,效果更为明显。

Patent Agency Ranking