串联质谱数据母离子检测模型训练方法及母离子检测方法

    公开(公告)号:CN104215729A

    公开(公告)日:2014-12-17

    申请号:CN201410406562.6

    申请日:2014-08-18

    Abstract: 本发明提供一种串联质谱母离子检测模型训练方法,包括下列步骤:1)获取母离子已知的谱图数据集,对于其中每张二级谱图,确定该二级谱图的候选母离子;2)提取每个二级谱图-候选母离子组合的特征向量,并根据二级谱图和候选母离子配对正确与否进行相应的赋值;其中,特征向量的元素包括:同位素峰簇相似度、碎裂窗口内的谱峰强度比、色谱相似度和虚拟色谱相似度;3)将所有二级谱图-候选母离子组合的特征向量作为输入,将二级谱图和候选母离子配对正确与否的赋值作为输出,训练MARS模型,得到串联质谱母离子检测模型。本发明还提供了相应的母离子检测方法。本发明能够提高母离子召回率并提高母离子的检测速度。

    一种规模化蛋白质鉴定中的索引加速方法及相应的系统

    公开(公告)号:CN101714187B

    公开(公告)日:2011-09-28

    申请号:CN200810223683.1

    申请日:2008-10-07

    Abstract: 本发明提供一种规模化蛋白质鉴定中的索引加速方法,包括:为肽序列设定质量区间;为计数窗口设定大小,并结合质量区间设定计数窗口的数目以及各个计数窗口的范围;对蛋白质数据库做模拟酶切,根据模拟酶切所得到的肽序列的质量计算肽序列在各个计数窗口内的数量;根据计算机内存的大小得到在计算机内存中一次可处理的肽序列的数量,结合肽序列在各个计数窗口内的数量,得到在计算机内存中一次处理的肽序列的质量范围段;对蛋白质数据库做模拟酶切,将所得到的在一个质量范围段内的肽序列保存在计算机内存中,并在计算机内存中完成对所保存肽序列的排序、去冗余以及建立词典和倒排表的操作;为每个质量范围段建立词典和倒排表。

    带有快照功能的分布式文件系统中的数据读与数据写方法

    公开(公告)号:CN102073739A

    公开(公告)日:2011-05-25

    申请号:CN201110026999.3

    申请日:2011-01-25

    Abstract: 本发明提供一种带有快照功能的分布式文件系统中的数据写方法,包括:分布式文件系统中的一客户端要完成对一文件的写操作,向该分布式文件系统的服务器端请求与该操作有关的布局;所述服务器端查询元数据,得到所述文件的映射关系,并在所述分布式文件系统的存储设备中为所述文件预留存储空间,生成与所述操作有关的布局;所述客户端根据所述布局在所述存储设备上实现对所述文件的写操作,并将所述写操作的数据写入所述预留的存储空间;所述客户端完成所述写操作后,由所述服务器端实现对与所述文件有关的元数据的修改。本发明的方法使得对分布式文件系统的读写具有可靠性,且为创建快照创造了方便。

Patent Agency Ranking