-
公开(公告)号:CN113362899A
公开(公告)日:2021-09-07
申请号:CN202110425032.6
申请日:2021-04-20
Applicant: 厦门大学
Abstract: 本发明公开了一种基于深度学习的蛋白质质谱数据的分析方法及系统,包括:获取样品的DIA蛋白质数据;基于DIA蛋白质数据,沿驻留时间维度以特定步幅移动的滑块为最小处理单元,删除滑块中的低信噪比的背景离子,确定候选母离子和候选子离子;将候选子离子的提取色谱输入变分自编码器编码神经网络后,嵌入到欧氏空间中,然后用k均值分类算法将其划分为k类;基于蛋白质数据库将每个碎片子离子簇与相应的母离子结合,生成母离子‑碎片子离子对;通过计算与理论谱相匹配的碎片子离子间的相似度,再次判断这些母离子‑碎片子离子对,将相似度超过预设阈值的母离子‑碎片子离子对作为伪串联谱存储。本发明能够提高鉴定到的肽段和蛋白质的数量。
-
公开(公告)号:CN113284563B
公开(公告)日:2024-04-09
申请号:CN202110424972.3
申请日:2021-04-20
Applicant: 厦门大学
IPC: G16B40/10 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种蛋白质质谱定量分析结果的筛选方法及系统,包括:获取经过OpenSWATH筛选后的定量结果图像;利用归一化方法对定量结果图像中的6个子离子的XIC曲线进行标准归一化,将XIC的强度转换到0和1之间;通过训练好的卷积神经网络对归一化方法的输出进行分类,输出肽段为阳性肽段的概率;基于预设的双阈值进行筛选,如果所述概率小于等于第一预设阈值,则判断出对应的肽段为假阳性肽段,如果所述概率大于等于第二预设阈值,则判断出对应的肽段为阳性肽段,否则,判断出对应的肽段为模糊肽段。本发明对OpenSWATH输出结果中多肽的碎片离子色谱所有肽段进行分类,以去除假阳性肽段,减轻人工检测的任务量。
-
公开(公告)号:CN113362899B
公开(公告)日:2023-12-19
申请号:CN202110425032.6
申请日:2021-04-20
Applicant: 厦门大学
IPC: G16B40/10 , G06N3/0455 , G06N3/047 , G06N3/0475 , G06N3/067
Abstract: 本发明公开了一种基于深度学习的蛋白质质谱数据的分析方法及系统,包括:获取样品的DIA蛋白质数据;基于DIA蛋白质数据,沿驻留时间维度以特定步幅移动的滑块为最小处理单元,删除滑块中的低信噪比的背景离子,确定候选母离子和候选子离子;将候选子离子的提取色谱输入变分自编码器编码神经网络后,嵌入到欧氏空间中,然后用k均值分类算法将其划分为k类;基于蛋白质数据库将每个碎片子离子簇与相应的母离子结合,生成母离子‑碎片子离子对;通过计算与理论谱相匹配的碎片子离子间的相似度,再次判断这些母离子‑碎片子离子对,将相似度超过预设阈值的母离子‑碎片子离子对作为伪串联谱存储。本发明能够提高鉴定到的肽段和蛋白质的数量。
-
公开(公告)号:CN113284563A
公开(公告)日:2021-08-20
申请号:CN202110424972.3
申请日:2021-04-20
Applicant: 厦门大学
Abstract: 本发明公开了一种蛋白质质谱定量分析结果的筛选方法及系统,包括:获取经过OpenSWATH筛选后的定量结果图像;利用归一化方法对定量结果图像中的6个子离子的XIC曲线进行标准归一化,将XIC的强度转换到0和1之间;通过训练好的卷积神经网络对归一化方法的输出进行分类,输出肽段为阳性肽段的概率;基于预设的双阈值进行筛选,如果所述概率小于等于第一预设阈值,则判断出对应的肽段为假阳性肽段,如果所述概率大于等于第二预设阈值,则判断出对应的肽段为阳性肽段,否则,判断出对应的肽段为模糊肽段。本发明对OpenSWATH输出结果中多肽的碎片离子色谱所有肽段进行分类,以去除假阳性肽段,减轻人工检测的任务量。
-
-
-