基于HPLC-MS的去除代谢物离子峰表中假阳性质谱特征的方法

    公开(公告)号:CN109856310B

    公开(公告)日:2020-06-16

    申请号:CN201811539434.3

    申请日:2018-12-17

    Abstract: 本发明以基于HRLC‑MS的代谢组学为背景,提供一种基于HPLC‑MS的去除代谢物离子峰表中假阳性质谱特征的方法,属于分析化学和代谢组学领域。该方法依据离子色谱图的信息熵指标和相关性系数来判别质谱中真实的化学信号,分别利用空白和实际样本的质谱原始数据去除对应非样本源化合物和噪声的假阳性特征。本发明可以减少噪声和非样本源化合物对代谢组学中分类模型的构建、生物标志物筛选以及代谢物定性的干扰,应用于化学计量学和代谢组学中质谱特征的处理。另外,本发明可以通过计算机程序自动化实现,不需要重复的化学实验以及肉眼判断等人工干预。

    一种采用链状多种群的遗传算法从体液代谢轮廓中筛选肝病标志物的方法

    公开(公告)号:CN101901300A

    公开(公告)日:2010-12-01

    申请号:CN201010223639.8

    申请日:2010-07-09

    Abstract: 一种采用链状多种群的遗传算法从体液代谢轮廓中筛选肝病标志物的方法,属于数据挖掘、代谢组学技术领域。其特征是首先采用液相色谱质谱联用仪对体液代谢物进行分析得到代谢轮廓,通过多种群并行进化得到多个区分能力强的特征子集,根据特征在这些子集中出现频数度量特征的重要性。其次依据特征的重要性采用顺序从前向后搜索,筛选出肝病三阶段特异性的标志物。在进化中相邻种群通过信息交互,避免了遗传算法的早熟缺点。同时提出了一种新的交叉操作,保证了任意一个染色体中不包含相同特征。本发明的效果和益处是可以高效,准确的筛选出肝病三阶段中相关的标志物,准确率高,稳定性好,利用筛选出来的特征构造的SVM模型的10倍交叉验证准确率达97.9%。

    一种代谢组学数据随机误差的筛选和校正方法

    公开(公告)号:CN105424827B

    公开(公告)日:2017-07-11

    申请号:CN201510755515.7

    申请日:2015-11-07

    Abstract: 本发明公开了一种代谢组学数据随机误差的筛选和校正方法,首先采用色谱‑质谱联用仪对样品进行分析得到代谢组轮廓,通过计算相邻两个质量控制样品(QC)中代谢物响应强度的比值,将比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而建立模型去筛选代谢组数据中的随机误差。然后利用比值的线性拟合模型对随机误差进行校正。本发明的核心在于通过代谢物在两个相邻QC样品中响应强度的比值构建模型去筛选和校正随机误差。本发明可以高效、准确地筛选和校正代谢组数据中的随机误差,改善代谢组数据的质量。

    利用L-EDA筛选卵巢癌体液预后标记物的方法

    公开(公告)号:CN102478562B

    公开(公告)日:2014-07-23

    申请号:CN201010558383.6

    申请日:2010-11-25

    Abstract: 本发明公开了一种利用改进的分布估计算法(L-EDA)从体液代谢组轮廓筛选卵巢癌预后标记物的方法。采用液相色谱质谱联用仪对体液代谢物进行分析得到代谢组轮廓,构建概率分布模型对代谢组轮廓进行分析,筛选潜在的卵巢癌预后标记物。不同于传统的分布估计算法,L-EDA对迭代搜索过程中生成的候选属性子集的大小加以限定,并给出一种新的概率分布模型更新策略,使得对于属性的评价更为精确、合理,同时提高了算法的执行效率。L-EDA筛选出的属性子集能够体现代谢组轮廓数据各个组别之间的特征,构建支持向量机(SupportVectorMachine,SVM)分类模型进行交叉验证分析,正确率达到99.06%。

    一种代谢组深度注释方法

    公开(公告)号:CN114594171B

    公开(公告)日:2023-12-15

    申请号:CN202011407735.8

    申请日:2020-12-03

    Abstract: 本发明公开了一种复杂生物样本代谢组深度注释方法。该方法通过对生物样本提取物进行基于超高效液相色谱‑高分辨质谱的非靶向代谢组学分析,获取生物样本的代谢组色谱‑质谱信息,再根据所获非靶向代谢组学数据中的实验一级质谱离子质荷比和实验保留时间,从代谢组学数据库筛选匹配的候选代谢物;进一步根据候选代谢物的分子指纹相似性构建代谢物分子结构关联网络。然后,利用非靶向超高效液相色谱‑高分辨质谱代谢组实验数据,以分子结构关联网络作为背景网络,进行代谢组规模化定性。本发明方法不依赖于大规模的实验二级谱图数据库,定性的覆盖度和可靠性更高。(56)对比文件孔宏伟 等.基于液相色谱-质谱联用的代谢组学研究中代谢物的结构鉴定进展《.色谱》.2014,第32卷(第10期),Shanshan Xu 等.Metabolomics Based onUHPLC-Orbitrap-MS and Global NaturalProduct Social Molecular NetworkingReveals Effects of Time Scale andEnvironment of Storage on the Metabolitesand Taste Quality of Raw Pu-erh Tea.《Journal of Agricultural and FoodChemistry》.2019,第67卷(第43期),Brian E. Sedio 等.A protocol forhigh-throughput,untargeted forestcommunity metabolomics using massspectrometry molecular networks.《Applications in Plant Sciences》.2018,第6卷(第3期),Huibin Shen 等.Metaboliteidentification through multiple kernellearning on fragmentation trees.《Bioinformatics》.2014,第30卷

    一种代谢组深度注释方法

    公开(公告)号:CN114594171A

    公开(公告)日:2022-06-07

    申请号:CN202011407735.8

    申请日:2020-12-03

    Abstract: 本发明公开了一种复杂生物样本代谢组深度注释方法。该方法通过对生物样本提取物进行基于超高效液相色谱‑高分辨质谱的非靶向代谢组学分析,获取生物样本的代谢组色谱‑质谱信息,再根据所获非靶向代谢组学数据中的实验一级质谱离子质荷比和实验保留时间,从代谢组学数据库筛选匹配的候选代谢物;进一步根据候选代谢物的分子指纹相似性构建代谢物分子结构关联网络。然后,利用非靶向超高效液相色谱‑高分辨质谱代谢组实验数据,以分子结构关联网络作为背景网络,进行代谢组规模化定性。本发明方法不依赖于大规模的实验二级谱图数据库,定性的覆盖度和可靠性更高。

    一种代谢组学数据随机误差的筛选和校正方法

    公开(公告)号:CN105424827A

    公开(公告)日:2016-03-23

    申请号:CN201510755515.7

    申请日:2015-11-07

    CPC classification number: G01N30/02

    Abstract: 本发明公开了一种代谢组学数据随机误差的筛选和校正方法,首先采用色谱-质谱联用仪对样品进行分析得到代谢组轮廓,通过计算相邻两个质量控制样品(QC)中代谢物响应强度的比值,将比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而建立模型去筛选代谢组数据中的随机误差。然后利用比值的线性拟合模型对随机误差进行校正。本发明的核心在于通过代谢物在两个相邻QC样品中响应强度的比值构建模型去筛选和校正随机误差。本发明可以高效、准确地筛选和校正代谢组数据中的随机误差,改善代谢组数据的质量。

Patent Agency Ranking