-
公开(公告)号:CN105447337A
公开(公告)日:2016-03-30
申请号:CN201510779302.8
申请日:2015-11-13
Applicant: 大连理工大学
IPC: G06F19/12
CPC classification number: G06F19/12
Abstract: 本发明提供了一种基于动态网络图分析的时间序列数据处理方法,从网络的角度分析代谢组学队列数据,分析变量之间的相互联系,根据变量之间关联性的动态变化构建代谢网络,并通过动态浓度变化和网络拓扑结构的变化分析确定疾病(例如恶性肿瘤)发生的预警信息。弥补了采用静态分析方法处理代谢组学时间序列数据忽略特征动态变化信息的缺点。而且,相对致力于发现单分子标志物的算法,本发明考察变量间的相互关系随时间的变化情况,分析、确定疾病发生改变的关键节点,从而更有助于对疾病致病机理的研究,为疾病的早期诊断和预后研究奠定基础。
-
公开(公告)号:CN105424827A
公开(公告)日:2016-03-23
申请号:CN201510755515.7
申请日:2015-11-07
Applicant: 大连理工大学
IPC: G01N30/02
CPC classification number: G01N30/02
Abstract: 本发明公开了一种代谢组学数据随机误差的筛选和校正方法,首先采用色谱-质谱联用仪对样品进行分析得到代谢组轮廓,通过计算相邻两个质量控制样品(QC)中代谢物响应强度的比值,将比值从小到大排序后,筛选总比值个数的5%作为离散点,将这5%的离散点平均分配到排序后比值的两端,从而建立模型去筛选代谢组数据中的随机误差。然后利用比值的线性拟合模型对随机误差进行校正。本发明的核心在于通过代谢物在两个相邻QC样品中响应强度的比值构建模型去筛选和校正随机误差。本发明可以高效、准确地筛选和校正代谢组数据中的随机误差,改善代谢组数据的质量。
-
公开(公告)号:CN102798684B
公开(公告)日:2015-04-15
申请号:CN201110133061.1
申请日:2011-05-21
Applicant: 中国科学院大连化学物理研究所 , 大连理工大学
IPC: G01N30/72
Abstract: 本发明公开了一种保留时间锁定-气相色谱-四极杆质谱-选择性离子扫描进行化学轮廓分析的方法,首先采用气相色谱-质谱全扫描方法分析质量控制样品,采用质谱自动去卷积和峰识别系统对获得的全扫描信息进行质谱去卷积和峰识别,从AMDIS的结果文件中提取识别的化合物所对应的色谱保留时间信息,并根据该信息对不同保留时间的色谱峰进行分组;然后从原始数据文件中提取质谱信息,进行特征离子选定。建立保留时间锁定的GC-MS方法并对待分析的所有样品在该方法下进行选择离子检测。本发明使得采用气相色谱-质谱得到的化学轮廓分析数据的可靠性、有效性和可操作性得到提高。本方法也可推广到以液相色谱-质谱为基础的化学轮廓分析。
-
公开(公告)号:CN102798683B
公开(公告)日:2014-10-22
申请号:CN201110133018.5
申请日:2011-05-21
Applicant: 中国科学院大连化学物理研究所 , 大连理工大学
IPC: G01N30/72
Abstract: 本发明公开了一种基于气相色谱-质谱的化合物全组分定量分析方法,首先采用气相色谱-质谱全扫描方法获得待分析样品的数据信息,采用质谱自动去卷积和峰识别系统对所获得的全扫描数据信息进行质谱去卷积和峰识别。根据峰识别结果,从原始数据文件中提取质谱信息,计算化合物离子的特征值,筛选化合物特征离子,最终利用特征离子建立选择性离子扫描定量分析方法。本发明的核心在于通过化合物离子的特征值对化合物特征离子进行筛选。本方法可给出多个特征离子及其特征性评价指标-特征值。给出的多个特征离子可以分别作为定量离子和定量候选离子。
-
公开(公告)号:CN117577196A
公开(公告)日:2024-02-20
申请号:CN202311591284.1
申请日:2023-11-27
Applicant: 大连理工大学
IPC: G16B40/20 , G16B50/00 , G06N5/02 , G06V10/764 , G06V10/20 , G06V10/774 , G06N3/0464 , G06N3/09
Abstract: 一种基于卷积神经网络的转录组学数据分析方法,根据转录组数据变量多、噪音大、变量间相互作用的特点,通过将结构化数据转换成图像数据,利用卷积神经网络,对数据进行分类。同时,为了提高图像的质量,本发明加入了知识库信息,利用背景信息矩阵优化生成的图像,将实验数据和知识库信息有机结合。基于多个转录组学公共数据集实验结果表明,所提出的图像化的结构数据分析方法,分析结果有效,分类性能更加优越,故本发明为转录组学数据的分析提供了切实有效的方法,具有较强的应用价值。
-
公开(公告)号:CN117577193A
公开(公告)日:2024-02-20
申请号:CN202311675910.5
申请日:2023-12-08
Applicant: 大连理工大学
IPC: G16B40/00 , G06F18/23213 , G06N3/0455
Abstract: 一种基于双重子空间的多组学聚类方法,分别将每个组学数据映射到两个不同的子空间。第一个子空间是组学数据的一致性信息,通过CMD(Central Moment Discrepancy)损失函数学习多个组学数据的共享信息。第二个子空间是组学数据的互补性信息,通过正交约束学习每种组学数据的特定信息。每个样本学习了一种统一的表示形式,包含组学间共享信息和组学内特定信息。最后,采用K‑means聚类算法进行样本聚类。本技术通过解析出组学数据的互补性信息和一致性信息,减少组学数据之间的冗余信息,提升了聚类的性能,有助于准确识别癌症亚型。
-
公开(公告)号:CN114609258B
公开(公告)日:2022-11-22
申请号:CN202011447562.2
申请日:2020-12-09
Applicant: 中国科学院大连化学物理研究所 , 大连理工大学 , 中国石油天然气股份有限公司石油化工研究院
Abstract: 本发明公开了基于液相色谱‑高分辨质谱的石油分子表征数据处理方法,基于液相色谱‑高分辨质谱采集到的原始数据文件,通过构建理论分子库、侯选离子筛选、峰提取与检测、去假阳性等步骤实现石油馏分分子表征。本发明方法充分挖掘了石油样本的液相色谱‑高分辨质谱信息,快速、可靠地获得不同石油馏分中各类型化合物的分子式、保留时间及其强度,可用于基于液相色谱‑高分辨质谱的石油馏分数据处理,分子表征信息提取更充分、更可靠。
-
公开(公告)号:CN110097920B
公开(公告)日:2022-09-20
申请号:CN201910284004.X
申请日:2019-04-10
Applicant: 大连理工大学
Abstract: 本发明提供一种基于近邻稳定性的代谢组学数据缺失值填充方法,属于代谢组学数据分析技术领域。该方法的核心技术是度量含缺失代谢物的样本的k个最近邻样本在相应代谢物上含量的稳定性,基于稳定的近邻样本,对不同类型的缺失值分别采用不同的策略进行填充。本发明对含有缺失值的代谢组学数据填充效果较好,对后续数据分析,代谢标志物选择等具有重要意义。
-
公开(公告)号:CN114093426A
公开(公告)日:2022-02-25
申请号:CN202111330308.9
申请日:2021-11-11
Applicant: 大连理工大学
Abstract: 本发明公开了基于基因调控网络构建的标志物筛选方法,通过构建差异网络,筛选生物标志物,属于生物数据分析技术领域。本发明首先在全局范围执行遗传算法,根据每个任务对应的最优个体进行聚类,将相似任务划分至同一类,在每个类内执行遗传算法,在每个任务内进行信息迁移,进一步优化调控关系的推断,以得到最终的调控网络;最后分别在正常和疾病样本上构建调控网络,得到差异网络,通过差异网络筛选基因作为标志物。本发明的核心内容是通过浮点数编码的遗传算法结合多目标优化的方式来挖掘隐藏在基因表达数据中不同基因之间的内在联系,建立有效的基因关系推断模型,构建基因调控网络,通过差异调控网络筛选标志物。
-
公开(公告)号:CN110322930B
公开(公告)日:2021-12-03
申请号:CN201910489667.5
申请日:2019-06-06
Applicant: 大连理工大学
Abstract: 本发明提供一种基于水平关系的代谢组学网络标志物识别方法,属于生物数据分析技术领域,用于筛选复杂疾病潜在网络标志物的代谢组学数据分析方法DNB‑HC。特征间的水平关系使用概率得分进行定义,用于衡量一对代谢特征在同一个样本中的相对表达水平的大小关系,通过随机扰乱测试确定水平关系的鲁棒性,从而确定网络连边。此外,本发明使用差异网络分析方法识别网络标志物,筛选出的网络代谢标志物具有较好的区分能力,能够为研究疾病发生发展机理及疾病的诊断提供切实有效的数据处理手段。
-
-
-
-
-
-
-
-
-