-
公开(公告)号:CN102478562B
公开(公告)日:2014-07-23
申请号:CN201010558383.6
申请日:2010-11-25
Applicant: 中国科学院大连化学物理研究所 , 大连理工大学
IPC: G01N30/88
Abstract: 本发明公开了一种利用改进的分布估计算法(L-EDA)从体液代谢组轮廓筛选卵巢癌预后标记物的方法。采用液相色谱质谱联用仪对体液代谢物进行分析得到代谢组轮廓,构建概率分布模型对代谢组轮廓进行分析,筛选潜在的卵巢癌预后标记物。不同于传统的分布估计算法,L-EDA对迭代搜索过程中生成的候选属性子集的大小加以限定,并给出一种新的概率分布模型更新策略,使得对于属性的评价更为精确、合理,同时提高了算法的执行效率。L-EDA筛选出的属性子集能够体现代谢组轮廓数据各个组别之间的特征,构建支持向量机(SupportVectorMachine,SVM)分类模型进行交叉验证分析,正确率达到99.06%。
-
公开(公告)号:CN117672404A
公开(公告)日:2024-03-08
申请号:CN202311662166.5
申请日:2023-12-06
Applicant: 大连理工大学
IPC: G16C20/30 , G16C20/70 , G06F18/241 , G06F18/27 , G06N3/0895 , G06N3/09
Abstract: 本发明属于分子性质预测技术领域,涉及一种基于多模态对比学习的分子性质预测方法。该方法基于分子的不同表示方法,融合空间联合度和分子的化学相似性的对比学习方法,联合自监督对比学习和有监督对比学习,建立分子性质预测模型。本发明为基于多模态对比学习的分子性质预测,引入了空间联合度和化学相似性,控制在对比学习过程中各模态的联合度,对模态之间的关系进行了细化,并考虑化学相似性对分子性质预测造成的影响。对所选的分类和回归问题的数据集进行了测试,性能优越,为辅助药物研发提供了切实有效的方法,具有较强的应用价值。
-
公开(公告)号:CN117059174A
公开(公告)日:2023-11-14
申请号:CN202310857403.7
申请日:2023-07-13
Applicant: 大连理工大学
Abstract: 化合物分子指纹预测,属于质谱数据分析技术领域,本发明从充分挖掘质谱数据隐含信息的角度出发,构造质谱数据的向量表示时,在相应离子峰后加入中性损失信息,采用自然语言处理技术,学习质谱中峰之间以及峰与中性损失之间的关系,构造多维的谱向量,预测分子指纹。由于谱向量中相应离子峰中性损失的加入,包含更丰富的结构信息,可以有效提高分子指纹预测的准确性。
-
公开(公告)号:CN111739582B
公开(公告)日:2022-10-21
申请号:CN202010573023.7
申请日:2020-06-22
Applicant: 大连理工大学
Abstract: 本发明提供一种基于协同作用网络的生物组学数据分析方法,属于生物组学数据分析技术领域。本发明针对基因组学、转录组学与代谢组学数据维数高、样本量小的特点,通过构建协同作用网络,来充分挖掘组学分子间的协同互补关系,基于模块搜索的方式来选定重要模块,从而确定潜在的模块标志物。本发明为基因组学、转录组学与代谢组学数据的前期分析处理提供了切实有效的方法,对后续的医疗诊断具有较强的应用价值。
-
公开(公告)号:CN114609258A
公开(公告)日:2022-06-10
申请号:CN202011447562.2
申请日:2020-12-09
Applicant: 中国科学院大连化学物理研究所 , 大连理工大学 , 中国石油天然气股份有限公司石油化工研究院
Abstract: 本发明公开了基于液相色谱‑高分辨质谱的石油分子表征数据处理方法,基于液相色谱‑高分辨质谱采集到的原始数据文件,通过构建理论分子库、侯选离子筛选、峰提取与检测、去假阳性等步骤实现石油馏分分子表征。本发明方法充分挖掘了石油样本的液相色谱‑高分辨质谱信息,快速、可靠地获得不同石油馏分中各类型化合物的分子式、保留时间及其强度,可用于基于液相色谱‑高分辨质谱的石油馏分数据处理,分子表征信息提取更充分、更可靠。
-
公开(公告)号:CN113870942A
公开(公告)日:2021-12-31
申请号:CN202111079371.X
申请日:2021-09-15
Applicant: 大连理工大学
Abstract: 本发明提出了一种基于交互作用网络的生物组学数据特征选择方法,属于组学数据分析技术领域。在组学数据中,交互作用是生物分子间一类重要的关联关系。本发明给出距离相关增益指标以探索成对特征之间的交互作用,并利用距离相关增益指标构建交互作用网络。对于建立的网络,使用扩展的贪婪搜索策略筛选富含信息的特征。本发明的核心技术在于从系统层面探索特征间交互作用,可以更全面地揭示生理和病理变化的本质。此外,距离相关增益是一种计算特征间交互作用新度量,它不受数据分布假设的限制,既可以处理离散随机变量,也可以处理连续随机变量,具有较高的泛化性能。
-
公开(公告)号:CN109856307B
公开(公告)日:2021-04-16
申请号:CN201910238318.6
申请日:2019-03-27
Applicant: 大连理工大学
Abstract: 本发明提供一种代谢组分子变量综合筛选技术,属于代谢组学数据分析技术领域。本发明中考量了分子对变量上多种可能的样本分布模式,对分子对变量的区分能力进行了综合的评价,并使用与分子对变量相同的指标,有机融合了单变量评价过程,将所有单变量和对变量的评分进行排序,选择得分最高的对变量及其分布模式或单变量进行后续靶向代谢分析。该方法的核心技术基于代谢组学的实际特点,对对变量上多种可能样本分布模式进行了多角度分析与综合评价,挖掘了信息丰富的变量,对所选分子变量和分子对变量进行分类测试,分类性能优越,故本发明为代谢组学数据的前期分析处理提供了切实有效的方法,具有较强的应用价值。
-
公开(公告)号:CN109856310B
公开(公告)日:2020-06-16
申请号:CN201811539434.3
申请日:2018-12-17
Applicant: 大连理工大学
IPC: G01N30/96
Abstract: 本发明以基于HRLC‑MS的代谢组学为背景,提供一种基于HPLC‑MS的去除代谢物离子峰表中假阳性质谱特征的方法,属于分析化学和代谢组学领域。该方法依据离子色谱图的信息熵指标和相关性系数来判别质谱中真实的化学信号,分别利用空白和实际样本的质谱原始数据去除对应非样本源化合物和噪声的假阳性特征。本发明可以减少噪声和非样本源化合物对代谢组学中分类模型的构建、生物标志物筛选以及代谢物定性的干扰,应用于化学计量学和代谢组学中质谱特征的处理。另外,本发明可以通过计算机程序自动化实现,不需要重复的化学实验以及肉眼判断等人工干预。
-
公开(公告)号:CN110890130A
公开(公告)日:2020-03-17
申请号:CN201911219855.2
申请日:2019-12-03
Applicant: 大连理工大学
IPC: G16B20/20
Abstract: 基于多类型关系的生物网络模块标志物识别方法,属于组学数据分析技术领域。发明结合当前组学数据变量多,噪音多,生物体内变量以各种通路相互关联,变量之间关系复杂多样等实际特点,构建成对变量的多种组合变量,使用统一指标,对成对分子的各个组合进行类间区分能力评价,使用评价指标构建网络,并使用贪婪搜索技术搜索网络模块。有助于组学数据研究者迅速从基因组、代谢组等组学数据中识别具有强区分能力的变量模块,来进行后续针对分子功能,调控过程的定性定量研究,是一种基于多类型关系的生物网络模块标志物识别方法。
-
公开(公告)号:CN101901300A
公开(公告)日:2010-12-01
申请号:CN201010223639.8
申请日:2010-07-09
Applicant: 大连理工大学
IPC: G06F19/00
Abstract: 一种采用链状多种群的遗传算法从体液代谢轮廓中筛选肝病标志物的方法,属于数据挖掘、代谢组学技术领域。其特征是首先采用液相色谱质谱联用仪对体液代谢物进行分析得到代谢轮廓,通过多种群并行进化得到多个区分能力强的特征子集,根据特征在这些子集中出现频数度量特征的重要性。其次依据特征的重要性采用顺序从前向后搜索,筛选出肝病三阶段特异性的标志物。在进化中相邻种群通过信息交互,避免了遗传算法的早熟缺点。同时提出了一种新的交叉操作,保证了任意一个染色体中不包含相同特征。本发明的效果和益处是可以高效,准确的筛选出肝病三阶段中相关的标志物,准确率高,稳定性好,利用筛选出来的特征构造的SVM模型的10倍交叉验证准确率达97.9%。
-
-
-
-
-
-
-
-
-