-
公开(公告)号:CN114724630A
公开(公告)日:2022-07-08
申请号:CN202210406078.8
申请日:2022-04-18
Applicant: 厦门大学
Abstract: 用于预测蛋白质翻译后修饰位点的深度学习方法,涉及生物信息学领域。包括:从公共数据库上收集带有蛋白质翻译后修饰位点注释的蛋白质序列数据;对收集到的蛋白质序列进行去冗余处理,并删除可信度较低的位点注释信息,得到不同PTM类型的蛋白质序列集合;构建基于深度神经网络的预测模型,提取蛋白质序列的短程耦合信息和长程耦合信息;利用蛋白质序列数据集为每种PTM类型训练一个预测模型;将训练好的预测模型部署到网上得到在线预测系统;用户通过在线预测系统输入蛋白质序列文件,选择需要预测的PTM位点类型,在线系统返回PTM位点的预测结果。可以同时预测多种PTM位点,可为生物医学研究和药物设计提供相关的蛋白质信息。
-
公开(公告)号:CN111859275A
公开(公告)日:2020-10-30
申请号:CN202010701528.7
申请日:2020-07-20
Applicant: 厦门大学
IPC: G06F17/16
Abstract: 本发明涉及一种基于非负矩阵分解的质谱数据缺失值填补方法及系统,包括:对数据集矩阵进行缺失值的预填补,得到无缺失的初始数据矩阵;对无缺失的初始数据矩阵中所有元素进行对数变换;取一组非负矩阵分解的维度参数,分别进行非负矩阵分解,得到对应的一组重构矩阵;对重构矩阵的元素值做指数变换;计算所有指数变换后的重构矩阵与无缺失的初始数据矩阵之间的重构误差;根据重构误差计算得到不同重构矩阵下各自对应的权重;对重构矩阵进行加权平均,得到加权重构矩阵;将加权重构矩阵中对应位置的元素值填补到数据集矩阵中的缺失位置;基于无缺失的最终数据矩阵进行特征代谢物识别及通路分析。本发明的上述方法能够提高数据填补精度。
-
公开(公告)号:CN111210876A
公开(公告)日:2020-05-29
申请号:CN202010008409.3
申请日:2020-01-06
Applicant: 厦门大学
IPC: G16B40/10
Abstract: 本发明涉及一种受扰动代谢通路确定方法及系统,包括:获取待测生物样本;采用高通量分析技术和谱数据处理方法对生物样本进行分析和处理,得健康和异常生物样本代谢物的浓度集合;计算健康生物样本代谢物集合中任意两种代谢物的健康生物样本浓度比值对数,得健康生物样本浓度比值对数集;同理得异常生物样本浓度比值对数集;根据上述浓度比值对数集确定偏离系数集;根据偏离系数集确定代谢物的扰动矩阵;获取通路隶属矩阵;根据代谢物的扰动矩阵和通路隶属矩阵确定代谢通路扰动矩阵;采用单边T检验对代谢通路扰动矩阵分析,确定受扰动代谢通路。通过本发明上述方法能准确获取显著受扰动的疾病代谢通路,降低生物样品的个体间差异对于通路识别的影响。
-
公开(公告)号:CN109187614A
公开(公告)日:2019-01-11
申请号:CN201811130259.2
申请日:2018-09-27
Applicant: 厦门大学
Abstract: 本发明公开了基于核磁共振和质谱的代谢组学数据融合方法及其应用,该方法包括:分别利用核磁共振谱仪和液相色谱-质谱仪器采集生物样品的代谢轮廓,得到基于核磁共振(NMR)和基于质谱(MS)的两种代谢组学数据;利用Diffreg检验方法,先从MS数据中筛选出对NMR数据具有补充意义的变量,将所筛选的MS变量集与NMR数据集合并;再从新数据集中删除冗余的变量,则所得的数据即为融合数据,便于后续的建模分析。本发明方法得到的模型具有更好的解释与预测性能,且对于其它代谢组学平台的数据融合具有很强的适用性。
-
公开(公告)号:CN108872293A
公开(公告)日:2018-11-23
申请号:CN201810909220.4
申请日:2018-08-10
Applicant: 厦门大学
IPC: G01N24/08
CPC classification number: G01N24/088
Abstract: 本发明公开了一种肝泡型包虫病的代谢组学分析及初步筛查模型的构建方法,包括:收集健康人和肝泡型包虫病患者血清和尿液样品;采集每个样品的一维核磁共振氢谱,得到样品的代谢轮廓谱;对代谢轮廓谱进行数据预处理,得到二维数据矩阵;将二维数据矩阵进行正交偏最小二乘判别分析,得到OPLS‑DA模型;对模型进行验证,若模型没有存在过拟合现象,则所得OPLS‑DA模型即为肝泡型包虫病的代谢组学分析及初步筛查模型。本发明首次将代谢组学技术应用于肝泡型包虫病的分析及初步筛查中,可以无创、快速、便捷地筛选出肝泡型包虫病高危人群,有效提高肝泡型包虫病高发区全人群的筛查效率,大大降低筛查成本,便于推广使用。
-
公开(公告)号:CN119400275A
公开(公告)日:2025-02-07
申请号:CN202411538584.8
申请日:2024-10-31
Applicant: 厦门大学
IPC: G16C20/20 , G06V10/762 , G06V10/26 , G06V10/84
Abstract: 本发明公开了一种用于识别质谱成像数据中空间群聚离子的方法和系统,涉及质谱成像数据处理技术领域,方法包括:S1,预处理MSI数据获得原始离子图像集,对其进行维度约简获得嵌入离子图像集;S2,随机化原始离子图像集获得随机化离子图像集;S3,图像块划分所有图像集得到原始离子图像块集、嵌入离子图像块集和随机化离子图像块集;S4,构建采样概率,基于采样概率进行下采样,获得原始离子图像下采样集与随机化离子图像下采样集;S5,分别构建两个下采样集中的相关系数并计算空间群聚分数;S6,基于所有离子图像的空间群聚分数进行筛选。本发明利用MSI图像的信号强度差与空间距离的相关性作为空间群聚度的度量,充分提取了信号强度的空间分布特征。
-
公开(公告)号:CN114724630B
公开(公告)日:2024-05-31
申请号:CN202210406078.8
申请日:2022-04-18
Applicant: 厦门大学
IPC: G16B20/30 , G16B40/00 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08 , G06N20/20
Abstract: 用于预测蛋白质翻译后修饰位点的深度学习方法,涉及生物信息学领域。包括:从公共数据库上收集带有蛋白质翻译后修饰位点注释的蛋白质序列数据;对收集到的蛋白质序列进行去冗余处理,并删除可信度较低的位点注释信息,得到不同PTM类型的蛋白质序列集合;构建基于深度神经网络的预测模型,提取蛋白质序列的短程耦合信息和长程耦合信息;利用蛋白质序列数据集为每种PTM类型训练一个预测模型;将训练好的预测模型部署到网上得到在线预测系统;用户通过在线预测系统输入蛋白质序列文件,选择需要预测的PTM位点类型,在线系统返回PTM位点的预测结果。可以同时预测多种PTM位点,可为生物医学研究和药物设计提供相关的蛋白质信息。
-
公开(公告)号:CN117274639A
公开(公告)日:2023-12-22
申请号:CN202311030777.8
申请日:2023-08-16
Applicant: 厦门大学
IPC: G06V10/74 , G06V10/82 , G06F18/22 , G06F18/10 , G06N3/0464 , G06N3/048 , G06N3/08 , G06N3/088 , G01N27/62
Abstract: 本发明公开了一种基于质谱成像数据的同位素峰识别方法、装置及可读介质,该方法包括:获取质谱成像数据并进行预处理,得到质谱成像离子图像数据矩阵;构建离子图像表示模型并训练,得到经训练的离子图像表示模型,离子图像表示模型包括孪生编码器、预测映射器和维度约简模块,预测映射器和维度约简模块分别与孪生编码器连接;将质谱成像离子图像数据矩阵输入经训练的离子图像表示模型,依次输入第一编码器模块和维度约简模块,得到质谱成像数据的低维表示矩阵;根据质谱成像数据获取离子峰集合,基于离子峰集合和质谱成像数据的低维表示矩阵采用同位素峰识别算法识别得到离子间的同位素关系,该方法对MSI同位素峰的识别准确率高。
-
公开(公告)号:CN116933073A
公开(公告)日:2023-10-24
申请号:CN202310807159.3
申请日:2023-07-04
Applicant: 厦门大学
IPC: G06F18/214 , G06N3/048 , G06N3/084 , G06F40/289 , G06F40/30
Abstract: 本发明公开了一种基于边信息熵有偏游走的异构网络节点表示方法及系统,包括:接收输入的包含多种类型的节点和边的异构网络,得到邻接矩阵和度矩阵,计算得到边信息熵矩阵;对于每个目标节点,分别对其与不同类型的邻居节点之间的边信息熵做归一化;按照异构网络节点语义信息组成,确定多条元路径;对于每个目标节点,按照元路径设定的节点序列,获取下一节点类型,并根据归一化边信息熵进行有偏采样,得到下一节点后将其作为目标节点,重复以上步骤直至达到设定的路径长度和游走次数,最终得到节点的游走路径集合;最后将所得的节点游走路径集合作为目标节点的上下文语义关联序列,输入经典Skip‑Gram模型中进行训练,最终得到每个目标节点的向量表示。
-
公开(公告)号:CN111210876B
公开(公告)日:2023-03-14
申请号:CN202010008409.3
申请日:2020-01-06
Applicant: 厦门大学
IPC: G16B40/10
Abstract: 本发明涉及一种受扰动代谢通路确定方法及系统,包括:获取待测生物样本;采用高通量分析技术和谱数据处理方法对生物样本进行分析和处理,得健康和异常生物样本代谢物的浓度集合;计算健康生物样本代谢物集合中任意两种代谢物的健康生物样本浓度比值对数,得健康生物样本浓度比值对数集;同理得异常生物样本浓度比值对数集;根据上述浓度比值对数集确定偏离系数集;根据偏离系数集确定代谢物的扰动矩阵;获取通路隶属矩阵;根据代谢物的扰动矩阵和通路隶属矩阵确定代谢通路扰动矩阵;采用单边T检验对代谢通路扰动矩阵分析,确定受扰动代谢通路。通过本发明上述方法能准确获取显著受扰动的疾病代谢通路,降低生物样品的个体间差异对于通路识别的影响。
-
-
-
-
-
-
-
-
-