-
公开(公告)号:CN116665763B
公开(公告)日:2024-05-03
申请号:CN202310562934.3
申请日:2023-05-18
Applicant: 中南大学
IPC: G16B5/00 , G16C20/30 , G16C20/70 , G06N3/0442 , G06N3/0464
Abstract: 本申请涉及代谢组学技术领域,公开了一种基于多视图多标签学习的代谢途径推断方法,包括以下步骤:步骤一:首先将SMILES序列分解为原子级标记,然后将每个标记映射到具有固定维度的向量,之后,将这些嵌入表示传递给双向LSTM,最后通过MLP层获得基于序列的分子表示,步骤二:通过使用RDKit获取原始分子拓扑结构。通过在拼接四种互补指纹,然后通过多层感知机对拼接后的分子指纹进行编码,获取基于分子指纹的表示,将四种不同类型的分子指纹与简化的分子输入行条目系统表示结合,形成混合指纹,然后将混合指纹向量输入到具有非线性激活函数的MLP中,相较于现有技术具有明显的优势,为预测化合物的通路集合提供了更为准确和有效的解决方案。
-
公开(公告)号:CN116665764B
公开(公告)日:2024-03-15
申请号:CN202310564600.X
申请日:2023-05-18
Applicant: 中南大学
IPC: G16B5/00 , G16C20/30 , G16C20/70 , G06N3/0464
Abstract: 本申请涉及生物信息领域,公开了一种预测代谢网络中的缺失反应的方法,包括以下步骤,S1、负采样;S2、特征初始化;S3、特征细化;S4、假设反应排名;S5、代谢网络补全流程。所述S1还包括以下步骤,使用负采样策略平衡模型的特异性和敏感性,为每个正向超链接生成相应的负向超链接,采用一半来自正向超链接节点,另一半来自处理过的ChEBII数据。通过利用公开数据库中的代谢反应信息和生物网络数据来预测代谢网络中缺失的反应,从而避免了大量时间成本和实验成本的投入。这一创新性方法为预测和补全代谢网络中的缺失反应提供了一种更通用、准确且具有拓展性的解决方案。
-
公开(公告)号:CN116665764A
公开(公告)日:2023-08-29
申请号:CN202310564600.X
申请日:2023-05-18
Applicant: 中南大学
IPC: G16B5/00 , G16C20/30 , G16C20/70 , G06N3/0464
Abstract: 本申请涉及生物信息领域,公开了一种预测代谢网络中的缺失反应的方法,包括以下步骤,S1、负采样;S2、特征初始化;S3、特征细化;S4、假设反应排名;S5、代谢网络补全流程。所述S1还包括以下步骤,使用负采样策略平衡模型的特异性和敏感性,为每个正向超链接生成相应的负向超链接,采用一半来自正向超链接节点,另一半来自处理过的ChEBII数据。通过利用公开数据库中的代谢反应信息和生物网络数据来预测代谢网络中缺失的反应,从而避免了大量时间成本和实验成本的投入。这一创新性方法为预测和补全代谢网络中的缺失反应提供了一种更通用、准确且具有拓展性的解决方案。
-
公开(公告)号:CN116665763A
公开(公告)日:2023-08-29
申请号:CN202310562934.3
申请日:2023-05-18
Applicant: 中南大学
IPC: G16B5/00 , G16C20/30 , G16C20/70 , G06N3/0442 , G06N3/0464
Abstract: 本申请涉及代谢组学技术领域,公开了一种基于多视图多标签学习的代谢途径推断方法,包括以下步骤:步骤一:首先将SMILES序列分解为原子级标记,然后将每个标记映射到具有固定维度的向量,之后,将这些嵌入表示传递给双向LSTM,最后通过MLP层获得基于序列的分子表示,步骤二:通过使用RDKit获取原始分子拓扑结构。通过在拼接四种互补指纹,然后通过多层感知机对拼接后的分子指纹进行编码,获取基于分子指纹的表示,将四种不同类型的分子指纹与简化的分子输入行条目系统表示结合,形成混合指纹,然后将混合指纹向量输入到具有非线性激活函数的MLP中,相较于现有技术具有明显的优势,为预测化合物的通路集合提供了更为准确和有效的解决方案。
-
-
-