-
公开(公告)号:CN118197396A
公开(公告)日:2024-06-14
申请号:CN202211589076.3
申请日:2022-12-12
Applicant: 上海交通大学
Abstract: 一种基于经验图神经网络的蛋白质‑配体亲和力预测方法,从目标蛋白质与小分子配体的复合物中提取出蛋白质所有残基的β碳原子以及配体中所有重原子在三维空间中的全局坐标,然后根据全局坐标以及配体的化学键信息计算得到蛋白质图、配体图以及相互作用图的邻接矩阵;再根据蛋白质的进化信息以及配体原子的属性分别计算得到残基结点和原子结点的原始结点特征,将邻接矩阵和原始结点特征输入训练后的经验图神经网络得到蛋白质结构的亲和力。本发明将深度学习技术与蛋白质结构领域的知识相结合,通过经验图神经网络深入挖掘蛋白质与配体的空间位置关系,能够学习到更有效的蛋白质与配体间的位置关系,提升蛋白质‑配体亲和力预测的精度。
-
公开(公告)号:CN118098612A
公开(公告)日:2024-05-28
申请号:CN202410237679.X
申请日:2024-03-01
Applicant: 上海交通大学
Abstract: 一种基于随机森林算法的胰岛素泵评测方法,通过胰岛素泵的临床数据,构建出初始数据集,在初始数据集上通过随机森林算法训练得到初始模型。在选择指定的已训练好的评估模型后,通过患者临床数据指标的输入得到包含模型评估未接受治疗的患者通过胰岛素泵泵后血糖数值,进行胰岛素泵对血糖影响的预测评估。本发明以未接受胰岛素泵的患者的临床数据作为输入,通过由随机森林算法训练得到的胰岛素泵药效模型,最终可以预估该患者使用胰岛素泵后的血糖情况,从而判断是否需要使用胰岛素泵,适用于特征多,数据量较少的情况。
-
公开(公告)号:CN116705161A
公开(公告)日:2023-09-05
申请号:CN202310491219.5
申请日:2023-05-05
Applicant: 上海交通大学
Abstract: 一种基于RNA速度和基因调控关系的细胞伪时间轨迹分析方法及系统,通过对基因表达进行预处理后,筛选出潜在的调控关系,并据此建立RNA速度模型;使用推广EM算法对其模型参数进行迭代优化,再通过整合在各个基因上的RNA速度优化模型后,进行伪时间分析和细胞分化轨迹预测。本发明摆脱现有技术对于剪切/未剪切信息的依赖。这样既可以大大提高模型的拟合能力,又能将RNA velocity模型推广到不能提供剪切/未剪切信息的单细胞转录组数据集中。
-
公开(公告)号:CN116504303A
公开(公告)日:2023-07-28
申请号:CN202310474761.X
申请日:2023-04-27
Applicant: 上海交通大学
IPC: G16B15/30 , G16B40/00 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 一种基于元学习和子图匹配的靶蛋白药物结合预测方法,通过构建蛋白质结构、药物小分子结构及其结合能数值按蛋白质分组建立元学习训练任务,即作为元模型的主体模型;对元模型进行微调后得到针对该蛋白质预测任务的子模型与其损失函数;然后建立任务自适应的自注意力模型平衡各蛋白质预测任务的子模型对元模型的优化贡献,对各蛋白质预测任务的子模型损失函数使用加权平均得到元模型损失函数;再使用元模型损失函数计算梯度,得到元模型梯度后,基于预设学习率对元模型参数进行更新优化,训练完成后使用训练后的元模型对测试集新蛋白质样本进行微调,得到新蛋白质预测子模型,使用该子模型对该蛋白质测试集进行预测,得到评价结果。本发明通过元学习与子图匹配相结合的训练方法,可以有效避免捷径学习,增强泛化效果,也解决以往预测模型对新发现蛋白质难以预测的问题。
-
公开(公告)号:CN116012537A
公开(公告)日:2023-04-25
申请号:CN202310051224.4
申请日:2023-02-02
Applicant: 上海交通大学
IPC: G06T17/00 , G06T7/30 , G06V10/764 , G06V10/774 , G06N3/0464 , G06N3/08
Abstract: 一种基于深度学习的三维密度图局部质量评估方法,通过构建基于VisionTransformer为骨干网络的DeepQs深度学习模型,并以重采样得到的冷冻电镜三维密度图的局部密度图为输入,以对应的原子结构与相匹配的重采样后的三维密度图的之间的Q‑score为标签进行训练,在在线阶段对待测冷冻电镜重构出的生物大分子模型的三维密度图进行重采样后,通过掩膜获取感兴趣区域后输入训练后的DeepQs深度学习模型进行局部质量评估并得到质量评估图。本发明结合使用原子在冷冻电镜三维密度图中的可分解性分数(Q‑score),可以对三维密度图的每一个局部区域进行打分,并获得质量评估图。
-
公开(公告)号:CN114997366A
公开(公告)日:2022-09-02
申请号:CN202210557804.6
申请日:2022-05-19
Applicant: 上海交通大学
Abstract: 一种基于图神经网络的蛋白质结构模型质量评估方法,提取待预测类蛋白质诱饵里所有167种重原子在三维空间中的全局坐标作为输入,对其通过Rosetta软件的dual‑space relax预处理后,解析计算得到原始节点特征和边特征并输入基于注意力机制和图池化技术构建的图神经网络模型,使用预训练好的模型网络参数进行计算,分别得到反映该类蛋白质诱饵结构在蛋白质水平和氨基酸残基水平上与真实天然蛋白结构的差距的全局得分和局部得分。本发明能够更有鉴别力地关注那些本身精度已接近天然结构的类蛋白质诱饵结构,从而提升蛋白质结构模型评估在高精度数据集上的准确性。
-
公开(公告)号:CN109637589B
公开(公告)日:2022-07-26
申请号:CN201811523117.2
申请日:2018-12-13
Applicant: 上海交通大学
Abstract: 本发明涉及蛋白质生物学领域,具体涉及一种基于频繁模式和机器学习双推荐制的核定位信号预测算法。本发明公开了两种模型,分别为基于频繁模式的NLS预测算法构建的模型和基于机器学习的NLS预测算法构建的模型。其中,第一种模型主要是利用PrefixSpan算法思想,以此挖掘出在核序列数据库中富集而在非核序列数据库中稀疏的一些频繁基序,对频繁基序进行一定筛选与评价,得到候选NLS。第二种模型则主要是综合以词向量为特征的SVM,基于统计的线性分类,失调分数以及PSSM矩阵的单个蛋白质序列预测NLS算法,该算法的击中率和冗余性得到了一定的改善。本发明不仅提高了NLS预测精度,更能发现一些不受已知NLS限制的特殊NLS。
-
公开(公告)号:CN114765063A
公开(公告)日:2022-07-19
申请号:CN202110037110.5
申请日:2021-01-12
Applicant: 上海交通大学
IPC: G16B20/30
Abstract: 一种基于图神经网络表征的蛋白质与核酸结合位点预测方法,通过构建蛋白质与核酸相互作用数据集,经样本融合处理后提取其中蛋白质中每个残基的位置和特征信息及其结构上下文,并据此构建残基结构上下文的图表示,通过层次图神经网络对待预测的蛋白质的图表示进行预测,得到每个残基与DNA/RNA结合的概率,实现蛋白质与核酸结合位点预测。本发明通过基于结构上下文的残基的图表示和层次图神经网络模型来从图表示中学习结合位点的关键结构和特征模式。
-
公开(公告)号:CN111968707B
公开(公告)日:2022-06-17
申请号:CN202010789510.7
申请日:2020-08-07
Applicant: 上海交通大学
Abstract: 一种基于能量的原子结构与电子密度图多目标优化拟合预测方法,根据蛋白质三维结构和电子密度图,通过组建预测结构和电子密度图的基准数据集,生成初始模型;然后利用电子密度图的信息将预测的原子结构初步的移动到密度图的中心,生成N个初始模型;再通过多目标粒子群优化算法选取帕雷托集合并利用Knee算法从中选取最优模型,通过计算得到原子结构和电子密度图之间的拟合结果。本发明能够解决仅通过最小化单个能量函数而导致的潜在偏差问题。
-
公开(公告)号:CN114187963A
公开(公告)日:2022-03-15
申请号:CN202111501583.2
申请日:2021-12-09
Applicant: 上海交通大学
Abstract: 一种全长circRNA上蛋白绑定核苷酸位点的预测方法,将全长circRNA切分成片段后输入至一维CNN网络后,将得到的局部高级抽象特征分别输入至BiGRU网络和Transformer编码器的双分支网络,分别得到输入数据的长依赖表示特征和基于全局注意力的circRNA序列表示,经拼接后输入MLP分类器,最后通过中值滤波根据相邻核苷酸的结合信息去除假结合核苷酸降低假阳率,通过分数二值化策略获得预测的结合核苷酸,通过积分梯度识别关键序列内容,得到预测的全长circRNA与RBP结合基序。本发明能够以核苷酸分辨率探索全长circRNA上RBP结合情况,准确预测RBP结合核苷酸并检测其结合基序。
-
-
-
-
-
-
-
-
-