基于能量的原子结构与电子密度图多目标优化拟合预测方法

    公开(公告)号:CN111968707A

    公开(公告)日:2020-11-20

    申请号:CN202010789510.7

    申请日:2020-08-07

    Inventor: 张彪 沈红斌

    Abstract: 一种基于能量的原子结构与电子密度图多目标优化拟合预测方法,根据蛋白质三维结构和电子密度图,通过组建预测结构和电子密度图的基准数据集,生成初始模型;然后利用电子密度图的信息将预测的原子结构初步的移动到密度图的中心,生成N个初始模型;再通过多目标粒子群优化算法选取帕雷托集合并利用Knee算法从中选取最优模型,通过计算得到原子结构和电子密度图之间的拟合结果。本发明能够解决仅通过最小化单个能量函数而导致的潜在偏差问题。

    一种用于冷冻电镜分析的单颗粒图像聚类方法

    公开(公告)号:CN106951918B

    公开(公告)日:2020-04-28

    申请号:CN201710116076.4

    申请日:2017-03-01

    Inventor: 沈红斌 殷硕

    Abstract: 本发明涉及一种用于冷冻电镜分析的单颗粒图像聚类方法。一种单颗粒图像聚类方法,用于单颗粒图像分析,包括:步骤一:接受用户输入初始类数目k0,最终类的数目kn和输入数据集,随机初始化数据集为k0个类,计算类中心,对输入数据集建立共享K最近邻网络;步骤二:进行一次KMeans聚类,度量输入图像和类中心相似度时,将类中心加入网络中,并更新网络,计算节点之间的基于网络的相似性;步骤三:判断当前类的数目K是否等于用户输入kn,如果是,输出各个类和类平均图像,并退出,否则分裂最大的类并返回步骤二继续执行。

    基于掩膜的冷冻电镜三维密度图分辨率检测方法

    公开(公告)号:CN105069797B

    公开(公告)日:2017-08-15

    申请号:CN201510495697.9

    申请日:2015-08-13

    Inventor: 沈红斌 王帅

    Abstract: 一种基于掩膜的冷冻电镜三维密度图分辨率检测方法,通过三维二值掩膜对冷冻电镜重构的三维密度图进行分割,分别计算三维密度图的膜内颗粒结构部分和膜外背景噪声部分基于傅里叶空间三维球壳的半径功率谱,得到三维密度图的信号功率和噪声功率,进而通过光谱信噪比计算得到的基于掩膜的光谱信噪比曲线和选定的阈值得到全局分辨率的估计值,实现对冷冻电镜的重构质量的评测;本发明可直接从冷冻电镜重构的三维密度图估计分辨率,算法简单易行,有较大的应用空间。

    一种人类蛋白质亚细胞位置预测方法

    公开(公告)号:CN106778070A

    公开(公告)日:2017-05-31

    申请号:CN201710204499.1

    申请日:2017-03-31

    Inventor: 沈红斌 周航

    CPC classification number: G16B40/00 G16B20/00

    Abstract: 本发明公开了一种人类蛋白质亚细胞位置预测的方法,是利用人类蛋白质的序列来预测该蛋白质的亚细胞位置,基于基因本体论(GO)特征和保守域相关性优化人类蛋白质亚细胞分类算法。首先通过蛋白质的序列获得该蛋白质的序列残基统计特征(氨基酸组成成分特征,归一化的特异性打分矩阵特征),保守域特征和GO特征;其次,对序列残基统计特征使用CFS特征选择方法提取特征子集,对保守域特征和GO特征通过计算分别得到这些特征的相似性度量,使用带权值的KNN方法计算出概率信息,然后将获得的特征进行整合运用SVM分类器进行分类。

    基于优化证据理论的K最近邻预测alpha螺旋的方法

    公开(公告)号:CN104537277A

    公开(公告)日:2015-04-22

    申请号:CN201410820864.8

    申请日:2014-12-22

    Inventor: 沈红斌 殷曦

    Abstract: 一种基于优化证据理论的K最近邻预测膜蛋白alpha螺旋的方法,涉及到模式识别算法和计算生物学相关技术。本发明能够在缺少高分辨率已知结构的蛋白质样本时,精确预测膜蛋白alpha螺旋结构。本发明通过计算生物的方法,包括蛋白质多序列比对,OET-KNN算法,融合多个滑动窗口提取特征向量进行优化,再用中值滤波的方法平滑噪声,然后对预测结果利用动态阈值的方法进行分割,最终得到膜蛋白alpha螺旋的结构。通过本发明将alpha螺旋的预测精度提高20%以上,而且能够预测alpha螺旋的末端并对预测长度小于15个氨基酸的不规则alpha螺旋有很好的效果。

    基于多分子模态融合的通用蛋白质-RNA结合预测方法

    公开(公告)号:CN119811500A

    公开(公告)日:2025-04-11

    申请号:CN202411865016.9

    申请日:2024-12-18

    Abstract: 一种基于多分子模态融合的通用蛋白质‑RNA结合预测方法,通过广义生物学基础模型对经预处理的蛋白质与RNA序列进行初始表征后,用于训练构造得到的基于改进交叉注意力机制的神经网络模型,在在线阶段采用训练后的模型根据任意输入的蛋白质序列与RNA分子序列输出对两分子序列结合可能性的预测值。本发明使用通用生物学基础模型为蛋白质与RNA两种分子进行初始表征,通过改进的交叉注意力机制对两种分子的表征进行有效信息的提取与融合,基于有效融合信息训练后的人工神经网络可以更加准确的预测蛋白质与RNA结合结果,并且具有更为强大的泛化能力,能够应对多类蛋白的结合预测场景与任务。

    基于图神经网络表征的蛋白质与核酸结合位点预测方法

    公开(公告)号:CN114765063B

    公开(公告)日:2025-04-01

    申请号:CN202110037110.5

    申请日:2021-01-12

    Abstract: 一种基于图神经网络表征的蛋白质与核酸结合位点预测方法,通过构建蛋白质与核酸相互作用数据集,经样本融合处理后提取其中蛋白质中每个残基的位置和特征信息及其结构上下文,并据此构建残基结构上下文的图表示,通过层次图神经网络对待预测的蛋白质的图表示进行预测,得到每个残基与DNA/RNA结合的概率,实现蛋白质与核酸结合位点预测。本发明通过基于结构上下文的残基的图表示和层次图神经网络模型来从图表示中学习结合位点的关键结构和特征模式。

    基于生成模型的mRNA序列优化方法
    29.
    发明公开

    公开(公告)号:CN118983001A

    公开(公告)日:2024-11-19

    申请号:CN202410987781.1

    申请日:2024-07-23

    Abstract: 一种基于生成模型的mRNA序列优化方法,在离线阶段利用随机生成或天然mRNA的数据库对构建得到的生成式模型进行训练;在在线阶段将待优化mRNA序列输入训练后的生成式模型,通过贪心或者概率随机采样方法为密码子序列概率分布和基于待优化mRNA序列每个位置的密码子的适应度的密码子概率分布生成对应权重,得到优化后mRNA序列。本发明通过生成式模型优化mRNA编码区密码子,并借助概率的加权求和来实现多指标的联合优化,显著提高了优化效率的同时,概率加权的框架给算法带来了更好的可拓展性和灵活性,为mRNA设计提供了一个功能更强大的优化工具。

    基于图神经网络的蛋白质结构模型质量评估方法

    公开(公告)号:CN114997366B

    公开(公告)日:2024-11-05

    申请号:CN202210557804.6

    申请日:2022-05-19

    Inventor: 张沛东 沈红斌

    Abstract: 一种基于图神经网络的蛋白质结构模型质量评估方法,提取待预测类蛋白质诱饵里所有167种重原子在三维空间中的全局坐标作为输入,对其通过Rosetta软件的dual‑space relax预处理后,解析计算得到原始节点特征和边特征并输入基于注意力机制和图池化技术构建的图神经网络模型,使用预训练好的模型网络参数进行计算,分别得到反映该类蛋白质诱饵结构在蛋白质水平和氨基酸残基水平上与真实天然蛋白结构的差距的全局得分和局部得分。本发明能够更有鉴别力地关注那些本身精度已接近天然结构的类蛋白质诱饵结构,从而提升蛋白质结构模型评估在高精度数据集上的准确性。

Patent Agency Ranking