一种基于模板的蛋白质小分子复合物建模方法及其应用

    公开(公告)号:CN117577224B

    公开(公告)日:2024-06-11

    申请号:CN202311627394.9

    申请日:2023-11-30

    IPC分类号: G16C20/50 G16B15/20

    摘要: 本发明提供了一种基于模板的蛋白质小分子复合物建模方法及其应用,本发明所述方法基于分子力场来执行小分子柔性对齐算法,分子力场中的相互作用参数可以提供对小分子基本几何构型,如键长、键角、键级,和元素性质,如电荷、原子半径等基本信息,在上述信息基础上进一步构建了惩罚和奖励机制,来迫使目标小分子在遵循上述力场规则的前提下尽可能与目标分子之间形成最大的空间和化学相似性。本发明的方法可以帮助在小分子药物开发过程中更准确的确定小分子在蛋白质口袋中的位置,可进一步帮助基于分子动力学模拟的自由能微扰计算或MMPBSA计算过程。

    基因序列处理方法、装置、存储介质及电子设备

    公开(公告)号:CN115910197A

    公开(公告)日:2023-04-04

    申请号:CN202111643397.2

    申请日:2021-12-29

    发明人: 鞠震

    IPC分类号: G16B20/00 G06F18/22 G06F18/23

    摘要: 本申请提供了一种基因序列处理方法、装置、存储介质及电子设备。其中基因序列处理方法首先获取第一序列集,第一序列集中包含多个待处理序列;然后通过对比多个待处理序列中各类碱基的数量,对第一序列集进行过滤,得到第二序列集;根据所述第二序列集中的每个待处理序列生成多个连续重叠的子序列;进而通过对比第二序列集中各待处理序列的子序列,对第二序列集进行过滤,得到目标序列集。本申请实施例根据包含的各类碱基的数量对多个待处理序列进行了一重过滤,根据各待处理序列生成的子序列对一重过滤后的多个待处理序列进行了二重过滤,从而滤除了大量冗余的基因序列,能够提高基因序列的处理效率。

    蛋白质序列比对方法、装置、计算机设备以及存储介质

    公开(公告)号:CN115881211A

    公开(公告)日:2023-03-31

    申请号:CN202111587513.3

    申请日:2021-12-23

    发明人: 孙思琦 李煜 洪亮

    IPC分类号: G16B15/20

    摘要: 本申请提供一种蛋白质序列比对方法、装置、计算机设备以及存储介质,该方法通过蛋白序列编码模型对待查询的目标蛋白序列进行编码,得到目标蛋白编码,进而获取预设蛋白质序列库中与目标蛋白编码匹配的候选蛋白编码,以及候选蛋白编码关联的候选蛋白序列,最后,根据目标蛋白序列与候选蛋白序列的比对结果,确定目标蛋白序列的同源蛋白序列。通过将蛋白序列映射至低维度空间中以获取对应的蛋白编码,进而通过蛋白编码序列对蛋白质序列库进行蛋白序列初筛,实现在进行蛋白序列比对之前过滤不相关的蛋白序列,以缩减蛋白序列比对的数据量,有效降低蛋白序列比对的耗时,提高同源蛋白序列搜索的效率。

    蛋白质结构预测方法、装置、电子设备及存储介质

    公开(公告)号:CN115881210A

    公开(公告)日:2023-03-31

    申请号:CN202210501193.3

    申请日:2022-05-09

    IPC分类号: G16B15/00 G16B30/10

    摘要: 本申请实施例公开了一种蛋白质结构预测方法、装置、电子设备及存储介质。其中方法包括:电子设备通过采用多个数据库同时对待测蛋白质的待测氨基酸序列进行多序列比对,得到待测蛋白质对应的序列比对特征数据;在序列比对特征数据中确定出待测蛋白质对应的多个目标氨基酸序列,并对多个目标氨基酸序列进行长度排序,得到序列排序结果;根据序列排序结果确定多个目标模型;在每一目标模型中输入对应的目标氨基酸序列,输出每一目标氨基酸序列对应的非松弛结构模型;根据每一目标氨基酸序列对应的非松弛结构模型确定待测蛋白质的蛋白质结构。本申请实施例提供的蛋白质结构预测方法提升了蛋白质结构预测的效率。

    一种自动化分子动力学模拟方法、装置、存储介质及设备

    公开(公告)号:CN117789840B

    公开(公告)日:2024-06-28

    申请号:CN202311850066.5

    申请日:2023-12-29

    IPC分类号: G16C10/00

    摘要: 本发明公开了一种自动化分子动力学模拟方法、装置、存储介质及设备。所述方法包括以下步骤:(1)对待计算的体系(如蛋白、DNA或RNA)进行识别、分化和预处理,补齐缺失原子,选择力场并生成相应拓扑文件;对待计算的小分子物质进行加氢、猜测电荷、生成力场和拓扑文件等操作;(2)根据选择的力场和模拟参数自适应的构建模拟体系,包括构建模拟盒子、溶剂化及添加阴阳离子中和等内容;(3)预置常见的分子动力学模拟协议,可方便的针对不同计算场景进行快速的选择和配置;(4)自动化运行分子动力学模拟;(5)分析分子动力学模拟轨迹。所述方法能够简化执行分子动力学模拟的难度,显著增加模拟的可靠性。

    蛋白质序列比对方法、装置、计算机设备以及存储介质

    公开(公告)号:CN115881211B

    公开(公告)日:2024-02-20

    申请号:CN202111587513.3

    申请日:2021-12-23

    发明人: 孙思琦 李煜 洪亮

    IPC分类号: G16B15/20

    摘要: 本申请提供一种蛋白质序列比对方法、装置、计算机设备以及存储介质,该方法通过蛋白序列编码模型对待查询的目标蛋白序列进行编码,得到目标蛋白编码,进而获取预设蛋白质序列库中与目标蛋白编码匹配的候选蛋白编码,以及候选蛋白编码关联的候选蛋白序列,最后,根据目标蛋白序列与候选蛋白序列的比对结果,确定目标蛋白序列的同源蛋白序列。通过将蛋白序列映射至低维度空间中以获取对应的蛋白编码,进而通过蛋白编码序列对蛋白质序列库进行蛋白序列初筛,实现在进行蛋白序列比对之前过滤不相关的蛋白序列,以缩减蛋白序列比对的数据量,有效降低蛋白序列比对的耗时,提高同源蛋白序列搜索的效率。

    一种蛋白质-配体相互作用预测方法及优化方法

    公开(公告)号:CN117275610A

    公开(公告)日:2023-12-22

    申请号:CN202311459177.3

    申请日:2023-11-03

    摘要: 本发明属于计算机辅助药物设计技术领域,公开了一种蛋白质‑配体相互作用预测方法及优化方法。本方法包括:构建数据集,制作标签数据;建立蛋白质‑配体复合物模型,将蛋白质‑配体编码成蛋白质结合口袋图和蛋白质‑配体原子交互图,蛋白质‑配体原子交互图即异构图;异构图包括两类节点和四种边;构建基于边的图注意力网络打分模型,包括特征提取模块和两个解码器;训练打分模型;用训练好的打分模型预测配体结合姿态均方根偏差RMSD和蛋白质‑配体结合强度pkd。本发明的打分模型能同时预测配体结合姿态均方根偏差RMSD和结合强度pkd,并且能在打分、排序、对接和筛选任务中同时具备优异的性能,提高了模型的普适性和迁移性。