-
公开(公告)号:CN117577224B
公开(公告)日:2024-06-11
申请号:CN202311627394.9
申请日:2023-11-30
申请人: 上海智峪生物科技有限公司
摘要: 本发明提供了一种基于模板的蛋白质小分子复合物建模方法及其应用,本发明所述方法基于分子力场来执行小分子柔性对齐算法,分子力场中的相互作用参数可以提供对小分子基本几何构型,如键长、键角、键级,和元素性质,如电荷、原子半径等基本信息,在上述信息基础上进一步构建了惩罚和奖励机制,来迫使目标小分子在遵循上述力场规则的前提下尽可能与目标分子之间形成最大的空间和化学相似性。本发明的方法可以帮助在小分子药物开发过程中更准确的确定小分子在蛋白质口袋中的位置,可进一步帮助基于分子动力学模拟的自由能微扰计算或MMPBSA计算过程。
-
公开(公告)号:CN115938468A
公开(公告)日:2023-04-07
申请号:CN202210502796.5
申请日:2022-05-09
申请人: 上海智峪生物科技有限公司 , 香港中文大学(深圳)未来智联网络研究院
摘要: 本申请公开了一种蛋白质模型质量评估方法、装置及计算机设备。方法通过获取目标蛋白质模型的坐标信息以及化学键信息,目标蛋白质模型包括多个氨基酸残基,坐标信息包括每一氨基酸残基中每一原子的坐标信息,化学键信息包括目标蛋白质模型中原子之间的化学键信息;根据每一原子的坐标信息、每一原子的原子类型信息以及每一原子所属的氨基酸残基的氨基酸类型信息提取每一原子的几何特征;基于原子之间的化学键信息提取每一原子的拓扑特征;将每一原子的几何特征与对应的拓扑特征进行融合,得到每一原子的融合特征;基于每一原子的融合特征确定目标蛋白质模型中每一原子对应的模型质量分数。该方法可以提升蛋白质模型质量评估的准确性。
-
公开(公告)号:CN115910197A
公开(公告)日:2023-04-04
申请号:CN202111643397.2
申请日:2021-12-29
申请人: 上海智峪生物科技有限公司
发明人: 鞠震
摘要: 本申请提供了一种基因序列处理方法、装置、存储介质及电子设备。其中基因序列处理方法首先获取第一序列集,第一序列集中包含多个待处理序列;然后通过对比多个待处理序列中各类碱基的数量,对第一序列集进行过滤,得到第二序列集;根据所述第二序列集中的每个待处理序列生成多个连续重叠的子序列;进而通过对比第二序列集中各待处理序列的子序列,对第二序列集进行过滤,得到目标序列集。本申请实施例根据包含的各类碱基的数量对多个待处理序列进行了一重过滤,根据各待处理序列生成的子序列对一重过滤后的多个待处理序列进行了二重过滤,从而滤除了大量冗余的基因序列,能够提高基因序列的处理效率。
-
公开(公告)号:CN115881211A
公开(公告)日:2023-03-31
申请号:CN202111587513.3
申请日:2021-12-23
申请人: 上海智峪生物科技有限公司
IPC分类号: G16B15/20
摘要: 本申请提供一种蛋白质序列比对方法、装置、计算机设备以及存储介质,该方法通过蛋白序列编码模型对待查询的目标蛋白序列进行编码,得到目标蛋白编码,进而获取预设蛋白质序列库中与目标蛋白编码匹配的候选蛋白编码,以及候选蛋白编码关联的候选蛋白序列,最后,根据目标蛋白序列与候选蛋白序列的比对结果,确定目标蛋白序列的同源蛋白序列。通过将蛋白序列映射至低维度空间中以获取对应的蛋白编码,进而通过蛋白编码序列对蛋白质序列库进行蛋白序列初筛,实现在进行蛋白序列比对之前过滤不相关的蛋白序列,以缩减蛋白序列比对的数据量,有效降低蛋白序列比对的耗时,提高同源蛋白序列搜索的效率。
-
公开(公告)号:CN115881210A
公开(公告)日:2023-03-31
申请号:CN202210501193.3
申请日:2022-05-09
申请人: 上海智峪生物科技有限公司
摘要: 本申请实施例公开了一种蛋白质结构预测方法、装置、电子设备及存储介质。其中方法包括:电子设备通过采用多个数据库同时对待测蛋白质的待测氨基酸序列进行多序列比对,得到待测蛋白质对应的序列比对特征数据;在序列比对特征数据中确定出待测蛋白质对应的多个目标氨基酸序列,并对多个目标氨基酸序列进行长度排序,得到序列排序结果;根据序列排序结果确定多个目标模型;在每一目标模型中输入对应的目标氨基酸序列,输出每一目标氨基酸序列对应的非松弛结构模型;根据每一目标氨基酸序列对应的非松弛结构模型确定待测蛋白质的蛋白质结构。本申请实施例提供的蛋白质结构预测方法提升了蛋白质结构预测的效率。
-
公开(公告)号:CN118374463A
公开(公告)日:2024-07-23
申请号:CN202410650535.7
申请日:2024-05-23
申请人: 上海智峪生物科技有限公司
摘要: 本发明提供了用于合成香兰素的4‑乙烯基愈创木酚加氧酶突变体及其工程菌,属于基因工程技术领域。本发明对4‑乙烯基愈创木酚加氧酶基因Iso的第27位、第156位、第216位、第351位中的任意两个或两个以上位点进行突变,获得4‑乙烯基愈创木酚加氧酶突变体。本发明成功构建了能够高效催化阿魏酸通过两步酶法生成香兰素的基因工程菌株,在酶反应体系中5h内能够催化产生香兰素最高达19.58g/L,传至1000代仍可稳定表达阿魏酸脱羧酶和4‑乙烯基愈创木酚加氧酶,且酶活力没有影响,实现天然香兰素的工业化生产,满足市场对于香兰素的需求。
-
公开(公告)号:CN117789840B
公开(公告)日:2024-06-28
申请号:CN202311850066.5
申请日:2023-12-29
申请人: 上海智峪生物科技有限公司
IPC分类号: G16C10/00
摘要: 本发明公开了一种自动化分子动力学模拟方法、装置、存储介质及设备。所述方法包括以下步骤:(1)对待计算的体系(如蛋白、DNA或RNA)进行识别、分化和预处理,补齐缺失原子,选择力场并生成相应拓扑文件;对待计算的小分子物质进行加氢、猜测电荷、生成力场和拓扑文件等操作;(2)根据选择的力场和模拟参数自适应的构建模拟体系,包括构建模拟盒子、溶剂化及添加阴阳离子中和等内容;(3)预置常见的分子动力学模拟协议,可方便的针对不同计算场景进行快速的选择和配置;(4)自动化运行分子动力学模拟;(5)分析分子动力学模拟轨迹。所述方法能够简化执行分子动力学模拟的难度,显著增加模拟的可靠性。
-
公开(公告)号:CN115881211B
公开(公告)日:2024-02-20
申请号:CN202111587513.3
申请日:2021-12-23
申请人: 上海智峪生物科技有限公司
IPC分类号: G16B15/20
摘要: 本申请提供一种蛋白质序列比对方法、装置、计算机设备以及存储介质,该方法通过蛋白序列编码模型对待查询的目标蛋白序列进行编码,得到目标蛋白编码,进而获取预设蛋白质序列库中与目标蛋白编码匹配的候选蛋白编码,以及候选蛋白编码关联的候选蛋白序列,最后,根据目标蛋白序列与候选蛋白序列的比对结果,确定目标蛋白序列的同源蛋白序列。通过将蛋白序列映射至低维度空间中以获取对应的蛋白编码,进而通过蛋白编码序列对蛋白质序列库进行蛋白序列初筛,实现在进行蛋白序列比对之前过滤不相关的蛋白序列,以缩减蛋白序列比对的数据量,有效降低蛋白序列比对的耗时,提高同源蛋白序列搜索的效率。
-
公开(公告)号:CN117524295A
公开(公告)日:2024-02-06
申请号:CN202311625413.4
申请日:2023-11-30
申请人: 杭州知峪生物科技有限公司 , 上海智峪生物科技有限公司
摘要: 本发明公开了一种基于大规模结构预训练模型的酶稳定性预测方法,涉及生物信息技术领域。所述的酶稳定性预测方法包括以下步骤:S1、蛋白质结构数据库的构建;S2、模型的预训练:利用MLM技术,并将蛋白质的氨基酸以及氨基酸之间的角度和距离信息引入模型,进行训练;S3、输入蛋白质序列,使用神经网络模型对酶稳定性进行预测。本发明的酶稳定性预测方法具有较高的精度,运算速度更快,整体预测结果更稳定。
-
公开(公告)号:CN117275610A
公开(公告)日:2023-12-22
申请号:CN202311459177.3
申请日:2023-11-03
申请人: 上海智峪生物科技有限公司
摘要: 本发明属于计算机辅助药物设计技术领域,公开了一种蛋白质‑配体相互作用预测方法及优化方法。本方法包括:构建数据集,制作标签数据;建立蛋白质‑配体复合物模型,将蛋白质‑配体编码成蛋白质结合口袋图和蛋白质‑配体原子交互图,蛋白质‑配体原子交互图即异构图;异构图包括两类节点和四种边;构建基于边的图注意力网络打分模型,包括特征提取模块和两个解码器;训练打分模型;用训练好的打分模型预测配体结合姿态均方根偏差RMSD和蛋白质‑配体结合强度pkd。本发明的打分模型能同时预测配体结合姿态均方根偏差RMSD和结合强度pkd,并且能在打分、排序、对接和筛选任务中同时具备优异的性能,提高了模型的普适性和迁移性。
-
-
-
-
-
-
-
-
-