蛋白质对接预测方法、装置、计算机设备及可读存储介质

    公开(公告)号:CN119920301A

    公开(公告)日:2025-05-02

    申请号:CN202411716230.8

    申请日:2024-11-27

    Abstract: 本申请涉及一种蛋白质对接预测方法、装置、计算机设备及可读存储介质;获取目标蛋白质对应的第一相似蛋白质以及第二相似蛋白质;根据第一相似蛋白质,对目标蛋白质进行序列增强处理,得到增强序列特征;根据第二相似蛋白质,对目标蛋白质进行结构增强处理,得到增强空间特征;对目标蛋白质进行关键结构区域特征提取,得到关键结构特征;根据目标蛋白质对应的增强序列特征、增强空间特征以及关键结构特征进行特征融合,得到待对接蛋白质组表征;根据待对接蛋白质组表征,对待对接蛋白质组进行对接预测,得到蛋白质对接预测结果;能够精准描述蛋白质对接中的微观结构变化,提高了对接预测的准确性。

    统一蛋白质改造方法、装置以及计算机设备

    公开(公告)号:CN119626323B

    公开(公告)日:2025-04-29

    申请号:CN202510152043.X

    申请日:2025-02-12

    Applicant: 浙江大学

    Abstract: 本申请涉及一种统一蛋白质改造方法、装置以及计算机设备,通过基于文本‑蛋白质对数据集,微调初始蛋白质表征模型,使人类语言大模型和所述初始蛋白质表征模型在语义空间进行对齐,得到目标蛋白质表征模型;将获取到的优化目标输入所述人类语言大模型,得到第一表征;基于获取到的关键突变位点,生成蛋白质突变体的集合;将所述蛋白质突变体的集合输入所述目标蛋白质表征模型,得到各个所述蛋白质突变体对应的第二表征;基于与所述第一表征匹配的所述第二表征,得到符合优化目标的蛋白质突变体,解决了蛋白质功能预测泛化性差的问题,提高对未知蛋白质和突变体的功能预测性能,实现高效的蛋白质改造效果。

    基于蛋白质安全知识图谱的对抗强化学习的蛋白质安全可控生成方法和装置

    公开(公告)号:CN118737287B

    公开(公告)日:2025-04-11

    申请号:CN202410858983.6

    申请日:2024-06-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于蛋白质安全知识图谱的对抗强化学习的蛋白质安全可控生成方法和装置,包括:构建蛋白质安全知识图谱;提取有害蛋白质序列的初始嵌入表示和外部知识的嵌入向量;基于有害蛋白质序列的初始嵌入表示和外部知识的嵌入向量并结合蛋白质安全知识图谱进行知识嵌入,得到增强嵌入表示;构建包含生成器和惩罚模型的生成式对抗网络,并进行一阶段的对抗惩罚学习;固定一阶段对抗惩罚学习后的惩罚模型的参数,进行二阶段的强化学习;利用二阶段参数优化后的生成器生成安全可控的新蛋白质,该方法和装置以基于语言模型为基础的,将知识图谱作为外部知识,利用对抗强化学习引导蛋白质安全可控生成。

    一种可微的挖掘常量规则的方法

    公开(公告)号:CN113987195B

    公开(公告)日:2025-01-14

    申请号:CN202111150589.X

    申请日:2021-09-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种可微的挖掘常量规则的方法,在根据知识图谱定义常量操作符和路径操作符的基础上,采用了融合注意力机制,利用注意力值评估规则所经过的关系,同时对每跳的尾节点聚合周围属性及对应的属性值分别计算注意力,并用属性的注意力增强规则中的关系的选择,以实现链接预测;根据生成的模型参数经过参数解析并通过统计输出高质量的符号化规则。该方法特别适合需要较高预测准确度、为预测提供解释以及需要沉淀推理规则的拥有复合推理需求的应用场景。

    基于迭代优化预训练大模型采样的定向蛋白质改造方法

    公开(公告)号:CN116913379B

    公开(公告)日:2024-09-10

    申请号:CN202310925090.4

    申请日:2023-07-26

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于迭代优化预训练大模型采样的定向蛋白质改造方法,包括:基于蛋白质预训练大模型对目标蛋白质关键突变位置进行预测,得到候选突变氨基酸的概率分布;根据概率分布采用最优传输距离采样候选突变氨基酸以得到目标突变蛋白质;利用高通量实验设备合成目标突变蛋白质并进行生化测试,得到湿实验标注结果;将带有湿实验标注结果的目标突变蛋白质对模型进行有监督训练,利用训练后的模型对目标蛋白质关键突变位置进行预测并降序排序;依据降序排序筛选多个突变蛋白质,并结合天然蛋白质对大模型做无监督微调;利用微调后的蛋白质预训练大模型,重复上述过程直至达到蛋白质改造预期目标。该方法蛋白质改造效率和准确度高。

    一种基于知识图谱蒸馏的知识图谱嵌入压缩方法

    公开(公告)号:CN113987196B

    公开(公告)日:2024-05-24

    申请号:CN202111152202.4

    申请日:2021-09-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于知识图谱蒸馏的知识图谱嵌入压缩方法,将充分捕捉高维知识图谱嵌入模型(Teacher模型)中的三元组信息和嵌入结构信息蒸馏到知识图谱嵌入模型(Student模型)中,在保证Student模型存储和推理效率的情况下,提升了Student模型的表达能力,在蒸馏过程中考虑了Teacher模型和Student模型之间的双重影响,提出了软标签评估机制来区分不同三元组的软标签的质量,并提出了先固定Teacher模型后解除固定Teacher模型的训练方式,来提高Student模型对Teacher模型的适应性,最终提升Student模型的性能。

    一种融合知识图谱的跨模态情感分析方法和装置

    公开(公告)号:CN116861367A

    公开(公告)日:2023-10-10

    申请号:CN202310909452.0

    申请日:2023-07-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种融合知识图谱的跨模态情感分析方法和装置,包括以下步骤:采用预训练模型从图像中提取文本形式的图像字幕和图像层面的第一多模态知识图谱;从描述文本中提取需要情感分析的目标主体,并为目标主体构建掩码模板;通过预训练模型将描述文本转换成文本层面的知识图谱;通过实体节点对齐的方式将第一多模态知识图谱和知识图谱扩展成传递图像和文本联系的第二多模态知识图谱;将第二多模态知识图谱中的三元组进行序列化展平得到序列化三元组,并采用可视化矩阵对序列化三元组进行结构信息的补充;利用包括编码器、解码器以及全连接层的情感分析模型进行情感分析。该方法和装置使得在多模态情感分类任务中取得了更好的表现。

    一种基于隐式知识反刍的问答推理方法和装置

    公开(公告)号:CN116821294A

    公开(公告)日:2023-09-29

    申请号:CN202310733848.4

    申请日:2023-06-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于隐式知识反刍的问答推理方法和装置,定义任务引导提示,每个任务引导提示包括提示语句和多个遮蔽词;利用知识反刍模型对任务引导提示、输入问题文本以及候选答案的拼接结果进行知识反刍得到隐式反刍知识;对隐式反刍知识做映射得到两个投影向量;基于包含自注意力模块和前馈神经神经网络的预训练语言模型构建问答推理模型,利用自注意力模块基于输入问答文本和候选答案组提取隐藏状态,该隐藏状态经过前馈神经神经网络的2层线性层得到提取特征,两个投影向量分别拼接到两层提取特征末尾实现对提取特征的扩展,基于扩展特征进行问答预测,以提升问答推理的准确性。

    一种基于本体知识增强的实体关系抽取方法与装置

    公开(公告)号:CN116757205A

    公开(公告)日:2023-09-15

    申请号:CN202310059359.5

    申请日:2023-01-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于本体知识增强的实体关系抽取方法和装置,包括:获取样本的文本语料以及本体信息,并构建本体知识库;对于待抽取文本,通过检索方式在本体知识库中检索获取待抽取文本相关的本体知识,并基于本体知识构建本体知识提示模板;将本体知识提示模板注入待抽取文本以实现本体知识增强,对本体知识增强的待抽取文本进行实体关系抽取以得到抽取结果。通过该方式能够可插拔地对不同的实体关系抽取都进行本体知识的检索增强,以提高实体关系抽取的准确性。

Patent Agency Ranking