-
公开(公告)号:CN114283878B
公开(公告)日:2024-06-25
申请号:CN202110997711.0
申请日:2021-08-27
Applicant: 腾讯科技(深圳)有限公司
Inventor: 吴家祥
Abstract: 本申请实施例涉及一种训练匹配模型、预测氨基酸序列和设计药物的方法与装置。其中,训练匹配模型的方法包括:获取样本集,所述样本集包括已知蛋白质三维结构以及所述已知蛋白质三维结构相应的氨基酸序列;和将所述样本集输入匹配函数并进行训练,以便获得经过训练的匹配模型。利用根据本申请实施例的方法,能够提高预测氨基酸序列与蛋白质三维结构匹配程度的预测精度。
-
公开(公告)号:CN114333980B
公开(公告)日:2024-06-07
申请号:CN202110996109.5
申请日:2021-08-27
Applicant: 腾讯科技(深圳)有限公司
Inventor: 吴家祥
Abstract: 本申请实施例提供一种模型训练、蛋白质特征提取和功能预测的方法与装置,其中,模型的训练方法包括:基于起始蛋白质的三维结构,构建起始拓扑图G,其中,所述起始拓扑图G采用所述起始蛋白质的氨基酸残基作为节点,所述起始拓扑图G采用邻近氨基酸残基对作为边;和将所述起始拓扑图G输入至预训练模型,对所述预训练模型进行训练,以便获得用于对所述蛋白质进行特征提取的预训练模型,其中,所述预训练模型包括具有SE(3)等变性的图神经网络。由此,可以提高蛋白质特征提取等相关预测的预测精度,降低工作成本,提高预测效率。
-
公开(公告)号:CN117219164A
公开(公告)日:2023-12-12
申请号:CN202310497719.X
申请日:2023-05-05
Applicant: 腾讯科技(深圳)有限公司
Inventor: 吴家祥
IPC: G16B30/00 , G06F18/214
Abstract: 本公开的实施例提供了一种抗体改造模型训练方法、抗体改造方法、及其分别对应的装置、设备、计算机程序产品和存储介质。其中,通过基于包括动物抗体和人类抗体数据的训练样本集对语言模型进行自监督预训练,使得所得到的预训练语言模型具有与训练动物抗体与训练人类抗体之间的特征差异相关的知识,并且通过利用与抗体改造相关的多个性能指标,对所述预训练语言模型进行进一步优化,以生成最终用于抗体改造的抗体改造模型。通过本公开的实施例的方法能够结合动物抗体和人类抗体数据,使得模型可以更好地处理以动物抗体为输入的人源化改造任务,优化其抗体人源化的改造结果,提高抗体人源化改造的成功率,从而为抗体药物研发提供技术支持。
-
公开(公告)号:CN117012270A
公开(公告)日:2023-11-07
申请号:CN202211415750.6
申请日:2022-11-11
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种蛋白质结构预测方法、装置、计算机设备及存储介质,涉及机器学习技术领域。该方法包括:对至少两条单链氨基酸序列进行蛋白质语言编码,得到每条单链氨基酸序列对应的第一氨基酸编码和第一氨基酸对编码;基于第一氨基酸编码和第一氨基酸对编码进行单链结构预测以及编码更新,得到各条单链氨基酸序列的预测单链结构、更新氨基酸编码以及更新氨基酸对编码;对至少两条单链氨基酸序列的预测单链结构、更新氨基酸编码以及更新氨基酸对编码进行特征融合,得到蛋白质的第二氨基酸编码和第二氨基酸对编码;基于第二氨基酸编码和第二氨基酸对编码进行蛋白质结构预测,得到蛋白质的预测蛋白质结构。实现从单链氨基酸序列预测蛋白质结构。
-
公开(公告)号:CN116959556A
公开(公告)日:2023-10-27
申请号:CN202310543152.5
申请日:2023-05-15
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种结构确定模型的训练方法、蛋白质结构的确定方法及装置,属于生物信息技术领域。方法包括:通过第一网络模型基于至少两条样本肽链的序列数据确定多对样本氨基酸的配对特征,一对样本氨基酸的配对特征表征两个样本氨基酸之间相互作用的强度。通过第一网络模型基于多对样本氨基酸的配对特征确定样本蛋白质的预测结构信息。基于实际结构信息和预测结构信息,对第一网络模型进行训练得到结构确定模型。通过多对样本氨基酸的配对特征反映样本肽链内部相互作用的强度和样本肽链之间相互作用的强度,实现了预测样本肽链的折叠方式和结合方式,从而实现预测样本蛋白质的结构信息,提高预测结构信息的准确性。
-
公开(公告)号:CN110163367B
公开(公告)日:2023-04-07
申请号:CN201811150239.1
申请日:2018-09-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06N3/082 , G06N3/092 , G06N3/0985
Abstract: 本申请实施例公开了一种模型压缩方法及装置,在获取待压缩模型和针对该待压缩模型的压缩偏好配置时,可以根据待压缩模型的模型类型和压缩偏好配置确定出压缩算法组件和对应的算法超参数取值,并利用上述压缩算法组件和算法超参数取值对待压缩模型进行第一次压缩,得到第一次压缩对应的候选压缩结果。若第一次压缩对应的候选压缩结果的性能参数与压缩偏好配置的符合程度未满足预设条件,继续生成调参策略以调整下一次压缩所用的压缩算法组件和算法超参数取值,直到某一次压缩对应的候选压缩结果的性能参数与所述压缩偏好配置的符合程度满足预设条件为止。不需要人工调整压缩算法,避免了人为经验带来的影响,提高了压缩效率。
-
公开(公告)号:CN113571122A
公开(公告)日:2021-10-29
申请号:CN202110145884.X
申请日:2021-02-02
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请提供一种电子密度图的确定方法、装置、电子设备和存储介质,属于计算机技术领域。其中,电子密度图的确定方法包括:基于目标对象的分子结构,构建三维坐标系并进行三维网格化,获得所述目标对象对应的各个网格点;将所述各个原子和所述各个网络点均作为节点,基于所述各个原子的三维坐标,以及所述各个网格点的三维坐标,确定所述目标对象对应的各个节点的节点特征,以及每两个节点之间的边特征;将所述各个节点特征以及所述各个边特征输入已训练的电子密度图生成模型,分别得到所述各个网格点的电子密度,其中,每个网格点的电子密度表示在相应网格点发现电子的概率。上述方法可以提高电子密度图的准确性。
-
公开(公告)号:CN112116090A
公开(公告)日:2020-12-22
申请号:CN202011037798.9
申请日:2020-09-28
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种神经网络结构搜索方法、装置、计算机设备及存储介质,该方法采用控制器执行搜索策略生成子网络结构,通过对子网络的性能进行评估,然后反馈到控制器中训练使其能够学习生成所需的神经网络结构;在子网络的训练过程中,对各个子网络在相同节点位置处同种类型的隐藏层实行参数共享,可有效提高子网络的训练效率,节省计算机资源,降低硬件成本,大大加快搜索的速度;并且在子网络更新共享权重参数时,通过约束对已经训练好的子网络所造成的干扰,可以提高后续对各个子网络结构进行性能评估时的准确性,在训练控制器时更为精确,进而使训练好的控制器所搜索到的神经网络结构的性能得到提高。本申请可广泛应用于人工智能技术领域。
-
公开(公告)号:CN110826692B
公开(公告)日:2023-11-17
申请号:CN201911016094.0
申请日:2019-10-24
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及一种自动化模型压缩方法、装置、设备及存储介质,所述方法包括:确定第一数量的预设分布分量,基于预设的模型参数范围以及所述第一数量,确定各预设分布分量的统计值;基于预设模型和各预设分布分量的统计值,构建待训练模型;获取训练样本,基于所述训练样本对所述待训练模型进行训练得到训练结果;基于训练结果确定出目标分布分量;将已训练模型中的各模型参数分别量化到所述目标分布分量的目标统计值中,得到与各模型参数分别对应的量化参数;基于各量化参数,生成与所述已训练模型对应的目标压缩模型。采用本申请缩短了模型压缩过程的耗时,减少了模型压缩过程中的计算量,从而提高了模型压缩的效率。
-
公开(公告)号:CN110880036B
公开(公告)日:2023-10-13
申请号:CN201911142056.X
申请日:2019-11-20
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请是关于一种神经网络压缩方法、装置、计算机设备及存储介质,涉及神经网络技术领域。该方法包括:将训练样本分别输入教师网络和学生网络;获取教师网络中包含第i层的第一模型参数和第一特征图的第一网络数据,以及学生网络中包含第i层的第二模型参数和第二特征图的第二网络数据,将第一网络数据和第二网络数据进行交叉计算,获得损失函数值,再根据损失函数值对学生网络中的第i层的第二模型参数进行更新。该方案能够在通过少量的训练数据对已经训练好的神经网络进行压缩的场景下,提高压缩后的神经网络的准确性。
-
-
-
-
-
-
-
-
-