-
公开(公告)号:CN119479836A
公开(公告)日:2025-02-18
申请号:CN202510058985.1
申请日:2025-01-15
Applicant: 之江实验室
IPC: G16B50/10 , G16B40/00 , G06F18/22 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/08
Abstract: 本申请涉及一种基于预训练大语言模型的蛋白质功能注释方法和装置,应用于人工智能驱动的计算生物领域,其中,该蛋白质功能注释方法包括:将待注释蛋白质序列输入目标蛋白质功能域分类模型,得到待注释蛋白质序列所包含的功能域类别;将待注释蛋白质序列所包含的功能域类别和待注释蛋白质序列,输入目标蛋白质功能域识别模型,得到待注释蛋白质序列的功能域类别所在的目标位置;根据待注释蛋白质序列的功能域类别所在的目标位置,对待注释蛋白质序列进行功能注释。通过本申请,实现了准确且高效识别完整蛋白质序列上的功能域的效果。
-
公开(公告)号:CN117727365A
公开(公告)日:2024-03-19
申请号:CN202311710888.3
申请日:2023-12-13
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多模态预训练大模型的蛋白质逆向折叠方法、设备,该方法包括:收集蛋白质结构和蛋白质序列配对数据进行预处理,构建训练集、验证集和测试集;基于蛋白质结构,通过预训练好的蛋白质结构编码器获取蛋白质的结构表征;通过蛋白质结构适配器将蛋白质的结构表征转换为序列生成的结构指导;运用自回归方法预训练蛋白质大语言模型,将序列生成的结构指导与蛋白质语言起始符进行拼接后输入到预训练好的蛋白质大语言模型中生成与蛋白质结构配对的蛋白质序列;使用评估指标对生成的蛋白质序列进行评估。本发明即使在训练数据较少的情况下也能够有较高的生成准确度,有利于提高逆向折叠的准确度与生成序列的广泛性与创新性。
-
公开(公告)号:CN119127149B
公开(公告)日:2025-04-22
申请号:CN202411605822.2
申请日:2024-11-12
Applicant: 之江实验室
Abstract: 本申请涉及一种设备后端的深度学习框架适配方法、装置以及设备。所述方法包括:获取设备后端的预配置信息;根据所述预配置信息,生成所述设备后端的初始框架和集成模版;基于所述初始框架和集成模板,构建所述设备后端的适配代码模板;对所述适配代码模板进行自适应代码配置,得到所述设备后端适配的深度学习框架。采用本方法能够屏蔽了不同框架、版本和设备类型的差异,使设备能够快速、高效的完成深度学习框架适配和维护,简化和规范深度学习框架与设备后端的适配过程。
-
公开(公告)号:CN115954048A
公开(公告)日:2023-04-11
申请号:CN202310004646.6
申请日:2023-01-03
Applicant: 之江实验室
Abstract: 本说明书公开了一种针对CRISPR‑Cas系统的筛选方法及装置,可以获取CRISPR‑Cas系统的相关信息以及对应的标注信息,CRISPR‑Cas系统对应的标注信息用于表示该CRISPR‑Cas系统是否具有自处理能力;而后,可以根据该相关信息,确定CRISPR‑Cas系统中的保守重复序列,并根据保守重复序列,确定该CRISPR‑Cas系统对应的基因特征,进而对预测模型进行训练,训练后的预测模型可以用于筛选出用于基因编辑工具开发的目标CRISPR‑Cas系统,本方法通过自动筛选出一批存在较大概率具有自处理能力的CRISPR‑Cas系统,能够提高基因编辑工具的开发的效率。
-
公开(公告)号:CN118711675B
公开(公告)日:2025-02-14
申请号:CN202411154210.6
申请日:2024-08-22
Applicant: 之江实验室
IPC: G16B40/00 , G16B20/00 , G06N3/042 , G06N3/0455 , G06N3/047 , G06N3/0475 , G06N3/088
Abstract: 本发明公开了一种基于变分图自编码器的基因量化表征方法和系统,方法包括以下步骤:根据蛋白质互作网络数据构建蛋白质互作网络有向图;根据基因本体论数据构建包括生物学过程树图、细胞成分树图和分子功能树图的三棵树图;分别计算三棵树图中根节点与目标基因的节点之间的非冗余最短路径作为目标基因的初级量化表征;将目标基因分别在三棵树图中的初级量化表征融合后再与蛋白质互作网络有向图结合,得到高级蛋白质互作网络有向图;将高级蛋白质互作网络有向图输入基于变分图自编码器的图神经网络模型中实现基因高级量化表征。本发明基于PPI、GO和变分图自编码器实现了单细胞基因的高效量化表征,为生物医学研究提供了深度和精度。
-
公开(公告)号:CN119127149A
公开(公告)日:2024-12-13
申请号:CN202411605822.2
申请日:2024-11-12
Applicant: 之江实验室
Abstract: 本申请涉及一种设备后端的深度学习框架适配方法、装置以及设备。所述方法包括:获取设备后端的预配置信息;根据所述预配置信息,生成所述设备后端的初始框架和集成模版;基于所述初始框架和集成模板,构建所述设备后端的适配代码模板;对所述适配代码模板进行自适应代码配置,得到所述设备后端适配的深度学习框架。采用本方法能够屏蔽了不同框架、版本和设备类型的差异,使设备能够快速、高效的完成深度学习框架适配和维护,简化和规范深度学习框架与设备后端的适配过程。
-
公开(公告)号:CN116863996A
公开(公告)日:2023-10-10
申请号:CN202310724842.0
申请日:2023-06-19
Applicant: 之江实验室
Abstract: 本发明公开了一种推荐塑料降解酶突变位点的方法、电子设备、介质,包括:步骤S1,获取待预测塑料降解酶的氨基酸序列及其底物;预测底物与塑料降解酶的相互作用区域;设置阈值距离,以底物分子或塑料降解酶活性位点为基准阈值距离内的塑料降解酶氨基酸作为候选氨基酸突变位点;步骤S2,获取待预测塑料降解酶的空间结构,以氨基酸为节点,氨基酸之间的连接为边,经几何向量感知机预测输出每个候选氨基酸突变位点对应的i种氨基酸的预测概率,将概率最高的氨基酸作为该候选氨基酸突变位点可推荐的氨基酸;比较每个候选氨基酸突变位点的预测结果,当预测结果与原氨基酸序列不一致时,将该候选氨基酸突变位点作为推荐的塑料降解酶突变位点。
-
公开(公告)号:CN115954048B
公开(公告)日:2023-06-16
申请号:CN202310004646.6
申请日:2023-01-03
Applicant: 之江实验室
Abstract: 本说明书公开了一种针对CRISPR‑Cas系统的筛选方法及装置,可以获取CRISPR‑Cas系统的相关信息以及对应的标注信息,CRISPR‑Cas系统对应的标注信息用于表示该CRISPR‑Cas系统是否具有自处理能力;而后,可以根据该相关信息,确定CRISPR‑Cas系统中的保守重复序列,并根据保守重复序列,确定该CRISPR‑Cas系统对应的基因特征,进而对预测模型进行训练,训练后的预测模型可以用于筛选出用于基因编辑工具开发的目标CRISPR‑Cas系统,本方法通过自动筛选出一批存在较大概率具有自处理能力的CRISPR‑Cas系统,能够提高基因编辑工具的开发的效率。
-
公开(公告)号:CN119479836B
公开(公告)日:2025-05-06
申请号:CN202510058985.1
申请日:2025-01-15
Applicant: 之江实验室
IPC: G16B50/10 , G16B40/00 , G06F18/22 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/08
Abstract: 本申请涉及一种基于预训练大语言模型的蛋白质功能注释方法和装置,应用于人工智能驱动的计算生物领域,其中,该蛋白质功能注释方法包括:将待注释蛋白质序列输入目标蛋白质功能域分类模型,得到待注释蛋白质序列所包含的功能域类别;将待注释蛋白质序列所包含的功能域类别和待注释蛋白质序列,输入目标蛋白质功能域识别模型,得到待注释蛋白质序列的功能域类别所在的目标位置;根据待注释蛋白质序列的功能域类别所在的目标位置,对待注释蛋白质序列进行功能注释。通过本申请,实现了准确且高效识别完整蛋白质序列上的功能域的效果。
-
公开(公告)号:CN119132401B
公开(公告)日:2025-02-11
申请号:CN202411617083.9
申请日:2024-11-13
Applicant: 之江实验室
IPC: G16B25/10 , G16B45/00 , G06F18/2415
Abstract: 本发明公开了一种基于人工智能算法的高精度单细胞分类方法和装置,包括:首先,将原始单细胞数据转换为csv格式,并构建表达矩阵以描述基因在不同条件下的表达水平;接着,通过降维和聚类分析初步划分单细胞类别;进一步,结合PPI和GO信息,使用图神经网络方法对基因进行量化表征和分类;然后,构建单细胞数据嵌入模型,通过编码器和解码器提取特征,并通过交叉验证和超参数优化训练模型;最后将模型中编码器的隐藏层作为单细胞的嵌入表达矩阵,该层囊括了原始单细胞表达信息、PPI、GO等多维度数据,可实现包括单细胞精确分类在内的多种下游任务。本发明有助于深入理解基因表达模式,为疾病治疗和药物设计提供数据支持。
-
-
-
-
-
-
-
-
-