生物分子序列搜索方法、装置、设备及存储介质

    公开(公告)号:CN119229970B

    公开(公告)日:2025-03-25

    申请号:CN202411721651.X

    申请日:2024-11-28

    Abstract: 本公开提出一种生物分子序列搜索方法、装置、设备及存储介质。包括:获取未知生物分子序列;将未知生物分子序列输入序列编码模型进行序列编码,得到未知生物分子序列表示;通过未知生物分子序列表示对生物分子序列向量数据库中不同的候选向量集进行相似性搜索,候选向量集的每个候选向量的候选生物分子序列的序列长度相同;根据相似性搜索结果从每个候选向量集中搜索出预设数量的已知生物分子序列表示;从多个已知生物分子序列表示对应的已知生物分子序列中,筛选出未知生物分子序列对应的同源生物分子序列。该方法在相似性搜索的多个准确已知生物分子序列中进一步筛选出高质量的同源生物分子序列,提高同源生物分子序列搜索的精确度和搜索效率。

    基因模型的训练方法、基因序列分类的方法、设备及产品

    公开(公告)号:CN119626341A

    公开(公告)日:2025-03-14

    申请号:CN202411765699.0

    申请日:2024-11-29

    Abstract: 本申请实施例提供了一种基因模型的训练方法、基因序列分类的方法、设备及产品,应用于计算机技术领域,该模型的训练方法包括:获取训练集,训练集包括基因序列信息,将基因序列信息与标准基因序列进行比较,得到基因序列信息中的异常序列信息,异常序列信息至少用于表征基因序列信息中异常基因的异常位置和异常类型;基于所述训练集,对基因模型进行训练,得到训练后的基因模型。本申请实施例所提供的方法可以提升基于该训练集所训练得到的基因模型在个体数据的泛化能力,进而可以降低将训练后的基因模型应用到相关下游任务中的复杂度。

    细胞知识图谱构建方法、装置、计算设备及存储介质

    公开(公告)号:CN115114445B

    公开(公告)日:2025-03-14

    申请号:CN202210533867.8

    申请日:2022-05-17

    Abstract: 本公开提供了一种构建细胞知识图谱的方法,包括:确定细胞相关领域中的多个实体类型以及多个关系类型,每个关系类型表征具有所述多个实体类型中的任意实体类型的两个实体之间的关系;从第一数据集合中获取多个第一实体以及与所述多个第一实体对应的多个第一关系,其中,所述第一数据集合包括预设的多个实体以及与所述多个实体对应的多个关系;以所述多个第一实体作为节点,并且以所述多个第一关系作为边,构建细胞知识图谱;从第二数据集合中获取多个第二实体以及与所述多个第二实体对应的第二关系,所述第二数据集合包括所述细胞相关领域中的文献数据;根据所述多个第二实体和所述第二关系,更新所述细胞知识图谱。

    预测模型的训练方法、装置、电子设备、介质及程序产品

    公开(公告)号:CN119049562A

    公开(公告)日:2024-11-29

    申请号:CN202411162345.7

    申请日:2024-08-22

    Abstract: 本申请提供了一种预测模型的训练方法、装置、电子设备、介质及程序产品;方法包括:基于第一训练数据集对初始化的第一预测模型进行预训练,得到第二预测模型;从每个第一样本全基因组序列中提取目标二核苷酸位点,将包含目标二核苷酸位点的预配置窗口范围内的第二样本全基因组序列;对每个第二样本全基因组序列中的目标二核苷酸位点标注实际甲基化状态;将每个标注后的第二样本全基因组序列组合为第二训练数据集;基于第二训练数据集对第二预测模型进行训练处理,得到训练后的第三预测模型,第三预测模型用于预测待检测全基因组序列中二核苷酸位点的甲基化状态。通过本申请,能够提升预测基因位点甲基化状态的准确性。

    一种数据处理方法、计算机设备以及可读存储介质

    公开(公告)号:CN112131239B

    公开(公告)日:2024-06-25

    申请号:CN202011062992.2

    申请日:2020-09-30

    Abstract: 本申请实施例公开了一种数据处理方法、计算机设备以及可读存储介质,该数据处理方法包括:接收业务服务器发送的与目标业务相关联的指标上报字段;从业务服务器中获取上报规则,从上报规则中提取目标采集指标;在数据仓库中,获取与目标业务相关联的当前数据表;根据目标采集指标与当前数据表所包含的当前采集指标,确定差异采集指标;根据差异采集指标更新当前数据表,得到包含所述目标采集指标的目标数据表;对指标上报字段进行解析,得到与目标采集指标相关联的指标业务数据,将指标业务数据存储至目标数据表中。采用本申请,数据仓库可以自动适配上游数据源信息,保证数据的一致性与稳定性,减少人力成本和时间成本。

    抗体生成方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN116978447A

    公开(公告)日:2023-10-31

    申请号:CN202310032698.4

    申请日:2023-01-10

    Abstract: 本申请提供了一种基于人工智能的抗体生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取对应第一抗原与第一抗体的第一复合结构;通过第一替换工具对第一复合结构进行抗体遍历替换处理,得到第二复合结构,从第二复合结构对应的替换方式中获取第一结合能降低量最多的候选替换方式;通过第二替换工具对第一复合结构按照候选替换方式进行替换处理,得到第三复合结构,基于第三复合结构的第二结合能降低量对第三复合结构进行降序排序处理;将降序排序结果中排序在首位的第三复合结构作为第四复合结构,将第四复合结构中的抗体结构作为目标抗体结构。通过本申请,能够提高目标抗体的成功率的前提下兼顾处理替换速度。

    对象分类方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN116956172A

    公开(公告)日:2023-10-27

    申请号:CN202310084562.8

    申请日:2023-01-17

    Abstract: 本申请关于一种对象分类方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域。该方法包括:获取目标测序特征;目标测序特征是对目标对象的目标细胞受体进行测序得到的统计特征;目标细胞受体是具有识别第一物质的功能的细胞受体;将目标测序特征映射至分类空间,获得目标对象的分类概率分布;分类概率分布用于指示第二物质的各种物质浓度水平的概率;第二物质是由第一物质触发生成的物质;基于目标对象的分类概率分布,获取对象分类结果;对象分类结果用于指示目标对象的第二物质的物质浓度水平。本方案可以基于AI技术提高物质浓度水平的检测效率和准确性。

    抗原预测方法、装置、设备以及存储介质

    公开(公告)号:CN115171787A

    公开(公告)日:2022-10-11

    申请号:CN202210804792.2

    申请日:2022-07-08

    Abstract: 本申请公开了一种抗原预测方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,抗原预测模型对免疫细胞受体的基因信息以及序列进行特征提取,得到免疫细胞受体的基因特征以及序列特征。在获取免疫细胞受体的受体特征的过程中,融合了基因特征、序列特征以及三维结构特征。三维结构特征的引入丰富了受体特征的内容,提高了受体特征的表达能力,从而基于受体特征进行抗原预测时,得到的目标抗原的准确性较高。

Patent Agency Ranking