一种基于掩码语言模型的基因型补全方法及相关设备

    公开(公告)号:CN117594123A

    公开(公告)日:2024-02-23

    申请号:CN202311531832.1

    申请日:2023-11-15

    Inventor: 陈俊杰 梁世琦

    Abstract: 本发明公开了一种基于掩码语言模型的基因型补全方法及相关设备,所述方法包括:获取全基因组单倍体缺失序列以及对应的染色体位置序列,并对全基因组单倍体缺失序列进行映射处理,得到模型输入序列;根据模型输入序列和染色体位置序列对掩码语言模型进行训练和优化,得到基因型补全模型;获取目标全基因组单倍体缺失序列,并输入至基因型补全模型,得到目标缺失基因,并根据目标缺失基因对目标全基因组单倍体缺失序列中的缺失点位进行补全,得到补全后完整的基因序列。本发明能够提高全基因组单倍体序列,特别是低频率等位基因中缺失位点的基因补全准确度,同时也能够提升其基因补全效率。

    基于域约束和课程学习反馈的数据生成方法及相关设备

    公开(公告)号:CN117421599A

    公开(公告)日:2024-01-19

    申请号:CN202311477473.6

    申请日:2023-11-06

    Abstract: 本发明公开一种基于域约束和课程学习反馈的数据生成方法及相关设备,所述方法包括步骤:对生成模型进行第一阶段训练得到目标生成模型;对所述目标生成模型进行第二阶段训练得到最终生成模型,第二阶段训练中,每生成设定数量的生成样本,则对生成样本进行域判定,若生成样本与真实样本的域距离大于设定域距离,则丢弃生成样本,若生成样本与真实样本的域距离小于设定域距离,则根据属性评估器对生成样本进行筛选,根据通过筛选的生成样本对真实样本进行反馈;根据最终生成模型生成所需输出样本。本发明通过计算生成样本与真实样本的域差距,丢弃远离真实样本的生成样本,从而在反馈机制的基础上添加域约束,降低属性评估器带来的误差。

Patent Agency Ranking