-
公开(公告)号:CN119229980A
公开(公告)日:2024-12-31
申请号:CN202411721002.X
申请日:2024-11-28
Applicant: 北京大学第三医院(北京大学第三临床医学院)
IPC: G16B40/00 , G16B20/40 , G16B50/00 , G16B20/30 , G06F18/213 , G06F18/2415
Abstract: 本发明提供了一种基于机器学习的母源污染去除方法及相关设备,应用于数据处理技术领域。本申请获取目标用户数据和训练样本集,其中,目标用户数据包括目标用户的体外培养胚胎的培养液样本信息,训练样本集包括其他用户的体外培养胚胎的培养液样本信息;对训练样本集进行预处理,生成带有目标特征数据的训练数据集,其中,目标特征数据为单细胞全基因组的甲基化测序数据,甲基化测序数据包括读段信息;获取与目标特征数据相匹配的初始母源污染预警模型;基于带有目标特征数据的训练数据集对初始母源污染预警模型进行训练,生成目标母源污染预警模型;基于目标母源污染预警模型对目标用户数据进行处理,生成目标染色体倍体。
-
公开(公告)号:CN119229980B
公开(公告)日:2025-02-18
申请号:CN202411721002.X
申请日:2024-11-28
Applicant: 北京大学第三医院(北京大学第三临床医学院)
IPC: G16B40/00 , G16B20/40 , G16B50/00 , G16B20/30 , G06F18/213 , G06F18/2415
Abstract: 本发明提供了一种基于机器学习的母源污染去除方法及相关设备,应用于数据处理技术领域。本申请获取目标用户数据和训练样本集,其中,目标用户数据包括目标用户的体外培养胚胎的培养液样本信息,训练样本集包括其他用户的体外培养胚胎的培养液样本信息;对训练样本集进行预处理,生成带有目标特征数据的训练数据集,其中,目标特征数据为单细胞全基因组的甲基化测序数据,甲基化测序数据包括读段信息;获取与目标特征数据相匹配的初始母源污染预警模型;基于带有目标特征数据的训练数据集对初始母源污染预警模型进行训练,生成目标母源污染预警模型;基于目标母源污染预警模型对目标用户数据进行处理,生成目标染色体倍体。
-