基于层次聚类的多模态对比学习样本构建方法及系统

    公开(公告)号:CN117093884B

    公开(公告)日:2023-12-29

    申请号:CN202311257184.5

    申请日:2023-09-27

    Applicant: 北京大学

    Abstract: 本申请提供一种基于层次聚类的多模态对比学习样本构建方法及系统,从层次聚类图的各个聚类中确定锚定样本所处的目标聚类;根据目标聚类的目标聚类质心和锚定样本的监督信息,以所述目标聚类在层次聚类图中的位置为基准遍历所述层次聚类图,从层次聚类图中确定锚定样本对应至少一个正聚类和至少一个分歧聚类;根据层次聚类图中的各个聚类、各个正聚类和各个分歧聚类,确定锚定样本对应的至少一个负聚类;根据锚定样本、目标聚类、各个正聚类中的正样本和各个负聚类中的负样本,生成多个对比样本对,以便利用对比样本对对模型进行训练,实现正确划分正负样本,提高模型的性能指标为目的。

    多源异构医疗化验检查数据处理方法、装置、设备和介质

    公开(公告)号:CN113488182A

    公开(公告)日:2021-10-08

    申请号:CN202110571974.5

    申请日:2021-05-25

    Applicant: 北京大学

    Abstract: 本申请涉及数据处理技术领域,具体来说,本申请涉及多源异构医疗化验检查数据处理方法、装置、设备及介质。所述方法包括:获取预设疾病化验检查指标的多源自定义数据集;对所述多源自定义数据集进行预处理,形成规范化原始数据;将所述规范化原始数据分为预设字段,所述预设字段至少包括指标名称、计量单位、参考范围和检验结果;建立所述规范化原始数据字段与标准化字段的多对一映射;对映射后结果根据计量单位的标准化系数建立不同计量单位间的可计算模块,联动计算检验结果,生成通用数据模型。本申请所述方法可减少在数据处理时对人工操作的依赖,提升对常见慢性非传染性疾病多源异构化验检查数据处理的效率。

    基于层次聚类的多模态对比学习样本构建方法及系统

    公开(公告)号:CN117093884A

    公开(公告)日:2023-11-21

    申请号:CN202311257184.5

    申请日:2023-09-27

    Applicant: 北京大学

    Abstract: 本申请提供一种基于层次聚类的多模态对比学习样本构建方法及系统,从层次聚类图的各个聚类中确定锚定样本所处的目标聚类;根据目标聚类的目标聚类质心和锚定样本的监督信息,以所述目标聚类在层次聚类图中的位置为基准遍历所述层次聚类图,从层次聚类图中确定锚定样本对应至少一个正聚类和至少一个分歧聚类;根据层次聚类图中的各个聚类、各个正聚类和各个分歧聚类,确定锚定样本对应的至少一个负聚类;根据锚定样本、目标聚类、各个正聚类中的正样本和各个负聚类中的负样本,生成多个对比样本对,以便利用对比样本对对模型进行训练,实现正确划分正负样本,提高模型的性能指标为目的。

Patent Agency Ranking