-
公开(公告)号:CN117894482A
公开(公告)日:2024-04-16
申请号:CN202410289076.4
申请日:2024-03-14
申请人: 北方健康医疗大数据科技有限公司
IPC分类号: G16H70/00 , G16H10/60 , G06F40/126 , G06F16/35
摘要: 本发明实施例提供一种医学肿瘤的编码方法、系统、电子设备及存储介质,属于医学术语标准化领域。该方法包括:采用预先训练好的肿瘤ICD10小样本对比模型、肿瘤形态学小样本对比模型对肿瘤ICD10术语、肿瘤形态学进行编码,获得肿瘤ICD10标准术语、肿瘤形态学标准化术语集合向量化表示;分别将肿瘤ICD10和肿瘤形态学向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中;输入待标准化的医学术语至肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并从肿瘤ICD10、肿瘤形态学向量化搜索引擎中搜索,获取相似的标准化术语。通过小样本对比学习结合肿瘤分类模型,同时获得肿瘤形态学编码以及肿瘤ICD10编码,提高了肿瘤编码效率和准确性。
-
公开(公告)号:CN116721778B
公开(公告)日:2024-01-09
申请号:CN202311000882.7
申请日:2023-08-10
申请人: 北方健康医疗大数据科技有限公司
IPC分类号: G16H50/70 , G06F16/953 , G06F40/194 , G06F40/247 , G06N20/00
摘要: 本申请公开了一种医学术语标准化方法、系统、设备及介质,主要涉及医学术语标准化技术领域,用以解决现有医学术语在训练过程中需要提供大量标注数据,存在标注误差,影响医学术语的准确性的问题。包括:获取医学术语标注数据,使用医学术语标注数据训练预设小样本对比学习算法;通过训练好的预设小样本对比学习算法,将医学术语数据库中的医学术语进行编码,以获得对应的第一向量化表示;将第一向量化表示放入向量化搜索引擎中,以更新向量化搜索引擎;通过训练好的预设小样本对比学习算法,获取输入的待标准化医学术语对应的第二向量化表示;通过更新后的向量化搜索引擎,获取第二向量化表示在医学术语数据库中对应的标准医学术语。
-
公开(公告)号:CN117877737B
公开(公告)日:2024-07-05
申请号:CN202410276293.X
申请日:2024-03-12
申请人: 北方健康医疗大数据科技有限公司
IPC分类号: G16H50/30 , G16H50/70 , G06F18/213 , G06F18/214 , G06F18/243 , G06N20/20
摘要: 本发明提出的一种原发性肺癌风险预测模型的构建方法、系统及装置,属于医疗数据分析技术领域。所述方法包括:抽取肺癌数据,建立队列研究数据中台系统;根据抽取的数据归纳肺癌危险因素,建立数据标准模型;使用加密算法对肺癌数据进行数据脱敏;对肺癌数据进行结构化数据映射,并利用数据过滤规则建立肺癌中间数据库;对肺癌中间数据库进行数据预处理、利用机器学习变量生成模型进行变量提取,并进行数据标准化处理,生成肺癌队列研究数据库;对肺癌队列研究数据库进行特性筛选、危险因素预测和交叉验证,以完成预测模型的数据分析;封装预测模型,并进行预测模型发布。本发明能够有效提高原发性肺癌风险预测模型的生产效率和预测精度。
-
公开(公告)号:CN117877737A
公开(公告)日:2024-04-12
申请号:CN202410276293.X
申请日:2024-03-12
申请人: 北方健康医疗大数据科技有限公司
IPC分类号: G16H50/30 , G16H50/70 , G06F18/213 , G06F18/214 , G06F18/243 , G06N20/20
摘要: 本发明提出的一种原发性肺癌风险预测模型的构建方法、系统及装置,属于医疗数据分析技术领域。所述方法包括:抽取肺癌数据,建立队列研究数据中台系统;根据抽取的数据归纳肺癌危险因素,建立数据标准模型;使用加密算法对肺癌数据进行数据脱敏;对肺癌数据进行结构化数据映射,并利用数据过滤规则建立肺癌中间数据库;对肺癌中间数据库进行数据预处理、利用机器学习变量生成模型进行变量提取,并进行数据标准化处理,生成肺癌队列研究数据库;对肺癌队列研究数据库进行特性筛选、危险因素预测和交叉验证,以完成预测模型的数据分析;封装预测模型,并进行预测模型发布。本发明能够有效提高原发性肺癌风险预测模型的生产效率和预测精度。
-
公开(公告)号:CN116721778A
公开(公告)日:2023-09-08
申请号:CN202311000882.7
申请日:2023-08-10
申请人: 北方健康医疗大数据科技有限公司
IPC分类号: G16H50/70 , G06F16/953 , G06F40/194 , G06F40/247 , G06N20/00
摘要: 本申请公开了一种医学术语标准化方法、系统、设备及介质,主要涉及医学术语标准化技术领域,用以解决现有医学术语在训练过程中需要提供大量标注数据,存在标注误差,影响医学术语的准确性的问题。包括:获取医学术语标注数据,使用医学术语标注数据训练预设小样本对比学习算法;通过训练好的预设小样本对比学习算法,将医学术语数据库中的医学术语进行编码,以获得对应的第一向量化表示;将第一向量化表示放入向量化搜索引擎中,以更新向量化搜索引擎;通过训练好的预设小样本对比学习算法,获取输入的待标准化医学术语对应的第二向量化表示;通过更新后的向量化搜索引擎,获取第二向量化表示在医学术语数据库中对应的标准医学术语。
-
-
-
-