-
公开(公告)号:CN109754854A
公开(公告)日:2019-05-14
申请号:CN201910032719.6
申请日:2019-01-14
Applicant: 上海市内分泌代谢病研究所 , 上海申康医院发展中心
IPC: G16H10/60 , G06F16/2455 , G06F16/22
Abstract: 本发明公开了一种诊断编码和诊断名称匹配的方法和系统,使诊断编码和诊断名称的数据治理自动化,提高治理的效率,避免人工处理因个人经验造成的不确定性,提高了数据分析利用的价值。其技术方案为:获取医院的诊断记录,包括医院编码、诊断编码以及诊断名称;将医院编码、诊断编码以及诊断名称与预置的五元组匹配表相匹配,其中五元组匹配表按照预设规则生成,包括医院编码、原始诊断编码、原始诊断名称、标准诊断编码、标准诊断名称;若医院编码、诊断编码以及诊断名称分别等于五元组匹配表中的医院编码、原始诊断编码、原始诊断名称,则将诊断编码和诊断名称分别替换为标准诊断编码和标准诊断名称。
-
公开(公告)号:CN109754854B
公开(公告)日:2023-07-18
申请号:CN201910032719.6
申请日:2019-01-14
Applicant: 上海市内分泌代谢病研究所 , 上海申康医院发展中心
IPC: G16H10/60 , G06F16/2455 , G06F16/22
Abstract: 本发明公开了一种诊断编码和诊断名称匹配的方法和系统,使诊断编码和诊断名称的数据治理自动化,提高治理的效率,避免人工处理因个人经验造成的不确定性,提高了数据分析利用的价值。其技术方案为:获取医院的诊断记录,包括医院编码、诊断编码以及诊断名称;将医院编码、诊断编码以及诊断名称与预置的五元组匹配表相匹配,其中五元组匹配表按照预设规则生成,包括医院编码、原始诊断编码、原始诊断名称、标准诊断编码、标准诊断名称;若医院编码、诊断编码以及诊断名称分别等于五元组匹配表中的医院编码、原始诊断编码、原始诊断名称,则将诊断编码和诊断名称分别替换为标准诊断编码和标准诊断名称。
-
公开(公告)号:CN110442861B
公开(公告)日:2023-04-07
申请号:CN201910608625.9
申请日:2019-07-08
Applicant: 万达信息股份有限公司 , 上海市内分泌代谢病研究所
IPC: G06F40/295 , G06F40/242 , G06F40/216
Abstract: 本发明涉及一种基于真实世界统计的中文专业术语与新词发现的方法。本发明使用了点间互信息(PMI)以及邻接熵(BE)来判断来寻找“种子”(具有高聚合性的词),采用这两个方法的原因主要是他们都属于无监督学习并且有着互补的作用。在找到“种子”之后,我们用基于16亿字的真实世界语料中所提炼出的统计信息来筛选出新词。
-
公开(公告)号:CN110442861A
公开(公告)日:2019-11-12
申请号:CN201910608625.9
申请日:2019-07-08
Applicant: 万达信息股份有限公司 , 上海市内分泌代谢病研究所
IPC: G06F17/27
Abstract: 本发明涉及一种基于真实世界统计的中文专业术语与新词发现的方法。本发明使用了点间互信息(PMI)以及邻接熵(BE)来判断来寻找“种子”(具有高聚合性的词),采用这两个方法的原因主要是他们都属于无监督学习并且有着互补的作用。在找到“种子”之后,我们用基于16亿字的真实世界语料中所提炼出的统计信息来筛选出新词。
-
公开(公告)号:CN118866288A
公开(公告)日:2024-10-29
申请号:CN202410767855.0
申请日:2024-06-14
Applicant: 上海申康医院发展中心
IPC: G16H40/40
Abstract: 本发明公开了一种医疗大数据训练设施便捷集成框架,包括基础训练平台和实际业务模块,基础训练平台与实际业务模块使用相同的文件目录规范,通过统一文件形式进行信息交互,其中:基础训练平台用于进行基础操作功能,通过规定运行各个功能所需要的输入输出文件形式和结构,将原始的数据、模型的配置、标注的结果信息以指定文件形式和结构存放于对应位置,并通过给定命令触发实际业务模块进行下一步处理;实际业务模块用于运行实际业务。采用本发明通过文件目录规范定义,以及在指定开发环境下的调试、发布一体式构建,降低已有功能的维护成本、提高了整体应用平台的可用性,极大方便了新功能、新模型的添加。
-
公开(公告)号:CN118538341A
公开(公告)日:2024-08-23
申请号:CN202410568545.6
申请日:2024-05-09
Applicant: 上海申康医院发展中心
Abstract: 本发明公开了一种用于人群队列研究数据的数据质控方法,包括以下步骤,步骤S1,队列数据获取,步骤S2,基础数据质控,对队列数据进行必要的数据质控,排查完整性和唯一性问题;步骤S3,基础数据质控结果返回;步骤S4,变量类型识别,构建一种基于BERT的队列变量类型识别模型,用于自动识别队列变量类型;步骤S5,高级数据质控,进一步对队列数据进行数据质控,排查出准确性和逻辑性问题;步骤S6,高级数据质控结果返回。采用本方法,对采集的队列数据进行自动化智能核查,排查并发现队列数据存在完整性、唯一性、准确性以及逻辑性问题,从而促进队列数据质量的提升。
-
公开(公告)号:CN110085307A
公开(公告)日:2019-08-02
申请号:CN201910271117.6
申请日:2019-04-04
Applicant: 华东理工大学 , 上海申康医院发展中心
Abstract: 本发明属于计算机应用领域,公开了一种基于知识图谱的智能导诊方法,该方法解决患者的精确导诊的问题。该方法包括:构建症状-疾病-科室知识图谱;采集用户症状描述信息、性别和年龄段信息;通过实体识别及症状标准化过程识别用户症状描述信息中的症状集、患者预判疾病集;将用户的症状集通过改进的TF-IDF算法计算得到用户可能患有的疾病集和每种疾病的权重;利用用户可能患有的疾病集、每种疾病的权重和症状-疾病-科室知识图谱,通过融合疾病权重及疾病-科室关联度的计算得到推荐的科室的权重;根据科室权重的排名,确定推荐的科室。
-
公开(公告)号:CN110059186A
公开(公告)日:2019-07-26
申请号:CN201910271131.6
申请日:2019-04-04
Applicant: 上海申康医院发展中心 , 华东理工大学
Abstract: 本发明公开了一种医学术语校对任务分配的方法,其包括以下步骤:将原始的医学术语聚类,得到疑似同义术语簇,每个同义术语簇为一个校对任务;在校对人员集合中计算每个校对人员的推荐指数;计算校对人员擅长的领域;根据推荐指数和承担任务的范围,分配校对任务;构建医学术语校对任务的训练集和测试集,将训练集送入BP神经网络模型中进行训练,用测试集去测试模型性能,最终实现权重的更新。实验表明,本方法有效解决了医学术语专业性强,任务分配困难的问题。
-
公开(公告)号:CN119066218A
公开(公告)日:2024-12-03
申请号:CN202411062250.8
申请日:2024-08-05
Applicant: 上海申康医院发展中心
IPC: G06F16/535 , G06F16/583 , G06N5/04 , G06N20/00
Abstract: 本发明公开了基于医疗影像和报告文本的融合检索方法和系统,包括以下步骤:步骤S1,基于CLIP模型,根据图像和文本对进行训练,对图像和文本特征进行压缩和存储,建立图文特征以及与之匹配的图像数据库;步骤S2,根据文本或者图像进行网络推理和搜索。采用本方法,通过对这些图像和报告进行大规模监督训练,对图像和文本特征进行压缩和存储,可以快速检索相似病例,辅助医生阅片和制定治疗方案。
-
公开(公告)号:CN110085307B
公开(公告)日:2023-02-03
申请号:CN201910271117.6
申请日:2019-04-04
Applicant: 华东理工大学 , 上海申康医院发展中心
IPC: G16H40/20 , G06F16/36 , G06F16/33 , G06F40/295
Abstract: 本发明属于计算机应用领域,公开了一种基于知识图谱的智能导诊方法,该方法解决患者的精确导诊的问题。该方法包括:构建症状‑疾病‑科室知识图谱;采集用户症状描述信息、性别和年龄段信息;通过实体识别及症状标准化过程识别用户症状描述信息中的症状集、患者预判疾病集;将用户的症状集通过改进的TF‑IDF算法计算得到用户可能患有的疾病集和每种疾病的权重;利用用户可能患有的疾病集、每种疾病的权重和症状‑疾病‑科室知识图谱,通过融合疾病权重及疾病‑科室关联度的计算得到推荐的科室的权重;根据科室权重的排名,确定推荐的科室。
-
-
-
-
-
-
-
-
-