-
公开(公告)号:CN106934038B
公开(公告)日:2018-01-05
申请号:CN201710153199.5
申请日:2017-03-15
申请人: 江苏华生基因数据科技股份有限公司
摘要: 本发明涉及一种医疗数据查重和关联的处理方法及系统,所述方法包括(1)提取待处理的医疗数据中的核心数据项;(2)将核心数据项分类;(3)分别对排除数组及模糊数组中的各个数据项初步筛查;(4)对核心数据项中的各项数据项进行深度筛查;(5)设定疑似重复数据相似度的阈值M2和/或疑似关联数据的阈值M3;(6)人工核查疑似重复和/或关联数据并给予判断后,将被判断为不重复的数据输入医疗数据库中,并给予判断为存在关联的数据一个或多个相应的关联标签。本发明与现有技术相比具有漏判率低、错判率低、查重效率高的特点,对人工核查的人工专业度要求不高,因此查重和关联的运行成本显著降低。
-
公开(公告)号:CN106934038A
公开(公告)日:2017-07-07
申请号:CN201710153199.5
申请日:2017-03-15
申请人: 江苏华生基因数据科技股份有限公司
CPC分类号: G06F16/2462 , G06F16/24553 , G06F16/2468 , G06F16/287 , G06F16/3349 , G06F16/358 , G06F19/32
摘要: 本发明涉及一种医疗数据查重和关联的处理方法及系统,所述方法包括(1)提取待处理的医疗数据中的核心数据项;(2)将核心数据项分类;(3)分别对排除数组及模糊数组中的各个数据项初步筛查;(4)对核心数据项中的各项数据项进行深度筛查;(5)设定疑似重复数据相似度的阈值M2和/或疑似关联数据的阈值M3;(6)人工核查疑似重复和/或关联数据并给予判断后,将被判断为不重复的数据输入医疗数据库中,并给予判断为存在关联的数据一个或多个相应的关联标签。本发明与现有技术相比具有漏判率低、错判率低、查重效率高的特点,对人工核查的人工专业度要求不高,因此查重和关联的运行成本显著降低。
-