一种医疗数据查重和关联的方法及系统

    公开(公告)号:CN106934038B

    公开(公告)日:2018-01-05

    申请号:CN201710153199.5

    申请日:2017-03-15

    IPC分类号: G06F17/30 G06F19/00

    摘要: 本发明涉及一种医疗数据查重和关联的处理方法及系统,所述方法包括(1)提取待处理的医疗数据中的核心数据项;(2)将核心数据项分类;(3)分别对排除数组及模糊数组中的各个数据项初步筛查;(4)对核心数据项中的各项数据项进行深度筛查;(5)设定疑似重复数据相似度的阈值M2和/或疑似关联数据的阈值M3;(6)人工核查疑似重复和/或关联数据并给予判断后,将被判断为不重复的数据输入医疗数据库中,并给予判断为存在关联的数据一个或多个相应的关联标签。本发明与现有技术相比具有漏判率低、错判率低、查重效率高的特点,对人工核查的人工专业度要求不高,因此查重和关联的运行成本显著降低。