一种基于规则的医患纠纷案件关键词提取方法

    公开(公告)号:CN108345584A

    公开(公告)日:2018-07-31

    申请号:CN201810007166.4

    申请日:2018-01-04

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于规则的医患纠纷案件关键词提取方法,包括:(1)按照关键词类别建立医患纠纷关键词提取规则的生成模板;(2)按照标志词包含量将医患纠纷案件文书模块化;(3)对医患纠纷案件文书的各模块定义关键词集合,并从各模块中提取对应关键词集合中的关键词;(4)按照步骤(1)定义的生成模板,将步骤(3)提取的每个关键词编写为伪表达式,并自动化映射成机器可识别表达式;(5)判别提取的关键词是否正确,若正确则将关键词对应的机器可识别表达式以及所属文书和段落属性进行存储,若不正确则存入规则待完善集合中;(6)根据规则待完善集合调整完善提取规则。本发明提高了关键词提取的准确率和召回率。

Patent Agency Ranking