-
公开(公告)号:CN108009157A
公开(公告)日:2018-05-08
申请号:CN201711448094.9
申请日:2017-12-27
Applicant: 北京嘉和美康信息技术有限公司
CPC classification number: G06F17/277 , G06F16/35 , G06K9/6277
Abstract: 本申请实施例公开了一种语句归类方法,方法包括:获取病历文本,并对病历文本中的语句进行分割,得到若干个子句;对若干个子句进行分词,得到每一个子句的分词结果;根据每一个子句的分词结果以及属性词语概率表得到每一个子句属于各个属性的概率;基于每一个子句属于各个属性的概率确定每一个子句的待定属性;若存在至少两个相邻的且待定属性相同的子句,则将至少两个相邻的且待定属性相同的子句归为一类。这样,可以将不同类别的子句分开提取,避免了在结构化提取过程中会出现差错,进而提高了结构化提取的准确性,使得能够对一句话中的多个子句进行准确地结构化提取。