-
公开(公告)号:CN116910195A
公开(公告)日:2023-10-20
申请号:CN202310462381.4
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/30 , G16H80/00
Abstract: 本发明涉及一种层次化细粒度医疗对话标注方法和系统。该方法选取待标注的文本片段,对待标注的文本片段的话语意图进行标注,并采用层级化语义内容标注体系对待标注的文本片段的语义内容进行标注。所述层级化语义内容标注体系包含三个层级:第一层级是对于话语所处的对话阶段的标注;第二层级是关于话语内容对应的信息类别的标注;第三层级是对具体内容的标注。本发明从句法‑语义、对话级‑句子级多角度构建了逻辑清晰的层次化标注体系,同时设置了更加细粒度的槽位信息,针对医疗对话数据的否定语义和条件语义的特点提出了状态和条件的标注标签,形成了综合、全面的标注规范,能够实现更加完善、更加细粒度的语义内容标注。