-
公开(公告)号:CN118035439A
公开(公告)日:2024-05-14
申请号:CN202410080696.7
申请日:2024-01-19
Applicant: 浙江工业大学
IPC: G06F16/35 , G06F40/295 , G06F16/33 , G06F16/36 , G06N5/022 , G06N3/0455 , G16H40/20
Abstract: 一种中文医学药品说明书实体关系联合抽取方法,针对中文医疗文本,以关系抽取为主任务以减少关系冗余,通过用共享参数的联合抽取方式以实现浅层的信息交互,重构基于关系的实体抽取任务,将其扩展为更加细粒度的子任务:基于关系的主语识别、基于关系的宾语识别和基于关系的主宾对齐,同时将多任务交互的特征分区与过滤作为细粒度子任务的编码器以实现深层的信息交互;对于主宾对齐中数据不平衡引起的矩阵稀疏的问题,引入Dice损失来解决。以及提供一种中文医学药品说明书实体关系联合抽取系统。本发明更加细粒度的子任务设计与MPF特征提取编码器使得中文医疗文本中实体识别和关系抽取的性能得到稳定的提升。