一种融入词表知识的中文篇章级事件抽取方法及装置

    公开(公告)号:CN114036908A

    公开(公告)日:2022-02-11

    申请号:CN202111355005.2

    申请日:2021-11-16

    Applicant: 安徽大学

    Inventor: 李成龙 谢洋洋

    Abstract: 本发明公开了一种融入词表知识的中文篇章级事件抽取方法及装置,所述方法包括:建立事件模板;采集文本并按事件模板对文本进行标注;读取标注好的文本,对文本进行预处理并根据标注的实体对预处理后的文本打标签;将打标签后的文本转化成对应的向量得到字符级特征;将打标签后的文本中每个字符构造对应的BMES集合,对每个集合中的单词进行加权相加得到词表特征;将词表特征与字符级特征进行拼接融合实现特征提取;抽取文本中事件对应的事件触发词实体和事件元素实体;事件抽取;通过随机梯度下降法训练网络;本发明的优点在于:融合词表信息,提高事件抽取精度。

Patent Agency Ranking