-
公开(公告)号:CN114036908A
公开(公告)日:2022-02-11
申请号:CN202111355005.2
申请日:2021-11-16
Applicant: 安徽大学
IPC: G06F40/169 , G06F40/151 , G06F40/247 , G06N3/08
Abstract: 本发明公开了一种融入词表知识的中文篇章级事件抽取方法及装置,所述方法包括:建立事件模板;采集文本并按事件模板对文本进行标注;读取标注好的文本,对文本进行预处理并根据标注的实体对预处理后的文本打标签;将打标签后的文本转化成对应的向量得到字符级特征;将打标签后的文本中每个字符构造对应的BMES集合,对每个集合中的单词进行加权相加得到词表特征;将词表特征与字符级特征进行拼接融合实现特征提取;抽取文本中事件对应的事件触发词实体和事件元素实体;事件抽取;通过随机梯度下降法训练网络;本发明的优点在于:融合词表信息,提高事件抽取精度。