-
公开(公告)号:CN112613305A
公开(公告)日:2021-04-06
申请号:CN202011571592.4
申请日:2020-12-27
Applicant: 北京工业大学
IPC: G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于循环神经网络的中文事件抽取方法,本发明提出的中文事件抽取联合模型主要有三个阶段:1)词向量编码阶段;2)特征提取阶段;3)分类器训练阶段;本发明的循环神经网络的输入为经过bert模型编码的动态词向量,向量能充分获取单词语义信息,克服了对多义性文本表示的不足的缺点;将由bert模型编码的词向量输入到双向循环神经网络中进行特征提取,为了丰富文本的特征向量,对句子特征进行拼接处理;考虑到触发词和事件元素之间的关联,将经过特征提取的向量输入到CRF模型中进行训练分类;之后将经CRF分类器处理的事件检测和事件元素识别两个阶段的四个子任务结合到一个端到端的模型,达到对事件进行联合抽取的目的。
-
公开(公告)号:CN112613305B
公开(公告)日:2024-04-09
申请号:CN202011571592.4
申请日:2020-12-27
Applicant: 北京工业大学
IPC: G06F40/279 , G06N3/044 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了基于循环神经网络的中文事件抽取方法,本发明提出的中文事件抽取联合模型主要有三个阶段:1)词向量编码阶段;2)特征提取阶段;3)分类器训练阶段;本发明的循环神经网络的输入为经过bert模型编码的动态词向量,向量能充分获取单词语义信息,克服了对多义性文本表示的不足的缺点;将由bert模型编码的词向量输入到双向循环神经网络中进行特征提取,为了丰富文本的特征向量,对句子特征进行拼接处理;考虑到触发词和事件元素之间的关联,将经过特征提取的向量输入到CRF模型中进行训练分类;之后将经CRF分类器处理的事件检测和事件元素识别两个阶段的四个子任务结合到一个端到端的模型,达到对事件进行联合抽取的目的。
-