-
公开(公告)号:CN118378628A
公开(公告)日:2024-07-23
申请号:CN202410295561.2
申请日:2024-03-15
申请人: 江苏路特数字科技有限公司
IPC分类号: G06F40/30 , G06F40/126 , G06F18/25 , G06F18/2431 , G06N3/0442
摘要: 本发明提供融合词性与因果指示词特征的事件因果关系识别方法,属于深度学习及自然语言处理相关领域技术。包括:将因果关系识别任务转化为短文本级别的二分类任务并利用预训练的XLNet模型生成初步的词嵌入向量,在词嵌入向量中加入词性特征;人工构建因果指示词库,利用“0‑1”编码将单词是否为因果指示词转化为二元特征,并将该二元特征加入到融合了词性特征的词嵌入向量中;将融合了词性与因果指示词特征的嵌入向量纳入到双向门控循环神经网络中;然后通过多头注意力机制,增强因果指示词在整个文本中的权重系数,使模型更关注与因果关系相关的语义信息;最终将输出的嵌入向量输入到Softmax分类器中做一个二分类任务,从而实现因果关系的识别。