-
公开(公告)号:CN113255371A
公开(公告)日:2021-08-13
申请号:CN202110796271.2
申请日:2021-07-14
Applicant: 华东交通大学
Abstract: 本发明提出一种半监督的中英文隐式篇章关系识别方法与系统,该方法包括如下步骤:步骤一、数据集准备;步骤二、模型构建:在基于注意力机制的隐式篇章关系识别模型的基础上,分别构建得到中文隐式篇章关系识别模型以及英文隐式篇章关系识别模型;步骤三、无监督的模型训练;步骤四、有监督的模型训练;步骤五、预测结果输出。本发明提出的半监督的中英文隐式篇章关系识别方法,基于两种语言中大量未标注的篇章关系数据集和少量人工标注的篇章关系数据集联合训练中文和英文隐式篇章关系识别模型,可充分有效地利用两种语言中未标注的和标注的数据集,以同时提高中英文隐式篇章关系识别的性能。
-
公开(公告)号:CN116701576B
公开(公告)日:2023-10-10
申请号:CN202310975299.1
申请日:2023-08-04
Applicant: 华东交通大学
IPC: G06F16/33 , G06F40/126 , G06F40/30 , G06N3/0442 , G06N3/0499 , G06N3/08
Abstract: 本发明提供了一种无触发词的事件检测方法和系统,方法包括:对样本语句进行信息编码得到第一语义向量表示,得到词的第二语义向量表示;根据上一时刻的解码状态和各词的第二语义向量表示计算权重向量并归一化得到归一化权重向量,并确定当前时刻的解码上下文信息;根据上一时刻的解码状态和预测的事件类别的概率分布、当前时刻的解码上下文信息确定当前时刻预测的事件类别的概率分布;根据各解码时刻对应的归一化权重向量和预测的事件类别的概率分布确定模型总损失并进行训练;将待检测语句输入事件检测模型进行检测得到事件检测结果。本发明能利用待检测语句中多个事件类别之间的相关性信息提高检测的准确率。
-
公开(公告)号:CN116701576A
公开(公告)日:2023-09-05
申请号:CN202310975299.1
申请日:2023-08-04
Applicant: 华东交通大学
IPC: G06F16/33 , G06F40/126 , G06F40/30 , G06N3/0442 , G06N3/0499 , G06N3/08
Abstract: 本发明提供了一种无触发词的事件检测方法和系统,方法包括:对样本语句进行信息编码得到第一语义向量表示,得到词的第二语义向量表示;根据上一时刻的解码状态和各词的第二语义向量表示计算权重向量并归一化得到归一化权重向量,并确定当前时刻的解码上下文信息;根据上一时刻的解码状态和预测的事件类别的概率分布、当前时刻的解码上下文信息确定当前时刻预测的事件类别的概率分布;根据各解码时刻对应的归一化权重向量和预测的事件类别的概率分布确定模型总损失并进行训练;将待检测语句输入事件检测模型进行检测得到事件检测结果。本发明能利用待检测语句中多个事件类别之间的相关性信息提高检测的准确率。
-
公开(公告)号:CN113255371B
公开(公告)日:2021-09-24
申请号:CN202110796271.2
申请日:2021-07-14
Applicant: 华东交通大学
Abstract: 本发明提出一种半监督的中英文隐式篇章关系识别方法与系统,该方法包括如下步骤:步骤一、数据集准备;步骤二、模型构建:在基于注意力机制的隐式篇章关系识别模型的基础上,分别构建得到中文隐式篇章关系识别模型以及英文隐式篇章关系识别模型;步骤三、无监督的模型训练;步骤四、有监督的模型训练;步骤五、预测结果输出。本发明提出的半监督的中英文隐式篇章关系识别方法,基于两种语言中大量未标注的篇章关系数据集和少量人工标注的篇章关系数据集联合训练中文和英文隐式篇章关系识别模型,可充分有效地利用两种语言中未标注的和标注的数据集,以同时提高中英文隐式篇章关系识别的性能。
-
-
-