一种基于预训练卷积神经网络的关系抽取方法及系统

    公开(公告)号:CN112084790B

    公开(公告)日:2022-07-05

    申请号:CN202011014318.7

    申请日:2020-09-24

    发明人: 曹卫东 徐秀丽

    IPC分类号: G06F40/30 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于预训练卷积神经网络的关系抽取方法及系统,属于数据处理技术领域,其特征在于,一方面利用预训练模型提取目标实体的语义信息,另一方面使用卷积神经网络提取句子级的语义信息;具体为:先对数据集进行处理,在文本句子的开头、结尾以及实体前后加入特殊标签,识别出一个句子和两个目标实体,然后将处理好的数据输入预训练模型、卷积神经网络模型,提取目标实体和句子的语义,将获取的句子语义、实体语义、标签语义连接,通过softmax分类器获取目标实体之间的关系。本发明通过预训练和神经网络可以分别提取实体级和句子级的语义信息,在没有使用任何自然语言处理工具的情况下,提高了关系抽取的准确率。

    一种基于预训练卷积神经网络的关系抽取方法及系统

    公开(公告)号:CN112084790A

    公开(公告)日:2020-12-15

    申请号:CN202011014318.7

    申请日:2020-09-24

    发明人: 曹卫东 徐秀丽

    IPC分类号: G06F40/30 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于预训练卷积神经网络的关系抽取方法及系统,属于数据处理技术领域,其特征在于,一方面利用预训练模型提取目标实体的语义信息,另一方面使用卷积神经网络提取句子级的语义信息;具体为:先对数据集进行处理,在文本句子的开头、结尾以及实体前后加入特殊标签,识别出一个句子和两个目标实体,然后将处理好的数据输入预训练模型、卷积神经网络模型,提取目标实体和句子的语义,将获取的句子语义、实体语义、标签语义连接,通过softmax分类器获取目标实体之间的关系。本发明通过预训练和神经网络可以分别提取实体级和句子级的语义信息,在没有使用任何自然语言处理工具的情况下,提高了关系抽取的准确率。

    基于民航不文明旅客的实体识别方法及系统

    公开(公告)号:CN112084783A

    公开(公告)日:2020-12-15

    申请号:CN202011016160.7

    申请日:2020-09-24

    发明人: 曹卫东 徐秀丽

    IPC分类号: G06F40/295 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于民航不文明旅客的实体识别方法及系统,属于民航信息处理技术领域,其特征在于,包括:一、对采集的实体数据进行数据预处理;二、将字嵌入、位置嵌入和标签嵌入串联,丰富输入信息;三、输入Bi‑LSTM神经网络,前向的LSTM与后向的LSTM结合形成了Bi‑LSTM,Bi‑LSTM网络能够使用过去和将来的输入信息并自动提取上下文特征,输出每一个标签的预测分值;四、将神经网络的输出输入CRF层,Bi‑LSTM使用Softmax层进行标记;五、使用抽样的数据集进行命名实体识别实验,并通过准确率、召回率和F1值来评估实验的效率。该申请能够更高效识别民航不文明旅客中的八种实体类型。

    基于民航不文明旅客的实体识别方法及系统

    公开(公告)号:CN112084783B

    公开(公告)日:2022-04-12

    申请号:CN202011016160.7

    申请日:2020-09-24

    发明人: 曹卫东 徐秀丽

    IPC分类号: G06F40/295 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于民航不文明旅客的实体识别方法及系统,属于民航信息处理技术领域,其特征在于,包括:一、对采集的实体数据进行数据预处理;二、将字嵌入、位置嵌入和标签嵌入串联,丰富输入信息;三、输入Bi‑LSTM神经网络,前向的LSTM与后向的LSTM结合形成了Bi‑LSTM,Bi‑LSTM网络能够使用过去和将来的输入信息并自动提取上下文特征,输出每一个标签的预测分值;四、将神经网络的输出输入CRF层,Bi‑LSTM使用Softmax层进行标记;五、使用抽样的数据集进行命名实体识别实验,并通过准确率、召回率和F1值来评估实验的效率。该申请能够更高效识别民航不文明旅客中的八种实体类型。