-
公开(公告)号:CN114117026A
公开(公告)日:2022-03-01
申请号:CN202111263910.5
申请日:2021-10-27
Applicant: 吉林大学
IPC: G06F16/335 , G06F16/35 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种嵌套命名实体识别方法及装置、介质及终端,涉及命名实体识别技术领域。其中该方法包括:对目标文本中的元素分别进行不同维度的特征表示,以得到所述目标文本中的候选区域;根据所述目标文本中的元素的特征表示,基于卷积神经网络聚合第i嵌套层的相邻区域,以生成第i+1嵌套层的候选区域,其中,i为正整数;将所述第i+1嵌套层的候选区域分别进行注意力特征表示;结合双向长短期记忆网络,整合当前上下文之间的特征信息,分别得到第i嵌套层所包含的候选区域的最终特征表示;利用线性变换,分别对每一嵌套层的所述最终特征表示进行序列标注。通过本方案,可以充分挖掘目标文本中隐含的实体信息,并且对命名实体进行分类。
-
公开(公告)号:CN110750992A
公开(公告)日:2020-02-04
申请号:CN201910952910.2
申请日:2019-10-09
Applicant: 吉林大学
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种命名实体识别方法、装置、电子设备及介质。其中,本申请中,在获取待识别数据之后,可以基于预训练的词嵌入向量矩阵,将所述待识别数据转换为词嵌入向量;利用多个神经网络模型和注意力机制,对所述词嵌入向量进行多层级特征提取,得到不同级别的待识别特征数据;对所述待识别特征数据进行序列标注,得到实体识别结果。通过应用本申请的技术方案,可以相对于现有技术来说,融合广度学习和注意力机制进行命名实体识别,进而可以达到提高识别准确率的效果。
-
公开(公告)号:CN110750992B
公开(公告)日:2023-07-04
申请号:CN201910952910.2
申请日:2019-10-09
Applicant: 吉林大学
IPC: G06F40/295 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/08
Abstract: 本申请公开了一种命名实体识别方法、装置、电子设备及介质。其中,本申请中,在获取待识别数据之后,可以基于预训练的词嵌入向量矩阵,将所述待识别数据转换为词嵌入向量;利用多个神经网络模型和注意力机制,对所述词嵌入向量进行多层级特征提取,得到不同级别的待识别特征数据;对所述待识别特征数据进行序列标注,得到实体识别结果。通过应用本申请的技术方案,可以相对于现有技术来说,融合广度学习和注意力机制进行命名实体识别,进而可以达到提高识别准确率的效果。
-
公开(公告)号:CN111914097A
公开(公告)日:2020-11-10
申请号:CN202010667644.1
申请日:2020-07-13
Applicant: 吉林大学
IPC: G06F16/36 , G06F40/284 , G06N3/04
Abstract: 本申请实施例公开了一种基于注意力机制和多层级特征融合的实体抽取方法与装置,属于计算机技术领域。方法包括:服务器获取待抽取实体的文本数据,并将其转换成字符序列和词序列后,输入到嵌入表示层得到字符嵌入向量组和词嵌入向量组,基于注意力机制和特征提取层对字符嵌入向量组和词嵌入向量组进行特征提取得到全局字符特征和全局词特征,以及对字符嵌入向量组和词嵌入向量组进行特征提取得到局部字符特征和局部词特征,将得到的各个特征输入至特征融合层进行特征融合处理得到多层级融合特征,基于序列标注层对多层级融合特征进行标签标注处理得到类别标注序列,并抽取命名实体,可实现对文本数据资源进行充分挖掘,提升实体抽取的性能。
-
公开(公告)号:CN114117026B
公开(公告)日:2024-08-02
申请号:CN202111263910.5
申请日:2021-10-27
Applicant: 吉林大学
IPC: G06F16/335 , G06F16/35 , G06F40/295 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种嵌套命名实体识别方法及装置、介质及终端,涉及命名实体识别技术领域。其中该方法包括:对目标文本中的元素分别进行不同维度的特征表示,以得到所述目标文本中的候选区域;根据所述目标文本中的元素的特征表示,基于卷积神经网络聚合第i嵌套层的相邻区域,以生成第i+1嵌套层的候选区域,其中,i为正整数;将所述第i+1嵌套层的候选区域分别进行注意力特征表示;结合双向长短期记忆网络,整合当前上下文之间的特征信息,分别得到第i嵌套层所包含的候选区域的最终特征表示;利用线性变换,分别对每一嵌套层的所述最终特征表示进行序列标注。通过本方案,可以充分挖掘目标文本中隐含的实体信息,并且对命名实体进行分类。
-
公开(公告)号:CN115269786B
公开(公告)日:2023-01-06
申请号:CN202211186100.9
申请日:2022-09-28
Applicant: 吉林大学
Abstract: 本申请公开了一种可解释的虚假文本检测方法、装置、存储介质以及终端,使用虚假文本检测模型,生成目标文本的目标文本嵌入表示,以及生成未处理原始文本的参考文本嵌入表示;确定目标文本的目标证据语句,以及目标证据语句的证据文本嵌入表示;基于目标文本嵌入表示、参考文本嵌入表示、以及证据文本嵌入表示确定目标文本的真实性检测结果,并基于目标证据语句解释真实性检测结果。由于本申请基于原始的参考文本对目标文本进行真实性检测,减少检测时对人工事实核查报告的依赖,且从参考文本中确定出目标文本的真实性检测结果及其判断的证据文本。使得文本检测过程中减少对目标文本的检测时延,并且真实性检测结果具有可解释性。
-
公开(公告)号:CN115269786A
公开(公告)日:2022-11-01
申请号:CN202211186100.9
申请日:2022-09-28
Applicant: 吉林大学
Abstract: 本申请公开了一种可解释的虚假文本检测方法、装置、存储介质以及终端,使用虚假文本检测模型,生成目标文本的目标文本嵌入表示,以及生成未处理原始文本的参考文本嵌入表示;确定目标文本的目标证据语句,以及目标证据语句的证据文本嵌入表示;基于目标文本嵌入表示、参考文本嵌入表示、以及证据文本嵌入表示确定目标文本的真实性检测结果,并基于目标证据语句解释真实性检测结果。由于本申请基于原始的参考文本对目标文本进行真实性检测,减少检测时对人工事实核查报告的依赖,且从参考文本中确定出目标文本的真实性检测结果及其判断的证据文本。使得文本检测过程中减少对目标文本的检测时延,并且真实性检测结果具有可解释性。
-
公开(公告)号:CN118132690A
公开(公告)日:2024-06-04
申请号:CN202311677773.9
申请日:2023-12-07
Applicant: 吉林大学
IPC: G06F16/332 , G06F16/35 , G06F16/33 , G06F40/30 , G06F40/284 , G06F18/2415 , G06F18/2431 , G06N3/0499 , G06N3/047
Abstract: 本申请实施例公开了一种虚假新闻检测方法、装置、存储介质以及电子设备,所述方法包括:获取目标新闻和目标新闻对应的至少一个报道句子,通过对目标新闻和报道句子进行概率计算,以得到报道句子对应的第一得分和第二得分,之后根据第一得分筛选得到第一证据集合,根据第二得分筛选得到第二证据集合,再根据目标新闻、第一证据集合、第二证据集合采用新闻解释生成模型,生成真实新闻解释文本和虚假新闻解释文本,最后再对目标新闻、真实新闻解释文本、虚假新闻解释文本进行真伪检测处理,以得到目标新闻最终的目标真假检测结果和目标真假解释文本。因此,达到了有效检测新闻真假性和提供新闻真假解释文本的效果。
-
-
-
-
-
-
-