-
公开(公告)号:CN114911937B
公开(公告)日:2025-02-14
申请号:CN202210560390.2
申请日:2022-05-18
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/353 , G06F40/289
Abstract: 本申请公开了一种要素抽取方法、装置、设备和存储介质,该方法包括:获取待要素抽取的目标文本;对目标文本进行第一抽取,得到第一抽取结果,其中,第一抽取结果包括目标文本中属于需求对象的第一分词;基于第一分词,对目标文本进行第二抽取,得到目标文本中属于与需求对象对应的需求属性的第二分词。通过上述方式,本申请能够抽取需求对象以及需求对象对应的需求属性,并保留需求对象和需求属性之间的对应关系。
-
公开(公告)号:CN117520474A
公开(公告)日:2024-02-06
申请号:CN202311596889.X
申请日:2023-11-23
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/31 , G06F40/242 , G06F40/284
Abstract: 本发明提供一种信息抽取方法、装置、电子设备和存储介质,所述方法包括:确定待抽取文本;基于待抽取文本中各元事件的描述信息,确定提示文本;基于提示文本,对待抽取文本进行信息抽取,得到信息抽取结果。本发明提供的信息抽取方法、装置、电子设备和存储介质,由于提示文本中包含有待抽取文本中最小粒度的元事件要素的提示信息,从而基于提示文本能够准确且完整从待抽取文本中抽取各元事件的要素,得到精度较高的信息抽取结果。
-
公开(公告)号:CN114840642A
公开(公告)日:2022-08-02
申请号:CN202210503921.4
申请日:2022-05-10
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/33 , G06F16/38 , G06F40/289 , G06K9/62
Abstract: 本申请公开了一种事件抽取方法、装置、设备及存储介质,本申请预先配置了事件联合抽取模型,该模型同时融合了触发词识别任务、论元识别任务及论元关系识别任务三个子任务进行训练,三个子任务能够共享事件联合抽取模型的网络参数,使得训练得到的事件联合抽取模型在处理三个子任务时能够互相制约、促进,也即触发词识别过程会同时参考输入文本中的论元及论元关系的影响,论元识别过程也会同时参考输入文本中的触发词以及不同论元关系间的影响,论元关系识别过程也会同时参考输入文本中的触发词及论元的影响,三个子任务相辅相成,能够极大提升最终抽取的触发词、论元、论元类型及论元关系的准确度。
-
公开(公告)号:CN113392213A
公开(公告)日:2021-09-14
申请号:CN202110420855.X
申请日:2021-04-19
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/216 , G06F40/284
Abstract: 本申请公开了一种事件抽取方法以及电子设备、存储装置,其中,事件抽取方法包括:获取事件文本的事件参数;其中,事件参数包括事件文本涉及的事件类别和事件类别的若干事件属性;在每轮抽取过程中,选择未选择过的事件参数作为当前参数,并构造关于问询当前参数的问题文本,以及将问题文本和事件文本输入事件抽取模型,以抽取得到事件文本中与当前参数对应的事件词语;其中,问题文本包括在本轮抽取之前抽取到的事件词语。上述方案,能够提高事件抽取的准确性。
-
公开(公告)号:CN112861527B
公开(公告)日:2024-08-30
申请号:CN202110286434.2
申请日:2021-03-17
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/279 , G06F40/216
Abstract: 本申请提出一种事件抽取方法、装置、设备及存储介质,该方法包括:将待抽取文本输入预先训练的事件抽取模型,得到所述待抽取文本中的各个文本单元的类别标签,作为事件抽取结果;所述事件抽取模型,以文本序列作为训练样本,以所述文本序列的事件触发词位置标签,以及所述文本序列的每一文本单元的类别标签作为第一类型样本标签,训练得到,其中,文本单元的类别标签包括文本单元所属的事件触发词类型和事件论元类型的标签。上述方法能够实现事件抽取,并且能够全面地识别文本在事件中的多重角色,从而保证事件抽取的完整性。
-
公开(公告)号:CN118349677A
公开(公告)日:2024-07-16
申请号:CN202410474963.9
申请日:2024-04-19
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F18/214 , G06F18/241 , G06F18/25
Abstract: 本申请公开了一种垃圾信息文本分类方法、装置、相关设备及计算机程序产品,本申请分别提取待分类文本的文本向量特征及对应字符图像序列的图像向量特征,融合两种模态特征,基于融合后多模态特征预测待分类文本是否属于垃圾信息文本。在文本模态特征的基础上进一步结合了图像模态特征,可以有效地提高对异形字、生僻字等特殊文字的表示能力,规避单独使用文本特征的不利影响,可以有效提升垃圾信息文本的分类准确度。
-
公开(公告)号:CN115455939A
公开(公告)日:2022-12-09
申请号:CN202211150765.4
申请日:2022-09-21
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/211 , G06F40/186 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种篇章级事件抽取方法、装置、设备及存储介质,对于携带有标题信息的目标篇章无需进行触发词的识别,直接进行事件参数抽取,由抽取的各类型事件参数的参数值、事件名称及事件类型组成事件抽取结果,更加符合篇章特性,由于省去了触发词的识别,整个处理流程更加简单。在事件参数抽取过程,对目标篇章进行分句,按照事件参数类型模板,依次抽取每个句子中的各类型事件参数的参数值,由于是对句子级别进行事件参数抽取,能够避免标记的事件参数混乱。对于每一类型事件参数,将各句子中抽取的该类型事件参数的参数值进行整合,得到整合参数值。保证了篇章级抽取的各类型事件参数的参数值的完整性,又避免标记事件参数混乱的问题。
-
公开(公告)号:CN114911937A
公开(公告)日:2022-08-16
申请号:CN202210560390.2
申请日:2022-05-18
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F40/289
Abstract: 本申请公开了一种要素抽取方法、装置、设备和存储介质,该方法包括:获取待要素抽取的目标文本;对目标文本进行第一抽取,得到第一抽取结果,其中,第一抽取结果包括目标文本中属于需求对象的第一分词;基于第一分词,对目标文本进行第二抽取,得到目标文本中属于与需求对象对应的需求属性的第二分词。通过上述方式,本申请能够抽取需求对象以及需求对象对应的需求属性,并保留需求对象和需求属性之间的对应关系。
-
公开(公告)号:CN119917963A
公开(公告)日:2025-05-02
申请号:CN202411741074.0
申请日:2024-11-29
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F18/2433 , G06F18/213 , G06F18/25 , G06N3/045 , G06N3/0464 , G06N3/084 , G06F40/211 , G06F40/284 , G06F40/30 , G10L25/63 , G10L25/30 , G10L15/02 , G10L15/16 , H04M1/663
Abstract: 本申请公开了一种骚扰电话识别方法和装置、电子设备和存储介质,该方法包括:获取分别对目标电话的目标音频数据和目标文本数据进行特征提取得到的目标音频特征和目标文本特征;目标文本数据是对目标音频数据进行转写得到的;分别对目标音频特征和目标文本特征进行注意力处理,得到目标音频特征对应的目标音频注意力特征以及目标文本特征对应的目标文本注意力特征;利用各自对应的自适应权重对目标音频注意力特征以及目标文本注意力特征进行加权处理,得到目标融合特征;基于目标融合特征,确定目标电话是否为骚扰电话。通过上述方式,本申请能够提高骚扰电话识别准确度。
-
公开(公告)号:CN113392213B
公开(公告)日:2024-05-31
申请号:CN202110420855.X
申请日:2021-04-19
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/216 , G06F40/284
Abstract: 本申请公开了一种事件抽取方法以及电子设备、存储装置,其中,事件抽取方法包括:获取事件文本的事件参数;其中,事件参数包括事件文本涉及的事件类别和事件类别的若干事件属性;在每轮抽取过程中,选择未选择过的事件参数作为当前参数,并构造关于问询当前参数的问题文本,以及将问题文本和事件文本输入事件抽取模型,以抽取得到事件文本中与当前参数对应的事件词语;其中,问题文本包括在本轮抽取之前抽取到的事件词语。上述方案,能够提高事件抽取的准确性。
-
-
-
-
-
-
-
-
-