-
公开(公告)号:CN114328916B
公开(公告)日:2024-11-08
申请号:CN202111572355.4
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F18/214
Abstract: 本申请公开了一种事件抽取、及其模型的训练方法,及其装置、设备和介质,其中,事件抽取模型的训练方法包括:利用第一样本集中的目标样本文本对事件抽取模型进行第一训练,其中,事件抽取模型用于预测文本的事件分类;获取第一样本集中各目标样本文本对事件抽取模型的决策影响;基于决策影响从第一样本集中筛选出至少一个目标样本文本,以得到第二样本集;利用第二样本集中的目标样本文本对事件抽取模型进行第二训练,上述方案直接通过基于目标样本文本对事件抽取模型的决策影响,对目标文本样本进行降噪,能够节省事件抽取模型的训练成本。
-
公开(公告)号:CN110110048B
公开(公告)日:2023-06-02
申请号:CN201910390112.5
申请日:2019-05-10
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/338 , G06F40/211 , G06F40/289
Abstract: 本发明公开了一种问询指引方法及装置,其中所述问询指引方法包括:接收问答对;基于所述问答对中的专有词汇以及预设的问询指引策略,预测并输出包含所述专有词汇的下一个问题。本发明可通过基于端到端的深度学习框架,根据实际问询过程的问答对中所出现的专有词汇以及预设的包含专有词汇预测功能的问询指引策略,自动指引出涉及到专有词汇的下一个问题。相比事先设计模板的处理方式,本发明与真实问询内容建立关联,在保障指引内容质量的前提下,提升对实际问询中出现的专有词汇的预测能力,有效地辅助相关人员增进工作效率及后续处理的可靠性。
-
公开(公告)号:CN112527992B
公开(公告)日:2023-01-17
申请号:CN202011492809.2
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/34
Abstract: 本申请公开了一种长文本处理方法、相关设备及可读存储介质,对于长度大于预设长度的长文本,可以基于预置的文本处理模型的处理类型,将该长文本分割成多个文本片段,每个文本片段的长度不超过该文本处理模型所能处理最大文本的长度,然后针对文本片段,利用该文本处理模型进行处理,得到该文本片段对应的处理结果,最后基于各个文本片段对应的处理结果,即可得到与该长文本对应的处理结果。上述方案中,通过基于文本处理模型所能处理最大文本的长度,将长文本的处理转化为对多个短文本的处理,基于多个短文本的处理结果得到长文本的处理结果的方式,从而实现了基于文本处理模型对长文本的处理。
-
公开(公告)号:CN114328916A
公开(公告)日:2022-04-12
申请号:CN202111572355.4
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06K9/62
Abstract: 本申请公开了一种事件抽取、及其模型的训练方法,及其装置、设备和介质,其中,事件抽取模型的训练方法包括:利用第一样本集中的目标样本文本对事件抽取模型进行第一训练,其中,事件抽取模型用于预测文本的事件分类;获取第一样本集中各目标样本文本对事件抽取模型的决策影响;基于决策影响从第一样本集中筛选出至少一个目标样本文本,以得到第二样本集;利用第二样本集中的目标样本文本对事件抽取模型进行第二训练,上述方案直接通过基于目标样本文本对事件抽取模型的决策影响,对目标文本样本进行降噪,能够节省事件抽取模型的训练成本。
-
公开(公告)号:CN113360616A
公开(公告)日:2021-09-07
申请号:CN202110627059.3
申请日:2021-06-04
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/205 , G06F40/295 , G06F40/30
Abstract: 本申请提出一种自动问答处理方法、装置、设备及存储介质,该方法包括:获取问题信息;利用预先训练的语义解析模型对所述问题信息进行语义解析处理,确定所述问题信息的语义要素,其中,所述语义解析模型通过识别问题样本的语义要素训练得到;所述语义要素至少包括问题类型、实体名,以及提问意图;基于所述问题信息的语义要素,以及预设的知识图谱,生成与所述问题信息对应的答复信息。该方法能够从知识图谱中获取与用户提问相关的信息,进而生成正确的答复内容,从而实现自动问答处理。
-
公开(公告)号:CN112527992A
公开(公告)日:2021-03-19
申请号:CN202011492809.2
申请日:2020-12-17
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/34
Abstract: 本申请公开了一种长文本处理方法、相关设备及可读存储介质,对于长度大于预设长度的长文本,可以基于预置的文本处理模型的处理类型,将该长文本分割成多个文本片段,每个文本片段的长度不超过该文本处理模型所能处理最大文本的长度,然后针对文本片段,利用该文本处理模型进行处理,得到该文本片段对应的处理结果,最后基于各个文本片段对应的处理结果,即可得到与该长文本对应的处理结果。上述方案中,通过基于文本处理模型所能处理最大文本的长度,将长文本的处理转化为对多个短文本的处理,基于多个短文本的处理结果得到长文本的处理结果的方式,从而实现了基于文本处理模型对长文本的处理。
-
公开(公告)号:CN114254121B
公开(公告)日:2025-01-03
申请号:CN202111481742.7
申请日:2021-12-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36
Abstract: 本申请公开了一种图谱构建方法及其相关设备,该方法包括:在获取到包括至少一组因果事件的待使用文本之后,先从该待使用文本抽取至少一个待使用原因事件;再根据各待使用原因事件和该待使用文本,确定各待使用原因事件对应的结果事件;最后,根据至少一个待使用原因事件和该至少一个待使用原因事件对应的结果事件,确定因果事件图谱,以使该因果事件图谱用于记录该待使用文本中所存在的因果关系,如此能够实现自动构建因果事件图谱的目的,从而能够降低因果事件图谱的构建成本。
-
公开(公告)号:CN111460149B
公开(公告)日:2023-07-25
申请号:CN202010230887.9
申请日:2020-03-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/295 , G06F40/30 , G06F40/232 , G06F40/253
Abstract: 本申请公开了一种文本分类方法、相关设备及可读存储介质,首先,获取待分类文本,及预置的待测类别对应的类别文本;再确定由每一类别文本和所述待分类文本组成的文本对的文本语义信息;然后,针对每一文本对,基于该文本对的文本语义信息,确定该文本对是否匹配;最后,将匹配的文本对中的类别文本对应的待测类别作为所述待分类文本的类别。基于上述方案,能够将海量的文本划分为不同的类别,得到文本类别的划分结果,基于文本类别的划分结果,可以将不同类别下的文本推荐到相应人员,从而帮助用户在海量文本中选择出有价值的文本。
-
公开(公告)号:CN114357159A
公开(公告)日:2022-04-15
申请号:CN202111509493.8
申请日:2021-12-10
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种事件聚类/脉络构建方法及其相关装置、设备和存储介质,其中,事件聚类方法包括:获取候选文本;基于候选文本中词语的结构特征和语义特征分别抽取候选文本的关键词,形成每个候选文本的关键词子图;基于关键词子图将关键词划分为若干个社区,并根据每个候选文本的关键词分别将候选文本聚类至社区中;在每个社区中,基于关键词子图将描述同一事件的候选文本聚类到同一事件节点中。上述方案,能够提高事件聚类的准确性。
-
公开(公告)号:CN114254121A
公开(公告)日:2022-03-29
申请号:CN202111481742.7
申请日:2021-12-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36
Abstract: 本申请公开了一种图谱构建方法及其相关设备,该方法包括:在获取到包括至少一组因果事件的待使用文本之后,先从该待使用文本抽取至少一个待使用原因事件;再根据各待使用原因事件和该待使用文本,确定各待使用原因事件对应的结果事件;最后,根据至少一个待使用原因事件和该至少一个待使用原因事件对应的结果事件,确定因果事件图谱,以使该因果事件图谱用于记录该待使用文本中所存在的因果关系,如此能够实现自动构建因果事件图谱的目的,从而能够降低因果事件图谱的构建成本。
-
-
-
-
-
-
-
-
-