-
公开(公告)号:CN114817553A
公开(公告)日:2022-07-29
申请号:CN202111396510.1
申请日:2021-11-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/211 , G06F40/295 , G06F40/30 , G06N3/02
Abstract: 本发明公开了一种知识图谱构建方法、知识图谱构建系统和计算设备,该方法包括:获取作为原始数据的文本,对所述文本进行篇章级知识抽取和句子级事件抽取,以获得知识抽取结果和事件抽取结果;以及对所述知识抽取结果和所述事件抽取结果进行知识融合,以获得知识图谱。本发明将知识图谱的概念从传统的静态知识三元组变为包含静态知识五元组以及动态事件知识在内的复合知识,使用篇章级要素抽取与要素关联,可以大大提升五元组的提取效率与召回率,使得知识结构化属性更强。
-
公开(公告)号:CN114254617A
公开(公告)日:2022-03-29
申请号:CN202111565016.3
申请日:2021-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/194 , G06F40/30 , G06Q10/10 , G06F16/35
Abstract: 本申请公开了一种修订条款的方法,包括:获取待审核条款,并确定条款修订库中与待审核条款相匹配的至少一个条款修订记录,其中,该条款修订库中包括多个条款修订记录,每个条款修订记录包括原始条款以及针对该原始条款的修订内容;然后,利用所确定出的至少一个条款修订记录,对所述待审核条款进行修订。如此,针对于用户需要审核的每个条款,均可以实现对该条款的自动审核与修订,从而不仅可以有效降低人力成本,而且,也可以避免针对条款的审核结果受到人为因素的影响,以尽可能保护用户的利益。此外,本申请还提供了对应的装置、计算设备以及存储介质。
-
公开(公告)号:CN114201608A
公开(公告)日:2022-03-18
申请号:CN202111646121.X
申请日:2021-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种一种事件抽取方法、相关设备及可读存储介质。该方案中,将待进行事件抽取的文本输入参数抽取模型,该参数抽取模型对该文本进行处理后,输出该文本对应的参数信息,基于该文本对应的参数信息,确定该文本中包含的至少一个事件。本方法中,由于参数抽取模型以训练用文本标注的预设的各个事件类型和参数类型组合对应的参数内容为样本标签,实现了事件检测和参数识别的联合学习,降低了级联误差影响。因此,采用本方案能够提升事件抽取结果的准确率。
-
公开(公告)号:CN108172050A
公开(公告)日:2018-06-15
申请号:CN201711435229.8
申请日:2017-12-26
Applicant: 科大讯飞股份有限公司
IPC: G09B7/00
CPC classification number: G09B7/00
Abstract: 本发明公开了一种数学主观题解答结果批改方法及系统,该方法包括:在获取待批改解答结果的答题结构之后,将待批改解答结果的答题结构与生成的参考答案的答题结构进行匹配,其中,生成的参考答案不同于现有的标准答案,该参考答案是利用待批改解答结果的步骤间推导关系在预先构建的知识库中进行匹配,而生成的与待批改解答结果最相似的正确答案,也就是说,会根据不同的待批改解答结果生成不同的参考答案,且能保证该参考答案的正确性,这样就可以将待批改解答结果的答题结构与生成的参考答案的答题结构进行匹配得到待批改解答结果的批改结果。利用本发明可以效有提升开放性题型的批改结果的准确度。
-
公开(公告)号:CN114254587B
公开(公告)日:2025-04-29
申请号:CN202111538297.3
申请日:2021-12-15
Applicant: 科大讯飞股份有限公司
IPC: G06F40/117 , G10L15/04 , G10L15/16 , G10L15/26
Abstract: 本发明提供一种主题段落划分方法、装置、电子设备及存储介质,首先获取目标文本;目标文本基于对目标音频进行转写得到,目标文本携带有目标音频中的音频片段标识,音频片段标识包括说话人标识、听众标识以及静音标识;然后基于音频片段标识,对目标文本进行语句划分及标点标注,得到待划分文本;最后确定待划分文本中各语句的向量表征,基于待划分文本中各语句的向量表征和/或音频片段标识,对待划分文本进行主题段落划分。引入了目标音频中的音频片段标识,结合该音频片段标识得到待划分文本,并对待划分文本进行主题段落划分,可以充分利用目标音频中包含的信息,降低目标文本的可信度对划分结果的影响,使得主题段落的划分结果更加准确。
-
公开(公告)号:CN114254617B
公开(公告)日:2025-01-17
申请号:CN202111565016.3
申请日:2021-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/194 , G06F40/30 , G06Q10/10 , G06F16/35
Abstract: 本申请公开了一种修订条款的方法,包括:获取待审核条款,并确定条款修订库中与待审核条款相匹配的至少一个条款修订记录,其中,该条款修订库中包括多个条款修订记录,每个条款修订记录包括原始条款以及针对该原始条款的修订内容;然后,利用所确定出的至少一个条款修订记录,对所述待审核条款进行修订。如此,针对于用户需要审核的每个条款,均可以实现对该条款的自动审核与修订,从而不仅可以有效降低人力成本,而且,也可以避免针对条款的审核结果受到人为因素的影响,以尽可能保护用户的利益。此外,本申请还提供了对应的装置、计算设备以及存储介质。
-
公开(公告)号:CN114281996B
公开(公告)日:2024-10-29
申请号:CN202111619122.5
申请日:2021-12-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例提供一种长文本分类方法、装置、设备及存储介质,该方法包括:将获取的目标长文本划分成N个序列后输入目标模型中,分别得到N个序列的文本表示,N为正整数;对N个序列的文本表示进行融合,得到目标长文本的篇章表示;根据目标长文本的篇章表示,得到目标长文本的分类结果。也就是说,本申请将目标长文本的N个序列的文本表示进行融合,得到整个目标长文本的篇章表示,基于整个目标长文本的篇章表示进行分类,即在分类过程中考虑了整个文本的语义信息和上下文信息,进而提高了目标长文本的分类准确性。
-
公开(公告)号:CN114254587A
公开(公告)日:2022-03-29
申请号:CN202111538297.3
申请日:2021-12-15
Applicant: 科大讯飞股份有限公司
IPC: G06F40/117 , G10L15/04 , G10L15/16 , G10L15/26
Abstract: 本发明提供一种主题段落划分方法、装置、电子设备及存储介质,首先获取目标文本;目标文本基于对目标音频进行转写得到,目标文本携带有目标音频中的音频片段标识,音频片段标识包括说话人标识、听众标识以及静音标识;然后基于音频片段标识,对目标文本进行语句划分及标点标注,得到待划分文本;最后确定待划分文本中各语句的向量表征,基于待划分文本中各语句的向量表征和/或音频片段标识,对待划分文本进行主题段落划分。引入了目标音频中的音频片段标识,结合该音频片段标识得到待划分文本,并对待划分文本进行主题段落划分,可以充分利用目标音频中包含的信息,降低目标文本的可信度对划分结果的影响,使得主题段落的划分结果更加准确。
-
公开(公告)号:CN113220824A
公开(公告)日:2021-08-06
申请号:CN202011337026.7
申请日:2020-11-25
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33 , G06F16/335 , G06F40/279
Abstract: 本申请公开了一种数据检索方法、装置、设备及存储介质,对于检索指令文本及待检索数据集中的数据文本,分别进行意图识别及设定类型参数的抽取,从而得到每一文本所表达的文本意图及其包含的设定类型的参数,进一步对检索指令文本及每条数据文本进行意图匹配和参数匹配,通过综合考虑意图匹配结果和参数匹配结果,确定最终的检索结果。本申请通过意图识别可以得到检索指令文本和数据文本的句子语义信息,明确检索指令所真正意图检索的内容,以及数据文本所表达的语义内容,通过意图匹配可以从句子语义信息的层次来确定二者的匹配情况,进一步结合设定类型参数的匹配,可以准确的得到与检索指令文本对应的检索结果。
-
公开(公告)号:CN113111649A
公开(公告)日:2021-07-13
申请号:CN202110396979.9
申请日:2021-04-13
Applicant: 科大讯飞股份有限公司
IPC: G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种事件抽取方法,包括:依据至少一个预设的参数类型对待抽取文本进行第一参数抽取,获得第一参数信息;若第一参数信息的数量大于两个,则依据所有第一参数信息获得第一抽取结果,并将第一抽取结果作为事件抽取结果,其中,第一抽取结果包括至少一个参数信息组合;本发明还公开了基于上述方法的系统以及设备。本发明通过独立的参数抽取避免了触发词抽取对参数抽取带来的级联误差,提高了事件抽取的准确性和效率。
-
-
-
-
-
-
-
-
-