-
公开(公告)号:CN114328916B
公开(公告)日:2024-11-08
申请号:CN202111572355.4
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F18/214
Abstract: 本申请公开了一种事件抽取、及其模型的训练方法,及其装置、设备和介质,其中,事件抽取模型的训练方法包括:利用第一样本集中的目标样本文本对事件抽取模型进行第一训练,其中,事件抽取模型用于预测文本的事件分类;获取第一样本集中各目标样本文本对事件抽取模型的决策影响;基于决策影响从第一样本集中筛选出至少一个目标样本文本,以得到第二样本集;利用第二样本集中的目标样本文本对事件抽取模型进行第二训练,上述方案直接通过基于目标样本文本对事件抽取模型的决策影响,对目标文本样本进行降噪,能够节省事件抽取模型的训练成本。
-
公开(公告)号:CN112348714B
公开(公告)日:2024-07-05
申请号:CN202011224496.2
申请日:2020-11-05
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种证据链构建方法、电子设备和存储介质,该方法包括:确定待审查卷宗中各个文书;对各个文书进行案件内容提取和识别,得到各个文书的案件内容及其审查要素标签;基于各个文书的案件内容的审查要素标签,对各个文书的案件内容进行整合,得到各个审查要素标签下的整合内容;其中,所述各个审查要素标签基于阅卷思路拆分得到;基于各个审查要素标签下的整合内容,构建所述待审查卷宗的证据链。本发明实施例提供的方法、电子设备和存储介质,基于阅卷思路得到的审查要素标签的应用,使得构建的证据链更加准确全面,更能够贴合相关人员的思维模式。
-
公开(公告)号:CN117995196A
公开(公告)日:2024-05-07
申请号:CN202410033784.1
申请日:2024-01-09
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种文本位置匹配方法、装置、电子设备和存储介质,其中方法包括:获取待匹配文本的音频,对音频中当前时段的音频段进行发音识别,得到当前时段的识别发音;将当前时段的识别发音与发音图网络中的各节点进行匹配,得到识别发音在待匹配文本中所处位置的匹配结果,发音图网络中的各节点基于待匹配文本中各文字的发音构建;基于发音图网络,对历史匹配结果进行回溯和修正,得到文本位置匹配结果,历史匹配结果包括当前时段的匹配结果和当前时段之前时段的匹配结果。本发明提供的方法、装置、电子设备和存储介质,可以支持文本位置在线实时匹配,并支持匹配结果动态修正,从而提高文本位置匹配的准确性和稳定性。
-
公开(公告)号:CN114328916A
公开(公告)日:2022-04-12
申请号:CN202111572355.4
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06K9/62
Abstract: 本申请公开了一种事件抽取、及其模型的训练方法,及其装置、设备和介质,其中,事件抽取模型的训练方法包括:利用第一样本集中的目标样本文本对事件抽取模型进行第一训练,其中,事件抽取模型用于预测文本的事件分类;获取第一样本集中各目标样本文本对事件抽取模型的决策影响;基于决策影响从第一样本集中筛选出至少一个目标样本文本,以得到第二样本集;利用第二样本集中的目标样本文本对事件抽取模型进行第二训练,上述方案直接通过基于目标样本文本对事件抽取模型的决策影响,对目标文本样本进行降噪,能够节省事件抽取模型的训练成本。
-
公开(公告)号:CN119942858A
公开(公告)日:2025-05-06
申请号:CN202510029197.X
申请日:2025-01-08
Applicant: 科大讯飞股份有限公司
IPC: G09B7/02 , G06N3/0475 , G06N3/047 , G06N3/0455 , G06N3/088 , G06N20/00
Abstract: 本申请公开了一种口语评测方法、装置、相关设备及计算机程序产品,方法包括:获取考生的答题数据,答题数据包括问题、考生的答题音频及参考答案;识别答题音频对应的答题文本,结合答题文本和答题数据,通过配置的推理评分模型得到考生的推理评分;获取配置的定标模型,定标模型为基于定标考生的答题文本、定标考生的推理评分及专家评分预训练得到,定标考生为从参与本次口语考试的全部考生中抽取的部分考生;根据每一考生的答题文本及推理评分,利用定标模型进行评分,得到每一考生的最终评分。相比于现有技术单纯计算答题文本与参考答案间的相似度来确定评分的方式,本申请方案得到的口语评测结果更加准确。
-
公开(公告)号:CN114254587B
公开(公告)日:2025-04-29
申请号:CN202111538297.3
申请日:2021-12-15
Applicant: 科大讯飞股份有限公司
IPC: G06F40/117 , G10L15/04 , G10L15/16 , G10L15/26
Abstract: 本发明提供一种主题段落划分方法、装置、电子设备及存储介质,首先获取目标文本;目标文本基于对目标音频进行转写得到,目标文本携带有目标音频中的音频片段标识,音频片段标识包括说话人标识、听众标识以及静音标识;然后基于音频片段标识,对目标文本进行语句划分及标点标注,得到待划分文本;最后确定待划分文本中各语句的向量表征,基于待划分文本中各语句的向量表征和/或音频片段标识,对待划分文本进行主题段落划分。引入了目标音频中的音频片段标识,结合该音频片段标识得到待划分文本,并对待划分文本进行主题段落划分,可以充分利用目标音频中包含的信息,降低目标文本的可信度对划分结果的影响,使得主题段落的划分结果更加准确。
-
公开(公告)号:CN114254617B
公开(公告)日:2025-01-17
申请号:CN202111565016.3
申请日:2021-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F40/194 , G06F40/30 , G06Q10/10 , G06F16/35
Abstract: 本申请公开了一种修订条款的方法,包括:获取待审核条款,并确定条款修订库中与待审核条款相匹配的至少一个条款修订记录,其中,该条款修订库中包括多个条款修订记录,每个条款修订记录包括原始条款以及针对该原始条款的修订内容;然后,利用所确定出的至少一个条款修订记录,对所述待审核条款进行修订。如此,针对于用户需要审核的每个条款,均可以实现对该条款的自动审核与修订,从而不仅可以有效降低人力成本,而且,也可以避免针对条款的审核结果受到人为因素的影响,以尽可能保护用户的利益。此外,本申请还提供了对应的装置、计算设备以及存储介质。
-
公开(公告)号:CN114281996B
公开(公告)日:2024-10-29
申请号:CN202111619122.5
申请日:2021-12-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例提供一种长文本分类方法、装置、设备及存储介质,该方法包括:将获取的目标长文本划分成N个序列后输入目标模型中,分别得到N个序列的文本表示,N为正整数;对N个序列的文本表示进行融合,得到目标长文本的篇章表示;根据目标长文本的篇章表示,得到目标长文本的分类结果。也就是说,本申请将目标长文本的N个序列的文本表示进行融合,得到整个目标长文本的篇章表示,基于整个目标长文本的篇章表示进行分类,即在分类过程中考虑了整个文本的语义信息和上下文信息,进而提高了目标长文本的分类准确性。
-
公开(公告)号:CN118335120A
公开(公告)日:2024-07-12
申请号:CN202410256289.7
申请日:2024-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语言评测方法及相关装置、设备和存储介质,其中,语言评测方法包括:获取目标对象朗读目标文本的音频信息,作为待测音频;获取目标文本的第一发音序列,以及获取待测音频中顺序排列的各个语音段的第二发音序列;基于第一发音序列与语音段的第二发音序列之间的匹配结果,确定语音段对应于目标文本中的位置信息;基于各个语音段和语音段对应于目标文本中的位置信息,得到待测音频的评测结果。上述方案,能够提升语言评测的准确性。
-
公开(公告)号:CN118051605A
公开(公告)日:2024-05-17
申请号:CN202410034630.4
申请日:2024-01-09
Applicant: 科大讯飞股份有限公司
IPC: G06F16/335 , G06F16/33 , G06F16/34
Abstract: 本申请公开了一种文本评价生成方法、系统、电子设备和可读存储介质,该方法包括:响应于得到源文本,生成源文本匹配的第一提示文本,将第一提示文本输入智能分析模型,得到源文本对应的目标文本;其中,第一提示文本至少包括对源文本进行调整的调整需求;获取源文本和目标文本中相互匹配的子句对,确定子句对中调整过的字符之间的对应关系;子句对包括源文本中的子句和目标文本中的子句;生成对应关系匹配的第二提示文本,将第二提示文本输入智能分析模型,得到文本评价结果;第二提示文本至少包括对具有对应关系的字符进行评价的评价需求,评价需求对应的评价方式包括解释和询问中的至少一者。上述方案,能够提高文本评价的灵活度和全面性。
-
-
-
-
-
-
-
-
-