-
公开(公告)号:CN117037791A
公开(公告)日:2023-11-10
申请号:CN202211565299.6
申请日:2022-12-07
申请人: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
摘要: 本申请提供了一种基于语音识别的数据处理方法、装置、设备和存储介质,所述方法通过获取目标语音,通过语音转写模型对目标语音进行转写,生成文字文本,对文字文本的语篇结构及谈论对象进行抽取,通过错误检出模型对文字文本进行检测,根据抽取结果及检测结果,判断文字文本是否存在错误数据,提高文字文本中错误数据识别的准确率,从而提高语音识别准确率。
-
公开(公告)号:CN115455982A
公开(公告)日:2022-12-09
申请号:CN202210995846.8
申请日:2022-08-17
申请人: 科大讯飞股份有限公司 , 联通在线信息科技有限公司 , 广州市讯飞樽鸿信息技术有限公司
摘要: 本申请提出一种对话处理方法、装置、电子设备及存储介质,方法包括:至少基于当前对话文本预测得到当前对话文本对应的第一语义信息;其中,第一语义信息包括:领域信息、意图信息和语义槽信息;根据预先构建的对话知识图谱,对第一语义信息以及历史对话语义信息进行语义信息融合,得到第二语义信息,其中,历史对话语义信息为根据历史对话文本而确定的语义信息;根据第二语义信息,确定与第二语义信息对应的对话提示信息。采用本方案,对当前对话文本对应的第一语义信息以及历史对话文本对应的语义信息进行融合,可以实现对话状态追踪,准确把握各个对话之间依赖关系,从而能够确定更加准确的有益信息,因此能够提高对话管理的准确度。
-
公开(公告)号:CN118246412A
公开(公告)日:2024-06-25
申请号:CN202410349084.3
申请日:2024-03-26
申请人: 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/166 , G06F40/232 , G06F40/284 , G06N20/00
摘要: 本申请公开了一种文本润色训练数据筛选方法、装置、相关设备及计算机程序产品,本申请在获取到文本润色任务数据集后,调用人工智能大模型,通过第一提示指令prompt指示大模型结合给定的评测标准对每条润色任务进行评测,给出评测结果,借助大模型的能力可以更加准确的得到每条润色任务的质量评测结果,与人类专家给出的评测结果更加接近,可以节省大量人力并避免由于主观偏见造成的评测结果波动。在此基础上,可以筛选出满足设定评测结果要求的润色任务作为最终的润色训练数据,得到高质量的润色训练数据。以筛选得到的高质量的润色训练数据训练处理文本润色任务的模型时,可以提升模型的训练效果。
-
公开(公告)号:CN117973369A
公开(公告)日:2024-05-03
申请号:CN202410153454.6
申请日:2024-02-02
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/232 , G06F40/284 , G06F40/242 , G06F18/214 , G06F18/213 , G06F18/2411 , G06F18/25
摘要: 本申请公开了一种文本纠错方法、装置、相关设备及计算机程序产品,本申请分别采用通用词典和目标领域的专业词典对待纠错文本进行分词,得到第一分词结果和第二分词结果,由第一分词结果确定通用词典向量,由第二分词结果确定专业词典向量,对两种词典向量进行融合,基于融合向量确定待纠错文本对应的纠错后文本。通用词典向量涵盖了待纠错文本中可能存在的一般性错误信息,专业词典向量涵盖了待纠错文本中可能存在的目标领域下专业词汇的拼写错误信息,基于融合向量确定待纠错文本的纠错后文本,保证了本申请方案对常见的一般性错误的纠错能力,以及对特定垂类领域的专业词汇的拼写错误的纠错能力,大大提升了文本纠错效果。
-
公开(公告)号:CN110008327B
公开(公告)日:2022-01-14
申请号:CN201910257194.6
申请日:2019-04-01
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/295 , G06Q50/18
摘要: 本发明实施例提供一种法律回答生成方法及装置,属于自然语言处理技术领域。包括:获取问题数据,问题数据与法律咨询相关;将问题数据输入至强化学习模型中,输出回答数据。由于强化学习模型是基于初始模型训练得到的,而初始模型的类型为编解码模型,而不是基于历史信息检索,从而不需要依赖于历史的法律问答数据,可以针对法律提问创造出新的回答数据。因此,能够提供覆盖范围较广的回答。其次,由于初始模型的类型为编解码模型,从而不需要以三元组的形式表示训练数据,进而经初始模型训练得到的强化学习模型更适用于法律提问的回答。
-
公开(公告)号:CN110851591A
公开(公告)日:2020-02-28
申请号:CN201910876106.0
申请日:2019-09-17
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/35 , G06F40/205 , G06F16/33 , G06Q50/18
摘要: 本申请提供了一种裁判文书的质量评估方法、装置、设备及存储介质,其中,方法包括:获取目标裁判文书;从目标裁判文书中获取目标文本,其中,目标文本包括诉请文本和说理文本,诉请文本包括至少一条诉请;通过预先建立的说理完备性检测模型,检测诉请文本中的每条诉请是否被说理文本所回应,获得每条诉请对应的第一检测结果。本申请提供的裁判文书的质量评估方法能够自动、高效地对裁判文书的质量进行评估。
-
公开(公告)号:CN117520481A
公开(公告)日:2024-02-06
申请号:CN202311576882.1
申请日:2023-11-23
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F18/241 , G06F18/2431 , G06N3/096 , G06N3/09 , G06N3/088
摘要: 本发明提供一种信息检索方法、装置、电子设备和存储介质,涉及自然语言处理技术领域。其中方法包括:将用于检索的输入文本输入至意图识别模型,得到所述意图识别模型输出的意图识别结果;基于所述意图识别结果,确定所述输入文本对应的目标意图;输出所述目标意图对应的信息检索结果;其中,所述意图识别模型是基于第一样本文本和所述第一样本文本对应的第一意图标签,对初始识别模型进行训练得到的,所述初始识别模型包括多个子识别模型,任一所述子识别模型包括依次连接的预训练模型和分类器,所述多个子识别模型中的预训练模型不同。本发明提供的方法、装置、电子设备和存储介质可以提高意图识别的准确性,进而提高信息检索的准确性。
-
公开(公告)号:CN116561275A
公开(公告)日:2023-08-08
申请号:CN202310506303.X
申请日:2023-05-05
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/34 , G06F3/0483
摘要: 本申请实施例公开了一种对象理解方法、装置、设备及存储介质,对文献进行解析,得到文献中的结构化对象或结构化对象的表示信息;结构化对象包括如下至少一种:公式、表格、图像;获得针对第一结构化对象的用户提问;基于第一结构化对象或第一结构化对象的表示信息,以及用户提问,得到第一结构化对象的解释信息;输出解释信息。基于本申请,只要获得用户输入文献以及针对文献中的第一结构化对象(公式、表格或图像)的提问,即可自动生成并输出第一结构化对象的解释信息,实现了对文献中的公式、表格或图像的智能理解,从而帮助阅读者快速理解文献中的公式、图像或表格。
-
公开(公告)号:CN113157880B
公开(公告)日:2023-01-17
申请号:CN202110319845.7
申请日:2021-03-25
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/383 , G06F40/126 , G06F40/30 , G06Q50/18
摘要: 本申请提供了一种要素内容获取方法、装置、设备及存储介质,其中,方法包括:获取目标案情文本;基于目标案情文本确定目标要素,并基于目标案情文本和目标要素确定目标要素对应的要素表示向量,其中,目标要素对应的要素表示向量用于表征目标要素在目标案情文本中的语义;基于目标案情文本和目标要素对应的要素表示向量,获取目标要素对应的要素内容。本申请提供的要素内容获取方法可根据目标案情文本自动确定出目标要素,并可根据目标案情文本和目标要素对应的要素表示向量自动确定出目标要素对应的要素内容。
-
公开(公告)号:CN115169297A
公开(公告)日:2022-10-11
申请号:CN202210709307.3
申请日:2022-06-21
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/166 , G06F40/289 , G06F40/30
摘要: 本发明提供一种文本改写方法、装置、电子设备和存储介质,所述方法包括:获取第一文本;将目标改写等级以及第一文本输入至文本改写模型,得到文本改写模型输出的与目标改写等级对应的第二文本;文本改写模型基于第一样本文本、第二样本文本以及样本改写等级训练得到,样本改写等级基于第一样本文本与第二样本文本之间的字符相似度确定。本发明提供的文本改写方法、装置、电子设备和存储介质,基于第一样本文本、第二样本文本以及样本改写等级训练得到文本改写模型,使得文本改写模型能够根据不同目标改写等级对第一文本进行文本改写,得到与不同目标改写等级对应的第二文本,实现能够根据不同场景需求灵活变更改写文本。
-
-
-
-
-
-
-
-
-