-
公开(公告)号:CN119917608A
公开(公告)日:2025-05-02
申请号:CN202411763276.5
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06F18/214 , G06F18/24
Abstract: 本申请公开了一种问答方法、问答模型训练方法及相关装置,该方法包括:获取目标问题;利用经训练的问答模型基于目标问题,给出目标答案;其中,问答模型基于第一样本问题的至少两个预测答案进行迭代训练,至少两个预测答案的得分不同;预测答案的得分由经训练的分类模型得到,分类模型基于第二样本问题的样本参考答案和第二样本问题的样本预测答案进行迭代训练。通过上述方式,本申请能够提高目标答案的准确度。
-
公开(公告)号:CN118246412A
公开(公告)日:2024-06-25
申请号:CN202410349084.3
申请日:2024-03-26
Applicant: 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院
IPC: G06F40/166 , G06F40/232 , G06F40/284 , G06N20/00
Abstract: 本申请公开了一种文本润色训练数据筛选方法、装置、相关设备及计算机程序产品,本申请在获取到文本润色任务数据集后,调用人工智能大模型,通过第一提示指令prompt指示大模型结合给定的评测标准对每条润色任务进行评测,给出评测结果,借助大模型的能力可以更加准确的得到每条润色任务的质量评测结果,与人类专家给出的评测结果更加接近,可以节省大量人力并避免由于主观偏见造成的评测结果波动。在此基础上,可以筛选出满足设定评测结果要求的润色任务作为最终的润色训练数据,得到高质量的润色训练数据。以筛选得到的高质量的润色训练数据训练处理文本润色任务的模型时,可以提升模型的训练效果。
-
公开(公告)号:CN117973369A
公开(公告)日:2024-05-03
申请号:CN202410153454.6
申请日:2024-02-02
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F40/232 , G06F40/284 , G06F40/242 , G06F18/214 , G06F18/213 , G06F18/2411 , G06F18/25
Abstract: 本申请公开了一种文本纠错方法、装置、相关设备及计算机程序产品,本申请分别采用通用词典和目标领域的专业词典对待纠错文本进行分词,得到第一分词结果和第二分词结果,由第一分词结果确定通用词典向量,由第二分词结果确定专业词典向量,对两种词典向量进行融合,基于融合向量确定待纠错文本对应的纠错后文本。通用词典向量涵盖了待纠错文本中可能存在的一般性错误信息,专业词典向量涵盖了待纠错文本中可能存在的目标领域下专业词汇的拼写错误信息,基于融合向量确定待纠错文本的纠错后文本,保证了本申请方案对常见的一般性错误的纠错能力,以及对特定垂类领域的专业词汇的拼写错误的纠错能力,大大提升了文本纠错效果。
-
公开(公告)号:CN116628183A
公开(公告)日:2023-08-22
申请号:CN202310460603.9
申请日:2023-04-25
Applicant: 科大讯飞股份有限公司
IPC: G06F16/34 , G06F16/335 , G06F16/338
Abstract: 本申请公开了一种目标提纲生成方法、系统及相关装置,该方法包括:获取到用户输入的第一需求,基于所述第一需求,生成根层级对应的至少一个标题;响应于获取到用户输入的第二需求,基于所述第二需求和至少部分已生成的标题,至少生成当前层级对应的下一层级的标题,直至得到所有层级的标题组成的目标提纲。通过上述方式,本申请能够提高生成的提纲与用户需求的契合度。
-
公开(公告)号:CN110008327B
公开(公告)日:2022-01-14
申请号:CN201910257194.6
申请日:2019-04-01
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/295 , G06Q50/18
Abstract: 本发明实施例提供一种法律回答生成方法及装置,属于自然语言处理技术领域。包括:获取问题数据,问题数据与法律咨询相关;将问题数据输入至强化学习模型中,输出回答数据。由于强化学习模型是基于初始模型训练得到的,而初始模型的类型为编解码模型,而不是基于历史信息检索,从而不需要依赖于历史的法律问答数据,可以针对法律提问创造出新的回答数据。因此,能够提供覆盖范围较广的回答。其次,由于初始模型的类型为编解码模型,从而不需要以三元组的形式表示训练数据,进而经初始模型训练得到的强化学习模型更适用于法律提问的回答。
-
公开(公告)号:CN110851591A
公开(公告)日:2020-02-28
申请号:CN201910876106.0
申请日:2019-09-17
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC: G06F16/35 , G06F40/205 , G06F16/33 , G06Q50/18
Abstract: 本申请提供了一种裁判文书的质量评估方法、装置、设备及存储介质,其中,方法包括:获取目标裁判文书;从目标裁判文书中获取目标文本,其中,目标文本包括诉请文本和说理文本,诉请文本包括至少一条诉请;通过预先建立的说理完备性检测模型,检测诉请文本中的每条诉请是否被说理文本所回应,获得每条诉请对应的第一检测结果。本申请提供的裁判文书的质量评估方法能够自动、高效地对裁判文书的质量进行评估。
-
公开(公告)号:CN113947073B
公开(公告)日:2025-01-14
申请号:CN202111210946.7
申请日:2021-10-18
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F40/232 , G06F40/242 , G06F40/30 , G06V10/74 , G06V30/24
Abstract: 本发明提供一种人名纠正方法、装置、电子设备和存储介质,所述方法包括:确定待纠错文本中的错误人名,以及错误人名对应的候选人名;将待纠错文本中的错误人名替换为候选人名,得到候选文本;基于候选文本与候选人名间的语义相似度、待纠错文本的人名预测结果与候选人名间的相似度,以及待纠错文本的人名预测位置与候选人名的位置间的一致性,确定待纠错文本的人名纠正结果。本发明提供的人名纠正方法、装置、电子设备和存储介质,能够进一步提高人名纠正结果精度。
-
公开(公告)号:CN119066184A
公开(公告)日:2024-12-03
申请号:CN202411570789.4
申请日:2024-11-06
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/289
Abstract: 本申请公开了一种查询语句推荐方法及相关装置、设备和存储介质,其中,查询语句推荐方法包括:将参考查询语句中目标分词替换所属分词类型,得到模板查询语句;基于各个模板查询语句进行聚类,得到若干语句集合;基于相同语句集合内各个模板查询语句分别所替换的目标分词,组合得到对应语句集合的分词集合;基于目标查询语句中核心实体词与各个语句集合的分词集合进行匹配,得到对应语句集合的匹配结果;其中,目标查询语句为本次查询时输入至智能对话系统的查询语句;在参考各个语句集合的匹配结果所选择的语句集合内,选择至少一个模板查询语句得到推荐查询语句。上述方案,能够提升查询语句推荐的质量,并降低查询语句推荐的成本和耗时。
-
公开(公告)号:CN117520481A
公开(公告)日:2024-02-06
申请号:CN202311576882.1
申请日:2023-11-23
Applicant: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC: G06F16/33 , G06F16/35 , G06F18/241 , G06F18/2431 , G06N3/096 , G06N3/09 , G06N3/088
Abstract: 本发明提供一种信息检索方法、装置、电子设备和存储介质,涉及自然语言处理技术领域。其中方法包括:将用于检索的输入文本输入至意图识别模型,得到所述意图识别模型输出的意图识别结果;基于所述意图识别结果,确定所述输入文本对应的目标意图;输出所述目标意图对应的信息检索结果;其中,所述意图识别模型是基于第一样本文本和所述第一样本文本对应的第一意图标签,对初始识别模型进行训练得到的,所述初始识别模型包括多个子识别模型,任一所述子识别模型包括依次连接的预训练模型和分类器,所述多个子识别模型中的预训练模型不同。本发明提供的方法、装置、电子设备和存储介质可以提高意图识别的准确性,进而提高信息检索的准确性。
-
公开(公告)号:CN117037791A
公开(公告)日:2023-11-10
申请号:CN202211565299.6
申请日:2022-12-07
Applicant: 科大讯飞股份有限公司 , 广州市讯飞樽鸿信息技术有限公司
Abstract: 本申请提供了一种基于语音识别的数据处理方法、装置、设备和存储介质,所述方法通过获取目标语音,通过语音转写模型对目标语音进行转写,生成文字文本,对文字文本的语篇结构及谈论对象进行抽取,通过错误检出模型对文字文本进行检测,根据抽取结果及检测结果,判断文字文本是否存在错误数据,提高文字文本中错误数据识别的准确率,从而提高语音识别准确率。
-
-
-
-
-
-
-
-
-