-
公开(公告)号:CN118246412A
公开(公告)日:2024-06-25
申请号:CN202410349084.3
申请日:2024-03-26
申请人: 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/166 , G06F40/232 , G06F40/284 , G06N20/00
摘要: 本申请公开了一种文本润色训练数据筛选方法、装置、相关设备及计算机程序产品,本申请在获取到文本润色任务数据集后,调用人工智能大模型,通过第一提示指令prompt指示大模型结合给定的评测标准对每条润色任务进行评测,给出评测结果,借助大模型的能力可以更加准确的得到每条润色任务的质量评测结果,与人类专家给出的评测结果更加接近,可以节省大量人力并避免由于主观偏见造成的评测结果波动。在此基础上,可以筛选出满足设定评测结果要求的润色任务作为最终的润色训练数据,得到高质量的润色训练数据。以筛选得到的高质量的润色训练数据训练处理文本润色任务的模型时,可以提升模型的训练效果。
-
公开(公告)号:CN112580365B
公开(公告)日:2024-06-11
申请号:CN202011225699.3
申请日:2020-11-05
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/35 , G06F40/284 , G06F40/289
摘要: 本申请公开了一种篇章解析方法及电子设备、存储装置,其中,篇章解析方法包括:获取篇章和问题两者中词语的语义表示;利用语义表示,得到篇章中词语对回答问题的重要度;利用篇章中词语的重要度,更新对应词语的语义表示;基于更新后的语义表示和篇章中词语的重要度,得到问题的相关文本;其中,相关文本用于以下任一者:在得到问题的答案的情况下解释问题的答案,在未得到问题的答案的情况下提示问题的答案。上述方案,能够提高篇章解析精度。
-
公开(公告)号:CN112685548B
公开(公告)日:2023-09-08
申请号:CN202011627778.7
申请日:2020-12-31
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F40/151 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。
-
公开(公告)号:CN116187336A
公开(公告)日:2023-05-30
申请号:CN202211679309.9
申请日:2022-12-26
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/30 , G06F40/268 , G06F40/289 , G06F18/214 , G06F18/24
摘要: 本发明提供一种意图脉络分析方法、装置、电子设备和存储介质,其中方法包括:确定待分析的文本,以及文本的摘要信息;对文本进行片段分割得到若干片段,并识别得到若干片段中每一个片段的语义表示;根据摘要信息和每一个片段的语义表示,得到每一个片段在文本中的角色表示;根据每一个片段的语义表示和角色表示,得到片段之间的承接关系,以及得到每一个片段的意图表示;根据若干片段、角色表示、承接关系和意图表示,得到文本的脉络分析结果。提高了对篇章级文章的意图脉络信息的提取和分析的准确性,为文章评价提供更准确的依据。
-
公开(公告)号:CN116029303A
公开(公告)日:2023-04-28
申请号:CN202211691073.0
申请日:2022-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F18/25
摘要: 本发明涉及人工智能技术领域,提供一种语言表达方式识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本;提取所述待识别文本中各分句的句子内语义特征和上下文语义特征,并基于所述各分句的句子内语义特征和上下文语义特征,对所述各分句进行语言表达方式识别。本发明提供的语言表达方式识别方法、装置、电子设备和存储介质,通过提取待识别文本中各分句的句子内语义特征和上下文语义特征,并基于各分句的句子内语义特征和上下文语义特征,对各分句进行语言表达方式识别,由此能够实现同时兼容依赖上下文信息和仅依赖单句内信息的多种语言表达方式的识别,从而可以节省资源,提高识别效率。
-
公开(公告)号:CN115859974A
公开(公告)日:2023-03-28
申请号:CN202211714389.7
申请日:2022-12-27
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/289 , G06F40/30 , G06F18/213
摘要: 本发明涉及人工智能技术领域,提供一种成语润色方法、装置、电子设备和存储介质,其中方法包括:确定待润色文本;基于成语润色模型,应用所述待润色文本中各字符的语义特征,对所述待润色文本进行成语润色边界检测,得到文本边界,并基于所述文本边界对应文本片段的语义特征生成润色文本;所述成语润色模型是基于样本文本对、成语标签和文本边界标签训练得到的。本发明提供的成语润色方法、装置、电子设备和存储介质,通过成语润色模型,能够实现自动生成成语润色后的文本,从而可以帮助更快地构建成语使用体系。
-
公开(公告)号:CN110069612B
公开(公告)日:2022-02-01
申请号:CN201910350366.4
申请日:2019-04-28
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/33
摘要: 本申请公开了一种回复生成方法及装置,该方法包括:在获取到提问者提出的目标问题后,可以先根据目标问题,生成提问者的人物画像信息,然后,利用该人物画像信息和目标问题,再生成目标问题的至少一个待选回复。可见,本申请在生成目标问题的待选回复时,考虑了提出目标问题的提问者的人物画像信息,使得生成的待选回复的内容与提问者本身的个性特点更加相关,从而可以满足提问者的对话需求,提高了回复生成结果的合理性。
-
公开(公告)号:CN110008327B
公开(公告)日:2022-01-14
申请号:CN201910257194.6
申请日:2019-04-01
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/295 , G06Q50/18
摘要: 本发明实施例提供一种法律回答生成方法及装置,属于自然语言处理技术领域。包括:获取问题数据,问题数据与法律咨询相关;将问题数据输入至强化学习模型中,输出回答数据。由于强化学习模型是基于初始模型训练得到的,而初始模型的类型为编解码模型,而不是基于历史信息检索,从而不需要依赖于历史的法律问答数据,可以针对法律提问创造出新的回答数据。因此,能够提供覆盖范围较广的回答。其次,由于初始模型的类型为编解码模型,从而不需要以三元组的形式表示训练数据,进而经初始模型训练得到的强化学习模型更适用于法律提问的回答。
-
公开(公告)号:CN113435179A
公开(公告)日:2021-09-24
申请号:CN202110705457.2
申请日:2021-06-24
申请人: 科大讯飞股份有限公司 , 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/205 , G06F40/211 , G06F40/216 , G06F40/232 , G06F40/253 , G06F40/289
摘要: 本申请提供了一种作文评阅方法、装置、设备及存储介质,其中,方法包括:检测待评阅的目标作文是否为异常作文;若否,则分别从字词级别、句子级别、篇章级别对目标作文进行批改,以得到目标作文分别在字词级别、句子级别、篇章级别上对应的批改结果;从多个评阅维度确定目标作文的评分分档,以得到目标作文在多个评阅维度上的评分分档;根据目标作文在多个评阅维度上的评分分档生成目标作文的评语。本申请提供的作文评阅方法可自动对待评阅作文进行评阅,由于不需要人工参与,因此避免了人工参与所带来的问题,并且,经由本申请提供的作文评阅方法可获得内容丰富的评阅结果,内容丰富的评阅结果能够对写作者起到很好的指导作用,用户体验较好。
-
公开(公告)号:CN112560477A
公开(公告)日:2021-03-26
申请号:CN202011452090.X
申请日:2020-12-09
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/232 , G06F16/33
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中,文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置,且文本库涉及预设知识领域;利用与预设知识领域对应的知识图谱和文本库,对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选片段,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
-
-
-
-
-
-
-
-