-
公开(公告)号:CN114357107A
公开(公告)日:2022-04-15
申请号:CN202111389113.1
申请日:2021-11-22
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/33 , G06F16/332 , G06K9/62
Abstract: 本申请公开了一种问题回答方法及相关装置、电子设备和存储介质,其中,问题回答方法包括:获取待回答问题文本以及待回答问题涉及的常识文本;基于答案预测模型对待回答问题文本和常识文本进行答案预测,得到待回答问题文本的答案文本;其中,答案预测模型是利用若干组样本文本数据训练得到的,且基于样本文本数据训练答案预测模型时,在样本文本数据中选择至少一个样本字符进行屏蔽。上述方案,能够准确且稳定地实现问题回答。
-
公开(公告)号:CN119884368A
公开(公告)日:2025-04-25
申请号:CN202411946843.0
申请日:2024-12-26
Applicant: 浙江大学 , 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G10L15/26 , G06N5/04 , G06F18/2431 , G06F18/214
Abstract: 本发明公开了一种基于阅读理解的违规数据检测方法,涉及自然语言处理和人工智能技术领域。包括:获取包含仇恨言论的多模态数据,多模态数据包括语音数据和文本数据;利用语音识别系统将语音数据转换为文本数据,得到文本内容;利用大语言模型的思维链提示生成文本内容的逐步推理解释,根据文本内容的逐步推理解释得到初步预测类别标签;基于得到的文本内容的逐步推理解释,再次利用大语言模型生成最终预测类别标签;根据最终预测类别标签生成训练数据;利用训练数据对违规文本分类模型进行训练,得到训练后的检测结果。本发明显著提高了对隐晦、复杂违规言论的检测准确性。
-
公开(公告)号:CN114756675A
公开(公告)日:2022-07-15
申请号:CN202111646089.5
申请日:2021-12-29
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种文本分类方法、相关设备及可读存储介质。在获取待进行分类的文本之后,确定该文本的关键词匹配类别标签得分、分类匹配类别标签得分以及相似度匹配类别标签得分;基于该文本的关键词匹配类别标签得分、分类匹配类别标签得分以及相似度匹配类别标签得分,确定该文本的最终类别标签得分;最后,基于该文本的最终类别标签得分,确定该文本的类别。该方案中,关键词匹配类别标签得分、分类匹配类别标签得分、相似度匹配类别标签得分指示的是文本在三个不同维度的分类结果,文本的类别是基于文本在三个不同维度的分类结果得到的,准确率更高。
-
公开(公告)号:CN112434536A
公开(公告)日:2021-03-02
申请号:CN202011233097.2
申请日:2020-11-06
Applicant: 合肥讯飞数码科技有限公司
IPC: G06F40/35 , G06F40/216
Abstract: 一种文档理解方法、设备和存储介质,由文档理解模型实现。所述文档理解模型包括问题识别模型和答案识别模型。所述方法包括:获取用户输入的问题,其中,所述用户输入的问题是一个单阶问题或包括相互依赖的多个单阶问题的多阶问题;将所述问题输入至所述问题识别模型进行问题识别,得到所述问题包括的一个或多个单阶问题;将所述一个或多个单阶问题以及所述一个或多个单阶问题的候选文档输入至所述答案识别模型进行答案识别,得到所述问题的答案;以及将所述答案呈现给所述用户。使用所提供的方法,可以更精确地获取问题答案。
-
-
-