-
公开(公告)号:CN112560477A
公开(公告)日:2021-03-26
申请号:CN202011452090.X
申请日:2020-12-09
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/232 , G06F16/33
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中,文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置,且文本库涉及预设知识领域;利用与预设知识领域对应的知识图谱和文本库,对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选片段,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN113849603A
公开(公告)日:2021-12-28
申请号:CN202111129021.X
申请日:2021-09-26
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/33 , G06F16/332 , G06K9/62 , G06N3/02 , G06N3/08
摘要: 本申请公开了一种负样本确定方法、相关设备及可读存储介质,基于文本库中各个文本与样本问题的语义相似度,便能够从文本库中,确定与样本问题的语义相似度高,但不包含所述样本问题的答案的文本作为样本问题的负样本。基于该方法确定的负样本与样本问题的语义相似度高,但不包含所述样本问题的答案,对样本问题的迷惑性强。进一步的,将基于上述方法确定的负样本用于训练智能问答系统中的检索模型和问答模型,能够提升训练效果。而且,将基于上述方法确定的负样本用于测试智能问答系统中的检索模型和问答模型的鲁棒性时,相对于采用现有技术确定的对抗样本,效果更好。
-
公开(公告)号:CN112685548A
公开(公告)日:2021-04-20
申请号:CN202011627778.7
申请日:2020-12-31
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F40/151 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。
-
公开(公告)号:CN112580365A
公开(公告)日:2021-03-30
申请号:CN202011225699.3
申请日:2020-11-05
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/35 , G06F40/284 , G06F40/289
摘要: 本申请公开了一种篇章解析方法及电子设备、存储装置,其中,篇章解析方法包括:获取篇章和问题两者中词语的语义表示;利用语义表示,得到篇章中词语对回答问题的重要度;利用篇章中词语的重要度,更新对应词语的语义表示;基于更新后的语义表示和篇章中词语的重要度,得到问题的相关文本;其中,相关文本用于以下任一者:在得到问题的答案的情况下解释问题的答案,在未得到问题的答案的情况下提示问题的答案。上述方案,能够提高篇章解析精度。
-
公开(公告)号:CN111553143A
公开(公告)日:2020-08-18
申请号:CN202010362151.7
申请日:2020-04-30
申请人: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/232 , G06F40/284
摘要: 本申请公开了一种文本纠错方法、相关设备及可读存储介质,在获取待纠错文本之后,分别待纠错文本进行字级别乱序纠错和词级别乱序纠错,得到字级别乱序纠错后的文本以及词级别乱序纠错后的文本,基于字级别乱序纠错后的文本以及词级别乱序纠错后的文本,即可得到纠错后的最终文本,基于上述方案,能够实现对文本中出现的乱序进行纠错,且相对于人工纠错的方式,可以节省人力和时间,进而可以提升纠错效率。
-
公开(公告)号:CN112560476A
公开(公告)日:2021-03-26
申请号:CN202011452078.9
申请日:2020-12-09
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/289 , G06F40/232 , G06F16/33
摘要: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中文本补全方法包括:获取待补全文本;其中,待补全文本包括至少一个缺失位置;确定待补全文本所缺失内容的来源情况;其中,来源情况包括以下任意一者:来源未知、源自第一文本库、源自涉及预设知识领域的第二文本库;采用与来源情况匹配的文本预测方式对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN112528109A
公开(公告)日:2021-03-19
申请号:CN202011389567.4
申请日:2020-12-01
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F16/906 , G06K9/62
摘要: 本申请提供了一种数据分类方法、装置、设备及存储介质,其中,方法包括:获取待分类数据;将待分类数据输入预先建立的第一分类模型,得到分类结果,其中,第一分类模型采用训练集中的训练数据训练得到,第一分类模型的训练目标为,使其针对训练数据预测的分类结果趋于预先建立的多个第二分类模型分别针对训练数据预测的分类结果的融合结果;根据第一分类模型针对待分类数据预测的分类结果,确定待分类数据所属的类别。本申请提供的数据分类方法通过一个第一分类模型即可实现对待分类数据的准确分类,实现数据分类所消耗的计算资源和时间资源较少。
-
公开(公告)号:CN114492453A
公开(公告)日:2022-05-13
申请号:CN202111677576.8
申请日:2021-12-31
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F40/232 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种文本纠错方法及装置、存储介质及电子设备,涉及文本处理技术领域。该文本纠错方法包括:利用错误检测模型,判断待纠错文本是否有误;若待纠错文本有误,利用错误修正模型,确定待纠错文本对应的修正文本,其中,错误检测模型由对抗生成网络中的判别器训练得到,错误修正模型由对抗生成网络中的生成器训练得到。该文本纠错方法只针对有误文本进行纠错任务,减少了错误修正模型的计算量,提高了文本纠错系统的运行速度。
-
公开(公告)号:CN114282527A
公开(公告)日:2022-04-05
申请号:CN202111576592.8
申请日:2021-12-22
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC分类号: G06F40/232 , G06F40/30 , G06F40/58 , G06F40/242 , G06F40/289 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明提供一种多语言文本检测与纠错方法、系统、电子设备及存储介质,所述方法包括获取待检测文本,并对所述待检测文本进行多语言字符识别以得到至少一个待识别语句;对所述待识别语句中的目标语言的字符进行语种检测,得到待检测语种单词,并对所述待检测语种单词进行拼写检测和语义检测;若至少一个所述待检测语种单词存在拼写错误和/或语义错误,则对存在拼写错误和/或语义错误的单词进行对应的拼写纠错和/或语义纠错。本发明可以更好地理解跨语言语境下的文本语义,对文本中的所有目标语言的字符进行检测并只对检测有错误的单词进行纠正。
-
公开(公告)号:CN113705240A
公开(公告)日:2021-11-26
申请号:CN202110888038.7
申请日:2021-08-03
申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
摘要: 本申请公开了一种基于多语种分支模型的文本处理方法及相关装置,所述多语种分支模型包括嵌入层、多分支处理网络、第一混合器、共享网络和输出层,所述文本处理方法包括:基于所述嵌入层,获得待处理的文本对应的初始语义表示;基于所述多分支处理网络、所述第一混合器以及所述共享网络,对所述初始语义表示进行处理以获得综合语义表示;基于所述输出层,对所述综合语义表示进行变换以获得输出结果。通过上述方式,本申请能够在具备多语种处理能力的基础上,提高处理结果的精确度。
-
-
-
-
-
-
-
-
-