-
公开(公告)号:CN119783633A
公开(公告)日:2025-04-08
申请号:CN202411791997.7
申请日:2024-12-06
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F40/154 , G06F40/18
Abstract: 本申请公开了一种图表处理方法、电子设备和存储介质。该方法包括:获取图表数据;对所述图表数据进行处理,生成至少一个初始表格文本;将所述至少一个初始表格文本转换成至少一个中介结构;将所述至少一个中介结构进行融合,得到所述图表数据对应的目标表格文本。本申请提高了将图表数据转换为表格数据的准确性和可靠性。
-
公开(公告)号:CN113158648B
公开(公告)日:2024-11-05
申请号:CN202011449650.6
申请日:2020-12-09
Applicant: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/232 , G06F40/289
Abstract: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置;利用文本库对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN112560476B
公开(公告)日:2024-10-15
申请号:CN202011452078.9
申请日:2020-12-09
Applicant: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/289 , G06F40/232 , G06F16/33
Abstract: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中文本补全方法包括:获取待补全文本;其中,待补全文本包括至少一个缺失位置;确定待补全文本所缺失内容的来源情况;其中,来源情况包括以下任意一者:来源未知、源自第一文本库、源自涉及预设知识领域的第二文本库;采用与来源情况匹配的文本预测方式对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN112560477B
公开(公告)日:2024-04-16
申请号:CN202011452090.X
申请日:2020-12-09
Applicant: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/289 , G06F40/232 , G06F16/33
Abstract: 本申请公开了一种文本补全方法以及电子设备、存储装置,其中,文本补全方法包括:获取待补全文本,并确定待补全文本的缺失内容所源自的文本库;其中,待补全文本包括至少一个缺失位置,且文本库涉及预设知识领域;利用与预设知识领域对应的知识图谱和文本库,对待补全文本进行补全预测,得到缺失位置的至少一个候选词语;利用各个缺失位置的候选词语,得到待补全文本的完整文本。上述方案,能够提高文本补全的效率并降低文本补全的成本。
-
公开(公告)号:CN111310457B
公开(公告)日:2024-02-02
申请号:CN202010125461.7
申请日:2020-02-27
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/216 , G06F40/211
Abstract: 本发明实施例提供一种词语搭配不当识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别文本中的存在搭配关系的两个待识别词;将待识别文本中的任一待识别词替换为遮盖标记,得到任一待识别词对应的输入文本;将任一待识别词对应的输入文本输入至词语预测模型,得到词语预测模型输出的任一待识别词的预测结果;其中,词语预测模型是基于样本文本训练得到的;基于两个待识别词的预测结果,确定词语搭配不当识别结果。本发明实施例提供的词语搭配不当识别方法、装置、电子设备和存储介质,能够基于待识别文本的语境,识别出语义层面上搭配不当的词语,提高了词语搭配不当识别的准确率。
-
公开(公告)号:CN112528109B
公开(公告)日:2023-10-27
申请号:CN202011389567.4
申请日:2020-12-01
Applicant: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F16/906 , G06F18/214 , G06F18/25
Abstract: 本申请提供了一种数据分类方法、装置、设备及存储介质,其中,方法包括:获取待分类数据;将待分类数据输入预先建立的第一分类模型,得到分类结果,其中,第一分类模型采用训练集中的训练数据训练得到,第一分类模型的训练目标为,使其针对训练数据预测的分类结果趋于预先建立的多个第二分类模型分别针对训练数据预测的分类结果的融合结果;根据第一分类模型针对待分类数据预测的分类结果,确定待分类数据所属的类别。本申请提供的数据分类方法通过一个第一分类模型即可实现对待分类数据的准确分类,实现数据分类所消耗的计算资源和时间资源较少。
-
公开(公告)号:CN115659957A
公开(公告)日:2023-01-31
申请号:CN202211337233.1
申请日:2022-10-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/232 , G06F18/25 , G06F40/205 , G06V20/62 , G06V20/40 , G06V40/20
Abstract: 本申请公开了一种视频字幕错别字检测方法、装置、设备及存储介质,对于包含用户唇形和/或手语图像的视频,识别出其中的字幕文本,以及从视频中抽取出唇形图像序列和/或手语图像序列,提取字幕文本的文字模态特征,以及提取唇形图像序列的唇形模态特征,提取手语图像序列的手语模态特征,由唇形模态特征和/或手语模态特征作为视觉模态特征,将视觉模态特征和文字模态特征进行融合,基于融合特征确定视频中包含的真实文本。本申请在考虑了字幕文本的文字模态特征的基础上,进一步融合了视频中唇形/手语的视觉模态特征,使得预测结果更加准确,在此基础上,通过对比真实文本和字幕文本,确定错别字检测结果,大大提升了错别字检测的准确度。
-
公开(公告)号:CN114492453A
公开(公告)日:2022-05-13
申请号:CN202111677576.8
申请日:2021-12-31
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/289 , G06F40/232 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种文本纠错方法及装置、存储介质及电子设备,涉及文本处理技术领域。该文本纠错方法包括:利用错误检测模型,判断待纠错文本是否有误;若待纠错文本有误,利用错误修正模型,确定待纠错文本对应的修正文本,其中,错误检测模型由对抗生成网络中的判别器训练得到,错误修正模型由对抗生成网络中的生成器训练得到。该文本纠错方法只针对有误文本进行纠错任务,减少了错误修正模型的计算量,提高了文本纠错系统的运行速度。
-
公开(公告)号:CN114282527A
公开(公告)日:2022-04-05
申请号:CN202111576592.8
申请日:2021-12-22
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/232 , G06F40/30 , G06F40/58 , G06F40/242 , G06F40/289 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种多语言文本检测与纠错方法、系统、电子设备及存储介质,所述方法包括获取待检测文本,并对所述待检测文本进行多语言字符识别以得到至少一个待识别语句;对所述待识别语句中的目标语言的字符进行语种检测,得到待检测语种单词,并对所述待检测语种单词进行拼写检测和语义检测;若至少一个所述待检测语种单词存在拼写错误和/或语义错误,则对存在拼写错误和/或语义错误的单词进行对应的拼写纠错和/或语义纠错。本发明可以更好地理解跨语言语境下的文本语义,对文本中的所有目标语言的字符进行检测并只对检测有错误的单词进行纠正。
-
公开(公告)号:CN114241279A
公开(公告)日:2022-03-25
申请号:CN202111651496.5
申请日:2021-12-30
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
Abstract: 本申请公开一种图文联合纠错方法、装置、存储介质及计算机设备。该方法包括:获取待处理的文本数据和图像数据,文本数据包括目标文本,图像数据包括场景图片;提取文本数据的文本向量表示,文本向量表示包含目标文本的文本信息;提取图像数据的图片向量表示,图片向量表示包含场景图片的图像信息;根据文本向量表示与图片向量表示,计算包含有文本信息和图像信息的多模态向量表示;在目标文本用于表达场景图片时,根据多模态向量表示确定针对目标文本和场景图片的纠错结果,以根据纠错结果对图文进行纠错,实现了图文联合纠错,提升了纠错能力。
-
-
-
-
-
-
-
-
-