-
公开(公告)号:CN119202125A
公开(公告)日:2024-12-27
申请号:CN202410984576.X
申请日:2024-07-22
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F16/33 , G06F16/338 , G06F16/35 , G06F16/332 , G06N3/0455 , G06N5/04
Abstract: 本申请公开了一种文本生成方法、系统和相关装置,该方法包括:将已生成的目标文本输入语言模型,获取当前轮次语言模型的输出层对应的至少一个第一候选字符;其中,第一候选字符是利用语言模型中的参考网络得到的,参考网络包括语言模型中的第一解码子网络和补充解码层;基于第一候选字符,获取当前轮次输出层中与第一候选字符对应的第二候选字符;其中,第二候选字符是利用语言模型中的第二解码子网络,且第二解码子网络与第一解码子网络层叠,第二解码子网络与补充解码层并列;基于第一候选字符和第二候选字符,确定当前轮次对应的目标文本。通过上述方式,本申请能够提高文本生成的效率。
-
公开(公告)号:CN116127012A
公开(公告)日:2023-05-16
申请号:CN202211551967.X
申请日:2022-12-05
Applicant: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC: G06F16/33 , G06F40/284 , G06F40/242 , G06F40/30
Abstract: 本发明涉及自然语言处理技术领域,提供一种词语推荐方法、装置、电子设备及存储介质,该方法首先获取待查询释义;然后基于反向词典模型,从候选词表中选取待查询释义对应的目标词语;最后基于目标词语,确定推荐结果。该方法利用多任务学习得到的反向词典模型对词语以及词语的词性进行预测,考虑了词语的词性,并不仅仅依赖于词库中释义的质量以及用户输入的待查询释义的质量,可以保证推荐结果的准确性,提高推荐结果的质量,进而提高用户体验感。词性的引入,可以辅助减少预测空间,对推荐结果起到约束作用,使得推荐结果更加可靠,减少了易混淆词语的干扰,避免出现推荐结果与用户输入的待查询释义相差较大的情况。
-
公开(公告)号:CN115690455A
公开(公告)日:2023-02-03
申请号:CN202211360681.3
申请日:2022-11-02
Applicant: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC: G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种跨模态数据转换方法、装置、设备及可读存储介质。在获取待转换的源模态的数据之后,先对该源模态的数据进行离散化处理,确定源模态的数据的离散化表示,再将该源模态的数据的离散化表示转换为目标模态的离散化表示,最后再对该目标模态的离散化表示进行解码处理,得到目标模态的数据。该过程中,将源模态的数据的离散化表示转换为目标模态的离散化表示,是由一个离散的空间转换到另一个离散的空间,转换前后空间对等,更易实现,再对目标模态的离散化表示进行解析即可得到目标模态的数据,相对于基于离散的空间到一个连续的物理空间的转换得到目标模态的数据,转换难度降低。
-
公开(公告)号:CN115618849A
公开(公告)日:2023-01-17
申请号:CN202211335996.2
申请日:2022-10-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/232 , G06F18/25 , G06F40/205 , G06V20/62 , G06V30/18
Abstract: 本申请公开了一种错别字检测方法、装置、设备及存储介质,对于待检测图片确定其中文本所处的文本块图片,并确定文本块图片中包含的识别文本,提取文本块图片的图像视觉特征,以及提取识别文本的文字模态特征,将图像视觉特征和文字模态特征进行融合,基于融合特征确定文本块图片中包含的真实文本,对比真实文本和识别文本,以得到错别字检测结果。本申请在对图片中错别字进行检测时,在考虑了识别文本的文字模态特征的基础上,进一步融合了文本块图片的图像视觉特征,使得预测结果更加准确,在此基础上,通过对比真实文本和识别文本,确定错别字检测结果,大大提升了错别字检测的准确度。
-
公开(公告)号:CN115563962A
公开(公告)日:2023-01-03
申请号:CN202211335955.3
申请日:2022-10-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/232 , G06F18/25 , G06F40/205 , G10L15/02 , G10L15/26
Abstract: 本申请公开了一种音文平行数据中文本错别字检测方法、装置及相关设备,本申请提取音文平行数据中的待检测文本的文字模态特征,提取与待检测文本平行的音频的音频模态特征,将音频模态特征和文字模态特征进行融合,基于融合特征确定音频对应的真实文本,对比真实文本和待检测文本,以得到错别字检测结果。本申请在错别字检测时,在考虑了待检测文本的文字模态特征的基础上,进一步融合了平行音频的音频模态特征,使得预测结果更加准确,在此基础上,通过对比真实文本和待检测文本,确定错别字检测结果,大大提升了错别字检测的准确度。
-
公开(公告)号:CN114238587A
公开(公告)日:2022-03-25
申请号:CN202111655536.3
申请日:2021-12-30
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
Abstract: 本申请公开一种阅读理解方法、装置、存储介质及计算机设备。该方法包括:获取待处理的文本数据和图像数据,文本数据包括问题和问题对应的选项,图像数据包括场景图片;提取文本数据的文本向量表示,文本向量表示包含问题的文本信息和选项的文本信息;提取图像数据的图片向量表示;根据文本向量表示与图片向量表示,计算包含有文本信息和图像信息的多模态向量表示;根据多模态向量表示,计算出每一选项作为正确答案的概率值,以根据概率值从选项中确定出与问题和场景图片匹配的正确答案,可以实现图片和文本问题输入的多模态阅读理解,且提升了阅读理解的正确性。
-
公开(公告)号:CN113849603A
公开(公告)日:2021-12-28
申请号:CN202111129021.X
申请日:2021-09-26
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F16/33 , G06F16/332 , G06K9/62 , G06N3/02 , G06N3/08
Abstract: 本申请公开了一种负样本确定方法、相关设备及可读存储介质,基于文本库中各个文本与样本问题的语义相似度,便能够从文本库中,确定与样本问题的语义相似度高,但不包含所述样本问题的答案的文本作为样本问题的负样本。基于该方法确定的负样本与样本问题的语义相似度高,但不包含所述样本问题的答案,对样本问题的迷惑性强。进一步的,将基于上述方法确定的负样本用于训练智能问答系统中的检索模型和问答模型,能够提升训练效果。而且,将基于上述方法确定的负样本用于测试智能问答系统中的检索模型和问答模型的鲁棒性时,相对于采用现有技术确定的对抗样本,效果更好。
-
公开(公告)号:CN112685548A
公开(公告)日:2021-04-20
申请号:CN202011627778.7
申请日:2020-12-31
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F16/332 , G06F40/151 , G06F40/242 , G06F40/284 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种问题回答方法以及电子设备、存储装置,其中,问题回答方法包括:获取问题文本和篇章文本,并获取若干知识点的参考文本;其中,问题文本和篇章文本包含若干词语,若干知识点与问题文本、篇章文本中的至少一者相关;提取若干词语的个体语义表示,并提取各个参考文本的原始语义表示;利用若干词语的个体语义表示和各个参考文本的原始语义表示,从篇章文本中预测得到问题文本的回答文本。上述方案,能够提高问题回答的准确性。
-
公开(公告)号:CN112580365A
公开(公告)日:2021-03-30
申请号:CN202011225699.3
申请日:2020-11-05
Applicant: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
IPC: G06F40/35 , G06F40/284 , G06F40/289
Abstract: 本申请公开了一种篇章解析方法及电子设备、存储装置,其中,篇章解析方法包括:获取篇章和问题两者中词语的语义表示;利用语义表示,得到篇章中词语对回答问题的重要度;利用篇章中词语的重要度,更新对应词语的语义表示;基于更新后的语义表示和篇章中词语的重要度,得到问题的相关文本;其中,相关文本用于以下任一者:在得到问题的答案的情况下解释问题的答案,在未得到问题的答案的情况下提示问题的答案。上述方案,能够提高篇章解析精度。
-
公开(公告)号:CN111553143A
公开(公告)日:2020-08-18
申请号:CN202010362151.7
申请日:2020-04-30
Applicant: 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司 , 科大讯飞股份有限公司
IPC: G06F40/232 , G06F40/284
Abstract: 本申请公开了一种文本纠错方法、相关设备及可读存储介质,在获取待纠错文本之后,分别待纠错文本进行字级别乱序纠错和词级别乱序纠错,得到字级别乱序纠错后的文本以及词级别乱序纠错后的文本,基于字级别乱序纠错后的文本以及词级别乱序纠错后的文本,即可得到纠错后的最终文本,基于上述方案,能够实现对文本中出现的乱序进行纠错,且相对于人工纠错的方式,可以节省人力和时间,进而可以提升纠错效率。
-
-
-
-
-
-
-
-
-