一种文本生成方法、系统和相关装置

    公开(公告)号:CN119202125A

    公开(公告)日:2024-12-27

    申请号:CN202410984576.X

    申请日:2024-07-22

    Abstract: 本申请公开了一种文本生成方法、系统和相关装置,该方法包括:将已生成的目标文本输入语言模型,获取当前轮次语言模型的输出层对应的至少一个第一候选字符;其中,第一候选字符是利用语言模型中的参考网络得到的,参考网络包括语言模型中的第一解码子网络和补充解码层;基于第一候选字符,获取当前轮次输出层中与第一候选字符对应的第二候选字符;其中,第二候选字符是利用语言模型中的第二解码子网络,且第二解码子网络与第一解码子网络层叠,第二解码子网络与补充解码层并列;基于第一候选字符和第二候选字符,确定当前轮次对应的目标文本。通过上述方式,本申请能够提高文本生成的效率。

    错别字检测方法、装置、设备及存储介质

    公开(公告)号:CN115618849A

    公开(公告)日:2023-01-17

    申请号:CN202211335996.2

    申请日:2022-10-28

    Abstract: 本申请公开了一种错别字检测方法、装置、设备及存储介质,对于待检测图片确定其中文本所处的文本块图片,并确定文本块图片中包含的识别文本,提取文本块图片的图像视觉特征,以及提取识别文本的文字模态特征,将图像视觉特征和文字模态特征进行融合,基于融合特征确定文本块图片中包含的真实文本,对比真实文本和识别文本,以得到错别字检测结果。本申请在对图片中错别字进行检测时,在考虑了识别文本的文字模态特征的基础上,进一步融合了文本块图片的图像视觉特征,使得预测结果更加准确,在此基础上,通过对比真实文本和识别文本,确定错别字检测结果,大大提升了错别字检测的准确度。

    音文平行数据中文本错别字检测方法、装置及相关设备

    公开(公告)号:CN115563962A

    公开(公告)日:2023-01-03

    申请号:CN202211335955.3

    申请日:2022-10-28

    Abstract: 本申请公开了一种音文平行数据中文本错别字检测方法、装置及相关设备,本申请提取音文平行数据中的待检测文本的文字模态特征,提取与待检测文本平行的音频的音频模态特征,将音频模态特征和文字模态特征进行融合,基于融合特征确定音频对应的真实文本,对比真实文本和待检测文本,以得到错别字检测结果。本申请在错别字检测时,在考虑了待检测文本的文字模态特征的基础上,进一步融合了平行音频的音频模态特征,使得预测结果更加准确,在此基础上,通过对比真实文本和待检测文本,确定错别字检测结果,大大提升了错别字检测的准确度。

    阅读理解方法、装置、存储介质及计算机设备

    公开(公告)号:CN114238587A

    公开(公告)日:2022-03-25

    申请号:CN202111655536.3

    申请日:2021-12-30

    Abstract: 本申请公开一种阅读理解方法、装置、存储介质及计算机设备。该方法包括:获取待处理的文本数据和图像数据,文本数据包括问题和问题对应的选项,图像数据包括场景图片;提取文本数据的文本向量表示,文本向量表示包含问题的文本信息和选项的文本信息;提取图像数据的图片向量表示;根据文本向量表示与图片向量表示,计算包含有文本信息和图像信息的多模态向量表示;根据多模态向量表示,计算出每一选项作为正确答案的概率值,以根据概率值从选项中确定出与问题和场景图片匹配的正确答案,可以实现图片和文本问题输入的多模态阅读理解,且提升了阅读理解的正确性。

Patent Agency Ranking