问答处理方法、装置、设备、存储介质及计算机程序产品

    公开(公告)号:CN117875368A

    公开(公告)日:2024-04-12

    申请号:CN202311867491.5

    申请日:2023-12-28

    Abstract: 本申请提出一种问答处理方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取问题信息;将所述问题信息输入预先训练的问答模型,得到与所述问题信息对应的答案信息;其中,所述问答模型通过词级别强化学习训练得到,所述词级别强化学习训练通过评估所述问答模型输出的答案所包含的分词的价值、至少根据所述问答模型输出的答案所包含的分词的价值,对所述问答模型进行参数更新,所述分词的价值用于表征输出该分词的合理性。上述方案能够提高问答模型输出的答案的合理性,提升问答处理性能。

    版面分析方法、装置、计算机设备和存储介质

    公开(公告)号:CN113807218B

    公开(公告)日:2024-02-20

    申请号:CN202111033018.8

    申请日:2021-09-03

    Abstract: 本申请涉及一种版面分析方法、装置、计算机设备和存储介质。方法包括:获取目标文本图像中每一文本行的空间转换特征、位置特征及图像特征;根据每一文本行的空间转换特征与位置特征,获取每一文本行的关系编码特征,将每一文本行的关系编码特征与每一文本行的图像特征进行拼接,得到每一文本行的融合特征;对每一文本行的融合特征进行解码,得到每一文本行的版面信息类型。由于同时结合了空间转换特征及图像特征对文本图像的内容进行理解,而不是单一基于一种特征,从而分析结果比较精准。另外,每一文本行在分析时均结合了图像特征及空间转换特征,在其中一项特征识别错误的情况下,另一项特征也能够作为分析依据,从而提高了版面分析的容错率。

    一种预训练方法及相关方法和设备

    公开(公告)号:CN116453139A

    公开(公告)日:2023-07-18

    申请号:CN202310434116.5

    申请日:2023-04-19

    Inventor: 张镇荣 张建树

    Abstract: 本发明提供了一种预训练方法及相关方法和设备,预训练方法包括:获取训练数据集,对训练数据集中的训练文档图片进行文本检测和识别,得到文本检测框和文本检测框对应的文本,以训练文档图片作为预训练模型的输入,基于预训练模型获取文本检测框的特征,基于文本编码器获取文本检测框对应的文本的语义特征,以使文本检测框的特征趋近于文本检测框对应的文本的语义特征为目标,对预训练模型进行参数更新,训练得到的预训练模型作为目标预训练模型。由于目标预训练模型以文档图片为输入,可从文档图片中挖掘文本语义信息,进而输出富含文本语义的特征,而无需输入文本,因此,将其应用于下游任务时,无需进行文本识别,从而节省了OCR引擎开销。

    一种平面几何题的解答方法、装置、存储介质及设备

    公开(公告)号:CN115841156A

    公开(公告)日:2023-03-24

    申请号:CN202211434650.8

    申请日:2022-11-16

    Abstract: 本申请公开了一种平面几何题的解答方法、装置、存储介质及设备,该方法包括:首先获取待解答的目标平面几何题及其所在的目标图像;然后利用预设第一深度学习模型,对其题干文本进行实体关系预测,得到题干文本对应的第一神经符号表征;并利用预设第二深度学习模型,对目标图像进行转换处理,得到其对应的第二神经符号表征;接着将第一神经符号表征和第二神经符号表征输入符号推理系统,利用波束搜索方式进行推理解答,得到解答结果。可见,由于本申请是先利用深度学习模型分别将目标平面几何题的题干文本和其所在的目标图像转换为神经符号表达,再利用波束搜索方式,通过符号推理系统进行推理解答,从而能够提高平面几何题的解答结果的准确率。

    用于对汉字进行检纠错的方法、系统和计算设备

    公开(公告)号:CN114387603A

    公开(公告)日:2022-04-22

    申请号:CN202111451739.0

    申请日:2021-12-01

    Inventor: 张建树

    Abstract: 本发明公开了用于对汉字进行检纠错的方法、系统和计算设备,所述方法包括:接收包含待识别汉字的图像;以及由经训练的汉字检纠错模型:基于所述预设的汉字空间结构对所述图像中的所述待识别汉字进行解析,得到所述待识别汉字的结构布局;以及基于所述待识别汉字的结构布局对所述待识别汉字进行检错和纠错。根据本发明实施例的用于对汉字进行检纠错的方法、系统和计算设备,基于预设的汉字空间结构对待识别汉字进行检错和纠错,能够识别与正确字高度相似的错别字和未见过的错别字,具有良好的泛化性,识别准确度高,且能够对错别字进行纠正。

Patent Agency Ranking