查询语句推荐方法及相关装置、设备和存储介质

    公开(公告)号:CN119066184B

    公开(公告)日:2025-02-28

    申请号:CN202411570789.4

    申请日:2024-11-06

    Abstract: 本申请公开了一种查询语句推荐方法及相关装置、设备和存储介质,其中,查询语句推荐方法包括:将参考查询语句中目标分词替换所属分词类型,得到模板查询语句;基于各个模板查询语句进行聚类,得到若干语句集合;基于相同语句集合内各个模板查询语句分别所替换的目标分词,组合得到对应语句集合的分词集合;基于目标查询语句中核心实体词与各个语句集合的分词集合进行匹配,得到对应语句集合的匹配结果;其中,目标查询语句为本次查询时输入至智能对话系统的查询语句;在参考各个语句集合的匹配结果所选择的语句集合内,选择至少一个模板查询语句得到推荐查询语句。上述方案,能够提升查询语句推荐的质量,并降低查询语句推荐的成本和耗时。

    题目解答方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118520085A

    公开(公告)日:2024-08-20

    申请号:CN202410648333.9

    申请日:2024-05-23

    Abstract: 本申请实施例公开了一种题目解答方法、装置、设备、存储介质及程序产品,在获得目标题目后,基于生成式模型对目标题目进行处理,以获得目标题目的解题结果;解题结果以自然语言表述目标题目的解题步骤;其中,在解题结果中包括算术表达式及其计算结果的情况下,计算结果通过调用计算器计算得到,解题结果中除计算结果外的内容由生成式模型生成,由于算术表达式的计算结果不再由生成式模型生成,而是由计算器计算得到,从而提高解答目标题目过程中的计算能力,进一步保证了解答目标题目过程中的逻辑推理能力的提高。

    图像中表格内容的提取方法、装置和电子设备

    公开(公告)号:CN117831053A

    公开(公告)日:2024-04-05

    申请号:CN202311870569.9

    申请日:2023-12-29

    Abstract: 本申请提供一种图像中表格内容的提取方法、装置和电子设备,涉及图像处理技术领域。该方法包括:在提取表格中的内容时,可以先获取待提取图像,待提取图像中包括目标表格,并基于待提取图像和关键词,从目标表格中提取关键词对应的目标内容;其中,目标内容包括表头内容、项目列内容或者行内容中的至少一种,表头内容中的表头项通过行方向单元格分隔符分隔、项目列内容中的项目列通过列方向单元格分隔符分隔,行内容中的内容通过行方向单元格分隔符分隔,这样基于分隔符可以较好地从目标表格中,提取出关键词对应的目标内容。

    平面几何证明题解答方法、装置、设备及存储介质

    公开(公告)号:CN117831049A

    公开(公告)日:2024-04-05

    申请号:CN202311871030.5

    申请日:2023-12-29

    Abstract: 本申请实施例公开了一种平面几何证明题解答方法、装置、设备及存储介质,将目标平面几何证明题转换为神经符号表达后,基于神经符号表达进行至少一步处理,得到目标平面几何证明题需要求证的目标;其中,在基于神经符号表达进行至少两步处理的情况下,在进行一步推理后,后续任一步的推理过程仅基于奖励值最大的推理路径上的所有几何条件(包括神经符号表达以及推理路径上产生的推理结果)进行推理,不再遍历所有推理路径上的几何条件,从而降低整个推理过程的数据量,进而提高平面几何证明题的自动解答效率。

    文字识别方法、装置、存储介质及电子设备

    公开(公告)号:CN116246278A

    公开(公告)日:2023-06-09

    申请号:CN202211637081.7

    申请日:2022-12-16

    Abstract: 本申请提供了一种文字识别方法、装置、存储介质及电子设备,涉及文字处理技术领域。该文字识别方法包括:对待识别字进行拆解,得到待识别字的偏旁序列,偏旁序列包括至少一个偏旁元素,至少一个偏旁元素组合构成待识别字;若至少一个偏旁元素均各自对应有书写模板,则确定至少一个偏旁元素各自的特征数据;确定至少一个偏旁元素各自对应的书写模板的特征数据;基于至少一个偏旁元素各自的特征数据和至少一个偏旁元素各自对应的书写模板的特征数据,确定待识别字对应的错别字识别结果。通过本申请中的方案,不仅能进行错字识别,也能进行别字和正确字识别,并且基于书写模板的特征数据,有效提高了待识别字的识别精度。

    一种文档转换模型的训练方法、文档转换方法及相关产品

    公开(公告)号:CN115659918A

    公开(公告)日:2023-01-31

    申请号:CN202211182079.5

    申请日:2022-09-27

    Abstract: 本申请公开了一种文档转换模型的训练方法、文档转换方法及相关产品。文档转换模型的训练方法中,待训练模型包括编码器网络和解码器网络,该方法包括:确定训练文档中的基础单元的结构信息;结构信息与基础单元的阅读顺序相关;通过编码器网络,从训练文档的转换图像中提取基础单元的视觉特征;基于视觉特征和结构信息,训练解码器网络,训练结束得到文档转换模型。由于基础单元的结构信息与阅读顺序相关,因此,通过提取基础单元的视觉特征,再基于视觉特征和结构信息训练解码器网络,即可考虑到文档的多样化结构,使模型具备阅读文档的能力,解码出正确的阅读顺序,而非单纯按照固定的阅读方式进行处理,从而实现复杂场景下的文档转换效果。

    一种问答方法、问答模型训练方法及相关装置

    公开(公告)号:CN119917608A

    公开(公告)日:2025-05-02

    申请号:CN202411763276.5

    申请日:2024-12-03

    Abstract: 本申请公开了一种问答方法、问答模型训练方法及相关装置,该方法包括:获取目标问题;利用经训练的问答模型基于目标问题,给出目标答案;其中,问答模型基于第一样本问题的至少两个预测答案进行迭代训练,至少两个预测答案的得分不同;预测答案的得分由经训练的分类模型得到,分类模型基于第二样本问题的样本参考答案和第二样本问题的样本预测答案进行迭代训练。通过上述方式,本申请能够提高目标答案的准确度。

    文档结构确定方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118114647A

    公开(公告)日:2024-05-31

    申请号:CN202410159255.6

    申请日:2024-02-04

    Abstract: 本申请提供了一种文档结构确定方法、装置、设备、存储介质及程序产品,具体实现方案为:对待解析文档进行版面解析,确定所述待解析文档中的各个建模单元的位置坐标;其中,所述建模单元包括段落、图像、表格、文档名称、页眉、页脚中的至少一项;基于所述各个建模单元的位置坐标,确定各个建模单元对应的文本内容和各个建模单元对应的类别信息;基于各个建模单元对应的文本内容和类别信息,确定所述待解析文档对应的文档结构根据本申请的技术方案,能够有效提升输出的文档结构的准确性。

    文本问答方法、视觉语言模型的训练方法及其相关装置

    公开(公告)号:CN117690144A

    公开(公告)日:2024-03-12

    申请号:CN202311580044.1

    申请日:2023-11-21

    Abstract: 本申请公开了一种文本问答方法、视觉语言模型的训练方法及其相关装置,该方法包括:获取目标文本图像以及关于目标文本图像的目标问题;利用视觉语言模型中的视觉编码器对目标文本图像进行视觉编码,得到第一目标特征;以及,利用视觉语言模型中的文本编码网络对目标文本图像进行文本编码,得到第二目标特征;利用视觉语言模型基于第一目标特征、第二目标特征和目标问题,得到目标问题的目标答案。通过上述方式,本申请能够提高问答准确率。

    文档结构化方法、装置、电子设备和存储介质

    公开(公告)号:CN113641746B

    公开(公告)日:2024-02-20

    申请号:CN202110961595.7

    申请日:2021-08-20

    Abstract: 本发明提供一种文档结构化方法、装置、电子设备和存储介质,所述方法包括:提取目标文档中各文本行的视觉特征;基于各文本行的视觉特征,对各文本行逐行进行结构关系解码和基于结构关系的结构化类型解码,得到各文本行之间的结构关系,以及各文本行的结构化类型;基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理。本发明基于目标文档中各文本行的视觉特征,确定各文本行之间的结构关系以及各文本行的结构化类型,并基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理,使得结构化处理后的目标文档能够准确表征有各文本行之间的空间结构信息,鲁棒性较高。

Patent Agency Ranking