查询语句推荐方法及相关装置、设备和存储介质

    公开(公告)号:CN119066184A

    公开(公告)日:2024-12-03

    申请号:CN202411570789.4

    申请日:2024-11-06

    Abstract: 本申请公开了一种查询语句推荐方法及相关装置、设备和存储介质,其中,查询语句推荐方法包括:将参考查询语句中目标分词替换所属分词类型,得到模板查询语句;基于各个模板查询语句进行聚类,得到若干语句集合;基于相同语句集合内各个模板查询语句分别所替换的目标分词,组合得到对应语句集合的分词集合;基于目标查询语句中核心实体词与各个语句集合的分词集合进行匹配,得到对应语句集合的匹配结果;其中,目标查询语句为本次查询时输入至智能对话系统的查询语句;在参考各个语句集合的匹配结果所选择的语句集合内,选择至少一个模板查询语句得到推荐查询语句。上述方案,能够提升查询语句推荐的质量,并降低查询语句推荐的成本和耗时。

    医疗报告信息提取方法、系统、电子设备和可读存储介质

    公开(公告)号:CN118675713A

    公开(公告)日:2024-09-20

    申请号:CN202410849752.9

    申请日:2024-06-27

    Abstract: 本申请公开了一种医疗报告信息提取方法、系统、电子设备和可读存储介质,该方法包括:响应于得到医疗报告对应的待处理图像,对待处理图像进行编码,得到待处理图像对应的图像特征向量;获取与待处理图像中的要素类别相匹配的提示信息,基于提示信息对图像特征向量进行全局解码,得到待处理图像中要素类别及其对应的位置信息;其中,多种要素类别是基于待处理图像中的信息项预先定义的;基于要素类别及其对应的位置信息对图像特征向量进行要素解码,得到待处理图像中要素类别对应的要素提取信息。通过上述方式,本申请能够提高信息提取的准确率。

    一种公式识别方法、装置、存储介质及设备

    公开(公告)号:CN113095314B

    公开(公告)日:2024-07-09

    申请号:CN202110372899.X

    申请日:2021-04-07

    Inventor: 朱辉辉 张建树

    Abstract: 本申请公开了一种公式识别方法、装置、存储介质及设备,该方法包括:首先获取包含待识别的目标公式的目标图像,提取目标图像的图像特征;然后根据该图像特征,按照预设的公式空间结构关系,对目标公式进行识别,得到目标公式的空间结构信息;并按照预设的基于深度学习的解码方法,对目标公式进行解码,得到目标公式的解码结果;接着,根据目标公式的空间结构信息和目标公式的解码结果,确定目标公式的最终识别结果。可见,本申请是按照预设的公式空间结构关系和基于深度学习的解码方法分别对目标公式进行识别和解码,再综合得到的空间结构信息和解码结果确定最终识别结果,充分考虑了空间结构信息对公式识别结果的影响,提高了识别结果的准确率。

    答题模型的训练方法、答题方法及装置

    公开(公告)号:CN117744765A

    公开(公告)日:2024-03-22

    申请号:CN202311758346.3

    申请日:2023-12-19

    Abstract: 本发明提供一种答题模型的训练方法、答题方法及装置,其中,训练方法包括:获取预训练数据、第三试题图像及其对应的第三试题文本和第三答案文本;预训练数据包括第一试题文本及其对应的第一答案文本,以及第二试题图像及其中各文本行的位置和文本内容,基于预训练数据对初始模型进行训练,得到预训练模型;基于预训练模型,确定第三试题图像对应的预测试题文本和预测答案文本;基于第三试题图像对应的预测试题文本和预测答案文本,以及第三试题文本和第三答案文本进行模型微调,得到答题模型,克服了目前答题方案无法对包含图像的题目进行答题的缺陷,通过训练后的答题模型实现了对任意题型题目的有效作答,保证了答题准确性,提升了答题效率。

    版面分析方法、装置、计算机设备和存储介质

    公开(公告)号:CN113807218A

    公开(公告)日:2021-12-17

    申请号:CN202111033018.8

    申请日:2021-09-03

    Abstract: 本申请涉及一种版面分析方法、装置、计算机设备和存储介质。方法包括:获取目标文本图像中每一文本行的空间转换特征、位置特征及图像特征;根据每一文本行的空间转换特征与位置特征,获取每一文本行的关系编码特征,将每一文本行的关系编码特征与每一文本行的图像特征进行拼接,得到每一文本行的融合特征;对每一文本行的融合特征进行解码,得到每一文本行的版面信息类型。由于同时结合了空间转换特征及图像特征对文本图像的内容进行理解,而不是单一基于一种特征,从而分析结果比较精准。另外,每一文本行在分析时均结合了图像特征及空间转换特征,在其中一项特征识别错误的情况下,另一项特征也能够作为分析依据,从而提高了版面分析的容错率。

    文档结构化方法、装置、电子设备和存储介质

    公开(公告)号:CN113641746A

    公开(公告)日:2021-11-12

    申请号:CN202110961595.7

    申请日:2021-08-20

    Abstract: 本发明提供一种文档结构化方法、装置、电子设备和存储介质,所述方法包括:提取目标文档中各文本行的视觉特征;基于各文本行的视觉特征,对各文本行逐行进行结构关系解码和基于结构关系的结构化类型解码,得到各文本行之间的结构关系,以及各文本行的结构化类型;基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理。本发明基于目标文档中各文本行的视觉特征,确定各文本行之间的结构关系以及各文本行的结构化类型,并基于各文本行之间的结构关系,以及各文本行的结构化类型,对目标文档进行结构化处理,使得结构化处理后的目标文档能够准确表征有各文本行之间的空间结构信息,鲁棒性较高。

    一种公式识别方法、装置、存储介质及设备

    公开(公告)号:CN113095314A

    公开(公告)日:2021-07-09

    申请号:CN202110372899.X

    申请日:2021-04-07

    Inventor: 朱辉辉 张建树

    Abstract: 本申请公开了一种公式识别方法、装置、存储介质及设备,该方法包括:首先获取包含待识别的目标公式的目标图像,提取目标图像的图像特征;然后根据该图像特征,按照预设的公式空间结构关系,对目标公式进行识别,得到目标公式的空间结构信息;并按照预设的基于深度学习的解码方法,对目标公式进行解码,得到目标公式的解码结果;接着,根据目标公式的空间结构信息和目标公式的解码结果,确定目标公式的最终识别结果。可见,本申请是按照预设的公式空间结构关系和基于深度学习的解码方法分别对目标公式进行识别和解码,再综合得到的空间结构信息和解码结果确定最终识别结果,充分考虑了空间结构信息对公式识别结果的影响,提高了识别结果的准确率。

    题目解答方法、装置、设备及程序产品

    公开(公告)号:CN119990313A

    公开(公告)日:2025-05-13

    申请号:CN202510056782.9

    申请日:2025-01-14

    Abstract: 本申请涉及数据处理技术领域,具体涉及一种题目解答方法、装置、设备及程序产品。方法包括:将目标题目输入答题模型,获得答题模型输出的初始答复,其中,初始答复包括至少一个答题步骤;将目标题目和初始答复输入评语模型,获得评语模型输出的评语,其中,评语包括对初始答复中各个答题步骤的评价信息;基于评语对初始答复进行修正,获得目标题目对应的目标答复,其中,答题模型为大语言模型基于至少一对第一问答对进行训练后得到的,第一问答对中的第一答案包括基于评语模型输出的第一评语进行修正后得到的答案。本申请能够通过评语,实现在答题步骤的层面对模型输出的答案进行修正,获得正确度更高的题目答案。

    表格图像处理方法、相关设备及可读存储介质

    公开(公告)号:CN114255346B

    公开(公告)日:2025-01-07

    申请号:CN202111646060.7

    申请日:2021-12-29

    Inventor: 张镇荣 张建树

    Abstract: 本申请公开了一种表格图像处理方法、相关设备及可读存储介质,在获取待处理的表格图像之后,先对该表格图像进行分割,得到该表格图像对应的基础网格单元,然后,确定出各基础网格单元的视觉特征以及各基础网格单元的文本语义特征,再基于各基础网格单元的视觉特征以及各基础网格单元的文本语义特征,确定各基础网格单元的结构信息,最后,根据各基础网格单元的结构信息,生成该表格图像对应的表格。本方案中,在将表格图像转化为表格时,同时考虑了表格图像的视觉信息以及文本语义信息,相对于仅利用表格图像的视觉信息转化表格,提升了转化的表格的精度。

Patent Agency Ranking