一种结合语义分割和序列预测的通用表格识别方法和装置

    公开(公告)号:CN116311310A

    公开(公告)日:2023-06-23

    申请号:CN202310566244.5

    申请日:2023-05-19

    Abstract: 本发明公开了一种结合语义分割和序列预测的通用表格识别方法和装置,该方法综合使用YOLO、VGG、UNet、SLANet、DBNet、SVTR深度学习模型,结合以语义分割为基础的两阶段方案与以序列预测为基础的端到端方案,可用于图片格式的各类表格识别,包括有线表、少线表和无线表。该方法可识别表格中的结构信息以及文本信息。可识别包含表格的图片类型包括扫描图片和从任意角度拍摄的图片。本发明训练一个目标检测模型同时用于表格检测和表格分类,并针对现有表格识别方法对有线表识别不准的问题,提出了一种简单有效的合并单元格的方法,在TableBank数据集上比端到端的方案在TEDS指标上提高了9.34个百分点(79.24%)。

    一种基于语义的多源表格自动匹配方法、装置及存储介质

    公开(公告)号:CN117252183B

    公开(公告)日:2024-04-02

    申请号:CN202311285984.8

    申请日:2023-10-07

    Abstract: 本说明书公开了一种基于语义的多源表格自动匹配方法、装置及存储介质,首先获取两个待匹配的表格,针对每个待匹配的表格,确定该表格的结构和该表格中实体单元格的语义以及列类型。根据每个表格的列类型,进行初步匹配得到初步匹配结果,并将初步匹配结果中存在匹配关系的列作为目标列,计算目标列之间的第一相似度和第二相似度,确定两个表格中的目标列是否匹配。从上述方法中可以看出,本申请对两个表格进行相似度匹配前,先确定出了表格语义和列类型,以对全表格的语义信息进行解析,在语义信息的基础上进行相似度匹配,使得多源表格相似度匹配更加高效准确,方便后续对多源表格进行关联分析。

    一种基于大语言模型的智能对话方法、装置、介质及设备

    公开(公告)号:CN117076650B

    公开(公告)日:2024-02-23

    申请号:CN202311328288.0

    申请日:2023-10-13

    Abstract: 在本说明书提供的基于大语言模型的智能对话方法,根据用户输入的第一文本的分类结果,确定不同的对话方法,当用户输入的第一文本为非知识类文本时,将第一文本输入第三方大语言模型确定返回用户的目标文本。当用户输入的第一文本为知识类文本时,对第一文本进行本地搜索和线上搜索,再将第一文本和所有的搜索结果输入本地大语言模型,确定返回用户的目标文本,若不存在关联度大于预设值的检索结果,则将第一文本输入第三方大语言模型,将第三方大语言模型的输出结果作为返回用户的目标文本。通过在系统中融合若干个本地模型,减少了对第三方大语言模型的调用,降低了智能对话系统的使用成本的同时,也降低了智能对话过程的时延。

    一种机器阅读方法、装置、存储介质及电子设备

    公开(公告)号:CN116720008B

    公开(公告)日:2024-01-09

    申请号:CN202311010113.5

    申请日:2023-08-11

    Abstract: 本说明书公开了一种机器阅读方法、装置、存储介质及电子设备。在采用本说明书提供的机器阅读方法,确定目标问题的目标答案时,可通过搜索引擎获取目标问题的候选文本,并以匹配度计算的方式确定出与目标问题匹配的匹配文本;通过预先训练的阅读模型以及生成式模型,根据目标问题与匹配文本,分别得到第一候选答案和第二候选答案;最终根据目标问题与各候选答案之间的相似度确定出最终的候选答案并回复给用户。在采用本方法时可无需预先设置具有庞大数据量的问答模板以及知识库等内容,实施成本较低,且能够适用于多种不同的场景,灵活性较强。

    一种基于语义的多源表格自动匹配方法、装置及存储介质

    公开(公告)号:CN117252183A

    公开(公告)日:2023-12-19

    申请号:CN202311285984.8

    申请日:2023-10-07

    Abstract: 本说明书公开了一种基于语义的多源表格自动匹配方法、装置及存储介质,首先获取两个待匹配的表格,针对每个待匹配的表格,确定该表格的结构和该表格中实体单元格的语义以及列类型。根据每个表格的列类型,进行初步匹配得到初步匹配结果,并将初步匹配结果中存在匹配关系的列作为目标列,计算目标列之间的第一相似度和第二相似度,确定两个表格中的目标列是否匹配。从上述方法中可以看出,本申请对两个表格进行相似度匹配前,先确定出了表格语义和列类型,以对全表格的语义信息进行解析,在语义信息的基础上进行相似度匹配,使得多源表格相似度匹配更加高效准确,方便后续对多源表格进行关联分析。

    一种机器阅读方法、装置、存储介质及电子设备

    公开(公告)号:CN116720008A

    公开(公告)日:2023-09-08

    申请号:CN202311010113.5

    申请日:2023-08-11

    Abstract: 本说明书公开了一种机器阅读方法、装置、存储介质及电子设备。在采用本说明书提供的机器阅读方法,确定目标问题的目标答案时,可通过搜索引擎获取目标问题的候选文本,并以匹配度计算的方式确定出与目标问题匹配的匹配文本;通过预先训练的阅读模型以及生成式模型,根据目标问题与匹配文本,分别得到第一候选答案和第二候选答案;最终根据目标问题与各候选答案之间的相似度确定出最终的候选答案并回复给用户。在采用本方法时可无需预先设置具有庞大数据量的问答模板以及知识库等内容,实施成本较低,且能够适用于多种不同的场景,灵活性较强。

    一种矛盾调解方案推荐与评分系统及方法

    公开(公告)号:CN116843162B

    公开(公告)日:2024-02-09

    申请号:CN202311083864.X

    申请日:2023-08-28

    Abstract: 本发明公开了一种矛盾调解方案推荐与评分系统及方法,包括:矛盾案例录入模块,获取矛盾纠纷调解相关的案情描述、解决方案、处理机构、调解类型、评分等原始数据;数据清洗模块,对上述原始数据做清洗预处理操作;深度学习建模模块,基于已有预处理过的数据,训练深度学习模型;事件调解分配处理模块,根据案件复杂程度分配人工处理或自动化推荐方案,为矛盾事件当事人预分配处理窗口;矛盾纠纷解决方案推荐模块,为矛盾调解员提供纠纷解决方案推荐;解决方案评分模块,对调解人员给出的调解方案评分。本发明能够提高矛盾调解员案件处理效率,帮助案件当事人及时解决矛盾纠纷问题。(56)对比文件CN 114003721 A,2022.02.01Heiko Müller, Ulf Leser, Johann-Christoph Freytag.Mining for Patterns inContradictory Data.2004,51-58.金涌涛.基于深度学习的社会矛盾纠纷事件分类的 研究与应用.中国优秀学位论文库.2021,1-57.Alexander Borgida.Modeling ClassHierarchies with Contradictions.1988,434-443.党振兴.人工智能与家事调解融合发展对策研究.海峡法学.2019,(第04期),全文.

    一种基于表格语义注释的数据库检索方法、装置以及设备

    公开(公告)号:CN117033469B

    公开(公告)日:2024-01-16

    申请号:CN202311285986.7

    申请日:2023-10-07

    Abstract: 在本说明书公开了一种基于表格语义注释的数据库检索方法、装置以及设备,根据训练完成的表格语义注释模型对数据库中各原始表格进行语义注释,得到第二语义注释表格,即确定原始表格中各实体单元格的语义以及该表格中各列的列类型。然后响应于用户的检索指令,对用户的检索指令进行文本预处理,并计算经过文本预处理后的检索指令与第二语义注释表格计算相似度,按照相似度从大到小的顺序筛选语义注释后的表格,将筛选出的第二语义注释表格对应的原始表格作为检索结果。使得数据库检索可根据表格的语义信息进行相似度匹配,提高了数据库检索的召回率和准确率。

Patent Agency Ranking