基于自然语言描述表格的检索增强生成方法

    公开(公告)号:CN118966159A

    公开(公告)日:2024-11-15

    申请号:CN202410943600.5

    申请日:2024-07-15

    Inventor: 孟毓 牟艳莉 朱磊

    Abstract: 本发明公开了基于自然语言描述表格的检索增强生成方法;用于将包括两层以上层级列名和/或两层以上层级行名的表格转化为仅有单层级列名和/或单层级行名的表格;包括如下步骤;1、导入需要转换的包括两层以上层级列名和/或两层以上层级行名的表格作为原始表格;2、建立一个数据区与原始表格的数据区完全相同,但仅有单层级列名和/或单层级行名,且存储每一列名或每一行名所在单元格均为空白的结果表格;3、通过文档解析工具提取原始表格中的内容,对结果表格中空白的每一列名或者每一行名的单元格进行填充。本发明对表格进行转化,将多层次复杂的列名或行名,逐层降维拆解,再以自然语言描述形式组合重建成单层的列名或行名。

Patent Agency Ranking