-
公开(公告)号:CN116384357A
公开(公告)日:2023-07-04
申请号:CN202310206235.5
申请日:2023-03-06
Applicant: 厦门大学
IPC: G06F40/183 , G06F40/289
Abstract: 本申请提出了一种基于序列到集合生成的表格生成方法及装置,该方法包括获取文本,并对文本进行分词处理;将分词处理后的文本输入到文本编码器进行编码,以得到编码后的文本特征向量表示;将文本特征向量表示输入到表头生成器进行解码,以得到表头和表头特征向量表示;将文本特征向量表示和表头特征向量表示输入到表体生成器进行解码,以并行的生成表体行;构建表格生成模型,并根据文本、表头和表体行进行训练,其中,训练过程中对预生成的表体行首列和训练目标首列进行一对一匹配;通过训练好的表格生成模型对预测文本进行预测,以生成对应的完整表格;由此,无需考虑行之间的顺序依赖关系,从而有效提高生成的效率和准确度。