-
公开(公告)号:CN118586373A
公开(公告)日:2024-09-03
申请号:CN202410335145.0
申请日:2024-03-22
Applicant: 中国科学院信息工程研究所
IPC: G06F40/186 , G06F40/109 , G06F40/166 , G06F40/30
Abstract: 本发明公开了一种基于布局感知的文档合成方法及装置,涉及文档数据处理领域,对布局生成模型生成的布局进行质量评估、筛选和校正,根据校正的布局创建文档融合模板,根据文档融合模板进行文本容量预估;基于约束条件构建提示语,输入到LLM模型学习生成符合约束条件的文本;根据文档融合模板的布局元素进行文本自适应处理和图表自适应选择;将文本和图表按照文档融合模板的布局结构进行填充融合,生成合成文档。本发明从布局结构和语义信息两方面对合成文档的仿真性和可用性进行了提高,解决了当前合成文档技术中存在的问题,具有良好的效果。