-
公开(公告)号:CN118939764A
公开(公告)日:2024-11-12
申请号:CN202410935352.X
申请日:2024-07-12
Applicant: 上海计算机软件技术开发中心
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/211 , G06F18/22
Abstract: 本申请公开一种基于两阶段检索优化的检索增强生成方法、系统及设备,涉及自然语言处理领域,方法包括:获取用户查询文本及多个知识文档;确定每个知识文档的摘要实体关系三元组集合和句子向量集合;将用户查询文本拆分为多个子查询实体关系三元组;计算子查询实体关系三元组与摘要实体关系三元组集合的摘要检索得分,确定第一阶段检索结果;根据第一阶段检索结果判断是否进行文档全文检索,若进行文档全文检索,则进一步确定每个子查询实体关系三元组的最匹配句子集合,根据所有子查询实体关系三元组及每个子查询实体关系三元组的最匹配句子集合确定回答文本。本申请可拓展文档知识库的知识应用能力和场景,提高回答文本的生成效率和精度。