-
公开(公告)号:CN116501843A
公开(公告)日:2023-07-28
申请号:CN202310165171.9
申请日:2023-02-21
Applicant: 清华大学
IPC: G06F16/332 , G06F16/9535 , G06F16/958 , G06F18/214 , G06N3/092
Abstract: 本发明公开了一种面向人类偏好的高效网络检索增强回答方法及系统,该方法包括:利用预设的网络搜索引擎获取网络网页中与问题对应的候选答案;利用检索模型得到候选参考资料;通过语言模型的语境学习生成基于候选参考资料的问答数据集,将问答数据集中语言模型对候选参考资料的采用信息作为标签训练检索模型,并通过问答数据集微调语言模型,以通过训练好的语言模型根据候选参考资料生成问题答案;根据用户对问题答案的反馈数据建立人类偏好感知的评分器,以根据训练好的评分器得到所述问题答案的优化结果。本发明通过网络搜索与召回技术来增强预训练的语言模型,以实现真实场景下的应用部署,同时维持高系统效率与低部署成本。