文档检索方法、人机交互方法、电子设备及存储介质
摘要:
本申请公开了一种文档检索方法、人机交互方法、电子设备及存储介质,方法包括:提取文档的多模态表征信息,所述多模态表征信息包括视觉信息、文档布局信息以及文字信息;通过已训练的大语言模型,根据所述多模态表征信息获得提问问题的回复信息。通过将多种模态表征输入大语言模型,大语言模型在使用文字信息做问答预测过程中,可以根据文档的视觉信息和文档布局信息获得文档结构上的信息,能够更好的理解文档,从而提升大语言模型的问答效果。
0/0