-
公开(公告)号:CN119128188A
公开(公告)日:2024-12-13
申请号:CN202411047653.5
申请日:2024-08-01
Applicant: 北京邮电大学
IPC: G06F16/532 , G06F16/583 , G06F18/22
Abstract: 本发明公开了一种基于大语言模型增强的文本‑行人检索方法,属于计算机和互联网领域;具体为:针对现有数据集中图像和文本的组合对,将原始文本数据划分为测试集和训练集;同时调用大语言模型对文本数据进行增强,生成增强文本;然后,将增强文本数据送入过滤模型,计算增强文本与原始文本之间的文本相似度;当文本相似度大于设定的阈值时,保留增强文本;反之,舍弃增强文本或重新生成文本。最后,将保留的增强文本数据集用于文本‑行人检索模型的训练或测试,并将测试后的文本‑行人检索模型用于进行人员识别。本发明显著提升了模型的检索性能,实现了更为精准的匹配。