-
公开(公告)号:CN119862276A
公开(公告)日:2025-04-22
申请号:CN202510338108.X
申请日:2025-03-21
Applicant: 之江实验室
IPC: G06F16/335 , G06F16/334 , G06F18/213 , G06N3/0455 , G06N3/084
Abstract: 本申请涉及一种文献检索方法、系统、计算机设备和存储介质,方法包括:提取训练数据的特征数据;构建至少一个优化损失函数,包括:根据特征域相同的特征数据之间的距离构建第一损失函数;根据特征域不同的特征数据之间的距离构建第二损失函数;将特征数据、扰动的特征数据输入编码器得到的第一压缩特征和第二压缩特征,根据第一压缩特征和第二压缩特征之间的距离构建第三损失函数;根据预测模型预测得到点击率的预测值、对应的真实值构建基础损失函数;根据至少一个优化损失函数和基础损失函数调整预测模型的参数;基于调整参数后的预测模型预测得到与目标用户请求关联的候选文献的点击率。采用本方法能够提高用户对文献点击率预测的准确性。
-
公开(公告)号:CN119293270A
公开(公告)日:2025-01-10
申请号:CN202411824060.5
申请日:2024-12-12
Applicant: 之江实验室
IPC: G06F16/41 , G06F16/435 , G06F16/483 , G06F18/22 , G06N5/022
Abstract: 本申请涉及一种图文搜索数据库的构建方法、装置、数据库以及存储介质。所述方法包括:对获取到的文献进行解析,提取得到所述文献的图像信息、文本信息;基于所述图像信息、所述文本信息,构建所述文献的至少一个图文对,所述图文对包括图像以及对应的图注文本;基于图像以及图注文本,生成图像的图像特征向量;从文本信息中提取所述文献的关键文本信息,基于关键文本信息,生成文献的文本特征向量;基于各文献的所述图像特征向量、所述文本特征向量,构建得到图文搜索数据库。采用本方法实现了融合文本、图像等多模态数据的文献特征提取,挖掘文献间的深层专业关联,能够提高天文领域进行图文搜索相关文献的准确率。
-