-
公开(公告)号:CN114036256A
公开(公告)日:2022-02-11
申请号:CN202111313226.3
申请日:2021-11-08
Applicant: 北京环境特性研究所
IPC: G06F16/31 , G06F16/332 , G06F40/216 , G06F40/289
Abstract: 本发明提供了一种基于Solr的非结构化文件检索方法、装置、设备及存储介质,其中方法包括:预先利用Solr搜索服务器对数据库中待索引的非结构化文件进行索引处理,生成索引信息表;所述索引信息表包括关键词与非结构化文件编号的索引关系;该索引关系中的关键词位于与该索引关系中的非结构化文件编号所对应的非结构化文件中;当接收用户发起的检索请求,根据所述检索请求确定检索关键词;基于所述索引信息表包括的索引关系,确定与所述检索关键词对应的非结构化文件编号;根据确定的非结构化文件编号返回检索结果。本方案,能够适应被检索数据库更加庞大的数据量的同时,有效提高非结构化文件的检索效率。
-
公开(公告)号:CN114036256B
公开(公告)日:2024-05-31
申请号:CN202111313226.3
申请日:2021-11-08
Applicant: 北京环境特性研究所
IPC: G06F16/31 , G06F16/332 , G06F40/216 , G06F40/289
Abstract: 本发明提供了一种基于Solr的非结构化文件检索方法、装置、设备及存储介质,其中方法包括:预先利用Solr搜索服务器对数据库中待索引的非结构化文件进行索引处理,生成索引信息表;所述索引信息表包括关键词与非结构化文件编号的索引关系;该索引关系中的关键词位于与该索引关系中的非结构化文件编号所对应的非结构化文件中;当接收用户发起的检索请求,根据所述检索请求确定检索关键词;基于所述索引信息表包括的索引关系,确定与所述检索关键词对应的非结构化文件编号;根据确定的非结构化文件编号返回检索结果。本方案,能够适应被检索数据库更加庞大的数据量的同时,有效提高非结构化文件的检索效率。
-