-
公开(公告)号:CN114297145A
公开(公告)日:2022-04-08
申请号:CN202111563658.X
申请日:2021-12-20
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种IPFS节点本地基于关键词搜索文件的方法、介质及系统,包括步骤:S1索引提取,将文件解析元数据并使用TF‑IDF确定关键词,对文件建立索引七元组;S2获取该关键词倒排索引文件哈希,通过哈希在IPFS获取倒排索引文件,并将新的索引元组插入对应的倒排索引文件中,用新的倒排索引文件CID更新本地记录;S3关键词搜索时先比对缓存是否命中,若未命中则本地记录查找倒排索引CID,再根据CID在IPFS获取倒排索引文件,并将索引信息返回。本发明结合自然语言处理技术对文件提取主题词合成索引信息,对文件关键词建立倒排索引实现快速的关键词搜索,同时本地维护倒排索引CID将倒排索引文件存于IPFS有利于节省存储空间。