基于伪反馈与TF-IDF的查询词扩展方法

    公开(公告)号:CN108062355B

    公开(公告)日:2020-07-31

    申请号:CN201711179719.6

    申请日:2017-11-23

    Abstract: 本发明公开了一种基于伪反馈与TF‑IDF的查询词扩展方法,该方法主要通过科学的查询约束词选取,通过本发明提出的两次筛选得到最终可用来做查询词扩展的词,然后通过本发明提出的打分公式为文档进行打分和排序操作。本发明的特色在于提出了一种新的查询约束词选取方式以及候选词的选取方式,并做了两次筛选操作去除无关词。还结合了传统的BM25打分公式,发明一个新的专为查询词扩展的新打分公式,能够更加科学的将查询词扩展后的结果文档进行打分,从而得出更科学的搜索排序结果。

    基于伪反馈与TF-IDF的查询词扩展方法

    公开(公告)号:CN108062355A

    公开(公告)日:2018-05-22

    申请号:CN201711179719.6

    申请日:2017-11-23

    Abstract: 本发明公开了一种基于伪反馈与TF‑IDF的查询词扩展方法,该方法主要通过科学的查询约束词选取,通过本发明提出的两次筛选得到最终可用来做查询词扩展的词,然后通过本发明提出的打分公式为文档进行打分和排序操作。本发明的特色在于提出了一种新的查询约束词选取方式以及候选词的选取方式,并做了两次筛选操作去除无关词。还结合了传统的BM25打分公式,发明一个新的专为查询词扩展的新打分公式,能够更加科学的将查询词扩展后的结果文档进行打分,从而得出更科学的搜索排序结果。

Patent Agency Ranking