一种融合主题模型的图书馆平台语义检索方法

    公开(公告)号:CN115329038A

    公开(公告)日:2022-11-11

    申请号:CN202210917286.4

    申请日:2022-08-01

    Abstract: 本发明涉及信息检索技术领域,具体是一种融合主题模型的图书馆平台语义检索方法,包括对所有被检索的文档进行数据预处理,得到合格的被检索文档;利用布尔模型将用户的检索词语与合格的被检索文档进行匹配,根据匹配结果将文档分类并赋予不同的权重值;利用主题模型对合格的被检索文档进行计算,得到每个文档的主题分布和主题单词的分布;将主题单词的频数分布转换为单词主题分布;计算检索词的单词主题分布与被检索文档的之间的相似性分数;利用文档权重与相似性分数计算检索词与各个被检索文档的联系分数,并根据联系分数进行排序后将查询结果返回给用户。本发明可以大大提高图书馆平台语义检索效率,有效满足用户检索知识服务的需求。

    一种基于用户文本生成内容的小众偏好学习方法

    公开(公告)号:CN116340498A

    公开(公告)日:2023-06-27

    申请号:CN202310127387.6

    申请日:2023-02-17

    Abstract: 本发明公开了信息检索领域的一种基于用户文本生成内容的小众偏好学习方法,包括以下步骤:对于获取到的用户文本生成内容进行数据预处理操作;将预处理得到的数据建立一个分层贝叶斯模型,得到联合分布模型;通过吉布斯抽样方法学习模型参数,得到大众偏好分布和小众偏好分布公式;利用学习到的模型参数,分析基于用户文本生成内容的用户小众偏好的含义;利用用户小众偏好分布寻找小众偏好下的目标用户。本发明方法从用户偏好的角度,区分了大众偏好和小众偏好,利用分层贝叶斯方法良好的可解释性,识别用户小众偏好的具体含义,为中小企业提供了进入合适小众市场的机会,同时每个用户的小众偏好分布有益于企业找出相关小众市场的目标用户。

Patent Agency Ranking