-
公开(公告)号:CN103902694B
公开(公告)日:2017-04-12
申请号:CN201410122930.4
申请日:2014-03-28
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明涉及一种基于聚类和查询行为的检索结果排序方法,包括如下步骤:计算文档与查询的相关度,选取候选文档集合;对候选文档集合进行聚类分析,计算每个聚类与查询的相关度;根据文档的相关度和文档所在聚类的相关度,计算文档的排序Rank(di);根据用户点击文档的反馈信息更新文档的相关度和聚类的相关度;更新文档的排序Rank(di)。本发明能够根据用户的点击行为,挖掘用户查询所蕴含的各种潜在意图,可以动态的调整文档的排列顺序,从而更好地满足了用户的多样化需求。
-
公开(公告)号:CN104133897A
公开(公告)日:2014-11-05
申请号:CN201410374437.1
申请日:2014-08-01
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F17/2785 , G06F17/30864
Abstract: 本发明属于话题溯源范畴语义社会网络中的数据挖掘领域,具体涉及一种基于话题影响力的微博话题溯源方法。本发明包括:根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题;确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN;根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头。本发明使话题溯源递推的终止条件更加准确,溯源更加准确有效。
-
公开(公告)号:CN101499981B
公开(公告)日:2014-10-22
申请号:CN200910071577.0
申请日:2009-03-19
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种电子邮件网关类系统邮件帐户维护的方法。使用POP3协议和SMTP协议探测邮件帐户信息,并将有效账户信息存储在动态散列表中,通过时间滑动窗口维护信息的有效性,这样当发现投递失败的邮件则将其从散列表中丢弃,对于新增加的用户在经过滑动窗口的等待时间以后在重新进行探测。在固定周期内,将散列结构存储到文件系统中,防止信息丢失,在系统意外重起时,可以直接从文件加载。本发明的有点在于:1)可以帮助邮件网关过滤掉大量账户不存在的邮件信息,降低了网关的负担,提高网关系统的利用率;2)支持在一个邮件网关中,同时管理多个邮件系统,减少了系统的部署成本。
-
公开(公告)号:CN102768670B
公开(公告)日:2014-08-20
申请号:CN201210176912.5
申请日:2012-05-31
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明提供的是一种基于节点属性标签传播的网页聚类方法。依据网页的链接关系构造拓扑结构图模型;为图模型中每个节点构建属性特征向量;初始化网络中的节点标签;依据拓扑结构及节点属性迭代更新节点的标签;定义停止更新节点标签的条件。本发明无需了解网页分组的数量和规模等先验知识或者预先定义临界值等参数,只需提取互联网络的拓扑关系及标记网页特征的属性信息,就可以在近乎线性的时间内有效地、高质量地实现网页的聚类。由于该算法概念简单,易于理解及实现,具有较低的时间复杂度,且能够产生优质的网络聚类结果,因此适用于规模庞大的互联网络。
-
公开(公告)号:CN103902694A
公开(公告)日:2014-07-02
申请号:CN201410122930.4
申请日:2014-03-28
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F17/30705
Abstract: 本发明涉及一种基于聚类和查询行为的检索结果排序方法,包括如下步骤:计算文档与查询的相关度,选取候选文档集合;对候选文档集合进行聚类分析,计算每个聚类与查询的相关度;根据文档的相关度和文档所在聚类的相关度,计算文档的排序Rank(di);根据用户点击文档的反馈信息更新文档的相关度和聚类的相关度;更新文档的排序Rank(di)。本发明能够根据用户的点击行为,挖掘用户查询所蕴含的各种潜在意图,可以动态的调整文档的排列顺序,从而更好地满足了用户的多样化需求。
-
公开(公告)号:CN103838806A
公开(公告)日:2014-06-04
申请号:CN201310470139.8
申请日:2013-10-10
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F17/30979
Abstract: 本发明涉及的是一种社会网络用户参与主题的行为分析方法。本发明包括:定义主题相似性,关键词相似性,并建立“用户—主题—关键词”三个层次的网络模型;设计具有最大区分度的“关键词”选择算法;给出用户行为分析的相关定义和计算公式,具体包括:用户主动参与主题行为,被动参与主题行为,主题传播力以及主题影响力,并对用户参与主题的行为进行分析。本发明用网络模型完整的记录了用户在社会网络中的行为,并设计了具有最大区分度的关键词选择算法,保证了用户行为分析的效率。
-
公开(公告)号:CN103324707A
公开(公告)日:2013-09-25
申请号:CN201310241385.6
申请日:2013-06-18
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于半监督聚类的查询扩展方法,包括如下步骤:(1)查询似然估计语言模块对用户查询进行初次检索,返回检索结果的前n个文档;(2)对初次检索结果中的前k个文档进行人工标注,分成相关文档集与不相关文档集两类;(3)通过约束和距离融合的半监督聚类算法对前n个文档进行分析,提取与查询相关的文档作为反馈文档;(4)根据反馈文档,用扩展词选取模块选取扩展词,将扩展词和原始查询组成新的查询。本发明通过对少量标注文档与查询相关性的学习,能够较准确的估计出大量未知文档与查询的相关性,提高了反馈文档的质量,从而有效的提高了检索的查全率和查准率。
-
公开(公告)号:CN102158372B
公开(公告)日:2013-06-05
申请号:CN201110093278.4
申请日:2011-04-14
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种分布式系统异常检测方法。确定测度属性的关联度,并生成测度属性关系网络模型;构建测度属性关系网络划分模型;构建基于测度属性关系网络划分的分布式系统异常检测模型,并利用该模型进行异常检测。本发明可以动态的增量式更新分布式系统的测度属性关系网络的划分结果,并构建基于测度属性网络划分的分布式系统异常检测模型。
-
公开(公告)号:CN102111295B
公开(公告)日:2013-05-29
申请号:CN201110001347.4
申请日:2011-01-06
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种分布式系统中多层次测度网络关系构建方法。根据测度属性的类型对测度参数进行分层;构造任意两个测度属性对之间的概率转移矩阵;构建同一个层次中测度属性的网络关系模型;构建不同层次间测度参数的网络关系模型。本发明的优点在于:可以动态的更新分布式系统的测度参数之间的转移关系,并构建测度参数的立体层次网络模型。
-
公开(公告)号:CN100541495C
公开(公告)日:2009-09-16
申请号:CN200710072608.5
申请日:2007-08-03
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明提供的是一种个性化搜索引擎的搜索方法。本搜索方法由信息抓取模块、信息检索模块和用户个性分析模块三部分连接组成,其中信息抓取模块由抓取程序和索引程序组成,因特网信息资源和Web库接入信息抓取模块,信息抓取模块的输出连接用户个性分析模块,用户兴趣记录与查询关键字输入信息检索模块,信息检索模块与用户个性分析模块,信息检索模块与用户个性分析模块结合提供个性化检索服务。本发明的服务器端不需要增加存储开销,充分利用客户端的资源来实现个性化的搜索。通过客户端的存储与服务器端的用户行为跟踪引擎的结合,本发明给出了针对用户不同需求,符合用户兴趣的个性化搜索引擎的解决方案。
-
-
-
-
-
-
-
-
-