-
公开(公告)号:CN107562778A
公开(公告)日:2018-01-09
申请号:CN201710599251.X
申请日:2017-07-21
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于偏离特征的离群点挖掘方法,包括以下步骤:(1)将数据集的各个维度划分为h个等间距的间隔,则整个数据集被划分为hd个网格;(2)将每个数据点与网格索引做一个关联,如果一个网格中不包含数据点,则不考虑该网格;(3)对于划分形成的空间中的各个网格,求出网格的质心,并计算质心的局部离群因子;(4)计算每个数据对象的局部离群因子,数据集中对象的局部离群因子等于所属网格质心的离群因子。本发明在检测数据集中的离群点时,采用F_LOF检测算法将数据空间划分为网格,基于网格的质心来计算数据点的局部离群因子,降低了计算时间,提高检测效率,表现出了其优越性。
-
公开(公告)号:CN107194468A
公开(公告)日:2017-09-22
申请号:CN201710259763.1
申请日:2017-04-19
Applicant: 哈尔滨工程大学
IPC: G06N99/00
CPC classification number: G06N20/00
Abstract: 本发明提供的是一种面向情报大数据的决策树增量学习方法。在分裂结点之前,把结点中每个候选属性的多个属性值分别合并成两组,选择信息增益最大的候选属性将结点分为两个分支。在选择下一个将要分裂的结点方面,为所有候选分裂结点计算对应的结点分裂度量值,并且总是选择结点分裂度量值最大的候选结点作为下一个分裂结点。IID5R增加了评估分类属性质量的功能。本发明将NOLCDT与IID5R相结合,提出了一个混合分类器算法HCS,主要有两个阶段组成:构建初始决策树和增量学习。根据NOLCDT建立初始决策树,然后使用IID5R进行增量学习。HCS算法综合了决策树以及增量学习方法的优点,既便于理解又适于增量学习。
-
公开(公告)号:CN106066873A
公开(公告)日:2016-11-02
申请号:CN201610369838.7
申请日:2016-05-30
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 一种基于本体的旅游信息推荐方法,本发明涉及基于本体的旅游信息推荐方法。本发明的目的是为了解决现有旅游推荐结果不准确以及推荐呈现静态化的问题。具体过程为:一、构建旅游景点本体;二、采用FP‑Growth算法挖掘用户之间的关联规则;三、采用关联规则的阈值将用户分为关联用户和无规则用户;四、将关联用户采用融入时间因子和评价因子的协同过滤算法,生成景点推荐;五、将无规则用户采用基于旅游景点本体的协同过滤算法,生成景点推荐;六、将四和五的旅游景点推荐结果进行融合;七、将融合的结果进行上下文信息过滤;八、将过滤后的结果进行基于旅游景点本体的信息拓展。本发明用于旅游信息推荐领域。
-
公开(公告)号:CN106021297A
公开(公告)日:2016-10-12
申请号:CN201610289513.8
申请日:2016-05-04
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F17/30908
Abstract: 基于上下文感知和复杂语义关联的数据空间建模方法,本发明涉及数据空间建模方法。本发明的目的是为了解决现有方法存在以下缺陷:1)上下文感知性较弱;2)语义关系表达能力弱;3)语义关联推理能力弱。通过以下技术方案实现的:步骤一、构建一种半结构化图模型,称之为上下文感知的复杂语义关联网络模型COSAN;步骤二、根据上下文感知的复杂语义关联网络模型COSAN表示上下文感知的解释对象;步骤三、根据上下文感知的解释对象得出上下文感知的基本语义关联和复杂多元语义关联;步骤四、根据上下文感知的基本语义关联和复杂多元语义关联得出语义关联推理规则。本发明应用于数据空间建模领域。
-
公开(公告)号:CN105869054A
公开(公告)日:2016-08-17
申请号:CN201610169250.7
申请日:2016-03-23
Applicant: 哈尔滨工程大学
IPC: G06Q50/00
CPC classification number: G06Q50/01
Abstract: 基于三度影响力原则的社会网络影响力最大化的方法,涉及社会网络科学领域,尤其涉及一种基于三度影响力原则的社会网络影响力最大化的方法。本发明要解决社会网络影响力实现最大化时,现有方法运行时间短时存在运算精度低的问题,而在保证运算精度时,又存在运行时间超长的问题。本发明按以下步骤进行:一、输入社会网络的节点集合以及节点间的关系集合;二、针对社会网络里的每个节点,计算出节点的一度节点集合;三、针对社会网络里的每个节点,计算出节点的二度节点集合;四、针对社会网络里的每个节点,计算出节点的三度节点集合;五、针对社会网络里的每个节点,计算出节点的线性衰减度中心性值。本发明应用于社会网络科学领域。
-
公开(公告)号:CN105868336A
公开(公告)日:2016-08-17
申请号:CN201610182802.8
申请日:2016-03-28
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 路网中面向集合的空间关键词查询方法,属于空间关键词查询技术领域。本发明的提出是为了实现对于用户的提出的空间关键词查询能够快速返回多条最佳路线供用户选择。技术要点:本发明所提出的路网中面向集合受查询方向约束的空间关键词查询给出了两种情况,即面向无主关键词的查询和主关键词优先的查询。无主关键词的查询即从查询点出发按照道路网在可查询范围内扩展查询。主关键词优先的查询,首先在可查询范围内以一种迭代替换的方式进行扩展查询直到查询到主关键词对象,若还有关键词没有被已查询到的空间对象所覆盖,则以面向无主关键词的查询方式继续进行扩展查询。分别对以上两种查询进行了实验,证明了所提方法的有效性。
-
公开(公告)号:CN105808738A
公开(公告)日:2016-07-27
申请号:CN201610136918.8
申请日:2016-03-10
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F16/955 , G06F16/24556 , G06F16/9535
Abstract: 基于元搜索引擎搜索结果的去重方法,本发明涉及元搜索引擎搜索结果的去重方法。本发明是要解决现有技术不能对格式不同的URL的相同网页和重定向的网页进行去重、根据标点符号周边的信息、标点符号的位置以及词频的模糊匹配不能全面地代表句子与文章问题,而提出的基于元搜索引擎搜索结果的去重方法。该方法是通过一、根据URL地址判断是否是重复网页;二、分别计算两个网页的标题相似度和两个网页摘要的相似度;三、根据标题相似度和摘要的相似度计算网页的相似度:步骤四、如果相似度值Sim(A,B)大于阈值,则就认为两个网页是重复的等步骤实现的。本发明应用于元搜索引擎搜索结果的去重领域。
-
-
-
-
-
-