-
公开(公告)号:CN114662019A
公开(公告)日:2022-06-24
申请号:CN202210316758.0
申请日:2022-03-29
Applicant: 哈尔滨理工大学
IPC: G06F16/9537 , G06F16/9536 , G06F40/216 , G06K9/62 , G06Q50/00
Abstract: 本发明是公开了一种一种多因素影响的兴趣点推荐方法,首先从用户签到相似度,好友相似度,类别偏好相似度三个角度综合考虑计算用户间相似度;其次将得到的三个相似度结合到一起求出用户相似度矩阵,并规范拉普拉斯矩阵;然后将特征向量组成新的特征空间进行聚类运算,最后融合四种因素的总评分来推荐用户兴趣点。本发明旨在解决推荐过程中计算量大、推荐效率低的问题,在应对不同用户时,计算用户对不同用户的偏好值,提高推荐效果。
-
公开(公告)号:CN118379748A
公开(公告)日:2024-07-23
申请号:CN202410618763.6
申请日:2024-05-17
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种基于深度神经网络的谱聚类方法。本发明首先对原始数据集进行预处理,对数据进行特征缩放操作,使不同特征之间的尺度保持一致。通过KNN对数据进行处理,得到数据点对。然后利用数据点对对Siamese网络进行训练,得到数据点之间的相似性度量;计算拉普拉斯矩阵,得到特征值和特征向量,利用特征向量对自组织映射神经网络进行训练,得到自组织映射神经网络的权值,在训练完成的模型上进行聚类,得到聚类结果;利用MNIST数据集进行测试,验证了该方法的有效性,本发明能够有效地捕捉到数据的内在特征和潜在规律,提高了聚类的准确率和可靠性,同时也增强了模型对不同类型数据的适应性和泛化能力,为数据分析和处理提供了更有力的支持和保障。此外还可以将高维数据映射到二维或三维的拓扑结构上,使得聚类结果可以通过可视化方式呈现,从而提升了整体系统的性能。
-
公开(公告)号:CN114638301A
公开(公告)日:2022-06-17
申请号:CN202210264661.X
申请日:2022-03-17
Applicant: 哈尔滨理工大学
IPC: G06K9/62
Abstract: 本发明针对密度峰值聚类算法(DPC)不适用于流形数据集、聚类中心的选择需要人为干预且会在剩余点分配会出现多米诺效应的缺陷。提出了一种基于密度相似性的密度峰值聚类算法(DA‑DPC)。首先,引用密度相识度来代替欧式距离来适用处理流形数据集,可以消除dc对算法结果的影响;其次,根据密度聚类指数的特点和聚类的定义,设计了一种新的密度聚类指数(DCI),自动获取聚类中心,降低参数对聚类结果的影响;对于剩余点提出两种匹配策略,更好的达到聚类效果;实验表明,该算法在人工数据集和UCI真实数据集上比常用的几种聚类算法具有更好的聚类效果。
-
公开(公告)号:CN114626451A
公开(公告)日:2022-06-14
申请号:CN202210227779.5
申请日:2022-03-08
Applicant: 哈尔滨理工大学
IPC: G06K9/62
Abstract: 本发明是公开了一种基于密度的数据预处理优化方法,首先计算样本对象的欧氏距离与平均距离,然后进行粗聚类;利用密度权重找出聚类的中心点,将中心点为中心,平均距离为半径里的所有数据对象归为一类,得到聚类数目;最后,将预处理后得到的聚类中心点与聚类数目利用K‑medoids算法进行细聚类,得到最终的聚类结果。本发明旨在解决数据聚类结果受其初始化的聚类中心影响较大、不能得到最优解的问题,在聚类方法基础上加入数据预处理过程,保证了初始聚类中心的稳定,通过密度作为启发信息,选取密度权重大的作为中心点,避免聚类数目的随机选取,显著提高了聚类的效果,缩短了聚类过程所消耗的时间。
-
公开(公告)号:CN113378987A
公开(公告)日:2021-09-10
申请号:CN202110762213.8
申请日:2021-07-06
Applicant: 哈尔滨理工大学
IPC: G06K9/62
Abstract: 本发明公开了基于密度的不平衡数据混合采样算法,首先使用DBSCAN聚类算法对少数类和多数类进行聚类,识别并处理少数类和多数类离群点,然后依据样本的K近邻总距离,计算每个样本的边界密度,依据边界密度,确定少数类样本和多数类样本的边界区域和非边界区域,对少数类样本边界区域进行过采样,多数类样本非边界区域欠采样,最后得到平衡数据集,使用交叉验证划分数据,使用随机森林算法对样本分类测试,实验结果显示,本发明能够得到较好的分类结果,分类器性能得到提高。
-
公开(公告)号:CN113378021A
公开(公告)日:2021-09-10
申请号:CN202110771799.4
申请日:2021-07-08
Applicant: 哈尔滨理工大学
IPC: G06F16/906 , G06K9/62
Abstract: 本发明涉及一种基于半监督的信息熵主成分分析降维方法,属于数据挖掘高维数据降维领域,本发明旨在解决传统PCA算法在实际应用中存在的问题,当数据维数过高时,数据中包含的信息比较复杂,导致分类器的识别度不高,并且次方法处理数据时,耗时太长,不能够满足实际应用的需求。针对此问题,本文引入了信息熵的思想以及半监督学习方法,对PCA算法进行了改进,使得改进后的算法能够用于处理高维数据,并进行降维。本发明可以避免噪声对数据聚类的影响,具有较高的噪声抗干扰能力,有效的避免了高维数据引起的维度灾难问题。
-
公开(公告)号:CN113010907A
公开(公告)日:2021-06-22
申请号:CN202110471176.5
申请日:2021-04-29
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种基于密度的加权模糊C‑均值聚类方法,数据数据挖掘数据对象的聚领域,本发明旨在解决传统的FCM聚类算法在实际应用中存在的问题,传统的FCM聚类方法直接对数据集中的数据进行处理,计算它们的目标函数,通过目标函数求出隶属度函数以及聚类中心函数,导致聚类精度不高,不能够满足实际应用的需求。针对此问题,本文引入了基于密度的思想,对FCM聚类算法进行了改进,使得改进后的算法能够提高聚类的精度。本发明可以避免噪声对数据聚类的影响,具有较高的噪声抗干扰能力,有效的提高了聚类的效率。
-
公开(公告)号:CN119782917A
公开(公告)日:2025-04-08
申请号:CN202411425619.7
申请日:2024-10-13
Applicant: 哈尔滨理工大学
IPC: G06F18/2411 , G06F18/23213 , G06F18/22
Abstract: 本发明提供了一种基于动态K均值聚类的不平衡数据分类方法,旨在解决机器学习领域中常见的类别不平衡问题。该方法通过自适应k‑means聚类算法对多数类数据集进行聚类,自动调整聚类的数量(K值),以适应数据的分布特性。在聚类完成后,采用两种不同的抽样视角——基于曼哈顿距离(AKMS)和余弦相似度(AKCS)——从聚类中选择样本,确保从每个聚类中以等比例提取接近聚类质心或具有高度相似度的样本。然后,将得到的多数类数据集子集与少数类数据集合并,生成平衡数据集,并使用如支持向量机(SVM)等分类器进行分类。本发明的方法不仅提高了算法的运行效率,还通过动态调整K值和先进的样本选择策略,显著提升了不平衡数据集的分类性能。此外,本发明还引入了一系列评价指标,如查准率、查全率、F‑value、G‑mean和AUC等,用于全面评估分类效果。通过与传统方法的比较实验,证明了本发明方法的有效性和优越性。
-
-
公开(公告)号:CN113513771A
公开(公告)日:2021-10-19
申请号:CN202110883904.3
申请日:2021-08-03
Applicant: 哈尔滨理工大学
IPC: F24C15/20
Abstract: 本发明是一种节能全自动智能吸油烟机,主要包括机架、吸烟板和排风箱,机架由固定板构成,吸烟板的前侧设有凹槽,凹槽内设有两个第一吸烟口,第一吸烟口外侧设有过滤架,两个第一吸烟口中间设置有气敏传感器,吸烟板的上侧设有第二吸烟口和保护门,第二吸烟口处同样设有过滤网,第二吸烟口的两边设置有气敏传感器和热敏传感器装置,设置的气敏感应器与热敏感应器相结合,采集油烟信号,通过感应油烟浓度,调节风量大小,让吸油烟机自动处理油烟,使吸油烟机的抽油烟效果更佳。本发明实现了全自动调节吸油烟机的转速,满足不同使用情况,设置的多个吸烟口扩大吸烟范围,加快吸烟速度,提高吸烟的效率,加强吸油烟机的工作性能。
-
-
-
-
-
-
-
-
-