基于密度的层次聚类算法研究
    1.
    发明公开

    公开(公告)号:CN117113120A

    公开(公告)日:2023-11-24

    申请号:CN202310493547.9

    申请日:2023-05-05

    Abstract: 本文发明提出了一种方法,对于层次聚类中BIRCH算法对非球形簇不能很好的聚类提出了一种解决方法。BIRCH算法是层次聚类算法中比较典型的一种算法,通过采用聚类特征和聚类特征树来进行聚类。但BIRCH算法是用直径来控制聚类的边界,对非球形聚类效果不好,有可能会把非球状的簇分割为不同簇。针对这种情况,提出一种基于密度的层次聚类算法,利用密度的思想,先将密度最小的约10%数据点当作偏离点排除掉,不参与聚类,对其剩余的数据集进行分层聚类,分为高密度层和低密度层,对其进行分层聚类,在分层聚类的结果上进行整体的聚类,最后将偏离点数据按照最近距离划分到相应的簇中。建立多棵CF树,每棵CF树表示一个簇,实现对任意形状的簇进行聚类。

    一种基于聚类的自适应加权过采样方法

    公开(公告)号:CN113378927A

    公开(公告)日:2021-09-10

    申请号:CN202110650447.3

    申请日:2021-06-11

    Abstract: 本发明涉及一种基于聚类的自适应加权过采样方法,本发明首先对少数类样本数据进行k‑means聚类,对聚类形成的簇分别与多数类样本结合形成多个数据集,对于每个数据集使用随机森林算法进行分类并通过5折交叉验证的方式计算对应的得分值,并将计算得分值的平均值做为该簇的评分;根据各个簇得到的评分值,从而计算各个簇的合成权重;根据权重值,计算各个簇的生成样本个数,根据指定个数,在簇内进行样本之间随机线性插值,最终达到平衡数据集的目的。

    一种基于少数类簇加权的过采样算法

    公开(公告)号:CN119272079A

    公开(公告)日:2025-01-07

    申请号:CN202411059543.0

    申请日:2024-08-04

    Abstract: 本发明涉及一种基于少数类簇加权的过采样算法。本发明首先对原始数据集中的所有少数类样本进行k‑means聚类,形成多个少数类簇,将少数类样本划为安全点,边界点和噪声点,并将噪声点删除。其次结合采样率计算出每个少数类簇需要合成的少数类样本的数量,然后根据边界点样本和安全点样本的分布情况,分别以不同的方法为边界点样本和安全点样本分布权重。最后根据每个少数类样本点的权重使用改进后的SMOTE算法生成少数类样本,使数据集达到平衡状态;利用UCI数据库中的6组标准版公开数据集进行测试,验证了该方法可以有效降低少数类样本的重叠率,提高分类器对少数类样本的分类精度。本发明更准确分析了数据集原始分布情况,降低了样本间的冗余性,从而提高了分类器的性能。

    一种基于层次的自适应聚类方法
    4.
    发明公开

    公开(公告)号:CN116720090A

    公开(公告)日:2023-09-08

    申请号:CN202310823043.9

    申请日:2023-07-06

    Inventor: 邵鹏程 何云斌

    Abstract: 本文发明提出了一种方法,对于层次聚类中BIRCH算法对高维数据集聚类效果不佳且参数的选取敏感问题提出了一种解决方法。BIRCH算法是层次聚类算法中比较典型的一种算法,通过采用聚类特征和聚类特征树来进行聚类。但BIRCH算法为叶子节点中的簇设置统一的空间阈值T,根据数据对象与簇之间的欧式距离来决定数据对象的插入位置,从而忽略了簇与簇之间的关系。针对这种情况,本文提出了一种自适应的层次聚类方法。该算法使用了测地距离代替欧氏距离,克服欧式距离对高维数据的局限性,更好地刻画数据集的真实情况。通过分析数据的分布特征来自适应确定叶子节点的空间阈值T,构造一棵CF树。

    一种基于密度峰的聚类中心选择方法

    公开(公告)号:CN114662604A

    公开(公告)日:2022-06-24

    申请号:CN202210317433.4

    申请日:2022-03-29

    Abstract: 本发明涉及一种基于密度峰的聚类中心选择方法。本发明首先计算每个数据点的密度,定义变量γ视为衡量聚类中心的指标,因为γ值较大的点很可能是聚类中心,所以将γ的值在排序图上进行降序排序;然后定义拐点,拐点是排序图中前后整体差异较大的点,通过排序图中的拐点对潜在聚类中心进行选取,将潜在聚类中心存入到集合中;然后在潜在聚类中心集合中选择密度最大的点加入到实际聚类中心集合中,计算每个数据点与其之间的距离,进一步确定每个数据点是新的实际聚类中心还是簇成员,对实际聚类中心集合进行筛选,直到实际聚类中心集合为空。

    基于密度改进的BIRCH聚类算法研究

    公开(公告)号:CN117251750A

    公开(公告)日:2023-12-19

    申请号:CN202311136544.6

    申请日:2023-09-04

    Abstract: 本发明涉及一种基于密度的层次聚类算法改进研究,主要是针对层次聚类算法中BIRCH算法。BIRCH算法对非球形聚类效果不好,有可能会把非球状的簇分割为不同簇。针对这种情况,提出了一种基于密度的改进方法。该方法先用DBSCAN算法求出数据的核心点、边界点、噪声点,先将噪声点排除,不参加聚类,将核心点和边界点定义为高密度点和低密度点,然后对高密度点和低密度点分别用BIRCH算法进行聚类,形成高密度簇和低密度簇,然后将高密度簇和低密度簇合并,形成更大的簇,最后对噪声点进行处理。

    一种基于有效近邻的聚类中心选择方法

    公开(公告)号:CN116257769A

    公开(公告)日:2023-06-13

    申请号:CN202310427341.6

    申请日:2023-04-19

    Abstract: 本发明涉及一种基于有效近邻的聚类中心选择方法。本发明首先计算每个数据点与其k近邻集的近邻距离总和,并求出近邻平均距离;然后定义有效近邻,有效近邻是数据点与其k近邻的距离小于近邻平均距离的点,通过有效近邻来计算数据点的局部密度,并定义平均密度,将大于平均密度的数据点加入候选聚类中心集合中;然后在候选聚类中心集合中选择密度最大的点加入到初始聚类中心集合中,并计算候选聚类中心集合中是否存在有低于其局部密度且属于其有效近邻的数据点,进一步确定每个数据点是新的初始聚类中心还是簇成员,对候选聚类中心集合进行筛选,直到候选聚类中心集合为空。

    基于自适应网格边界划分的多维数据聚类改进算法

    公开(公告)号:CN114943266A

    公开(公告)日:2022-08-26

    申请号:CN202210229884.2

    申请日:2022-03-09

    Inventor: 赫斌 何云斌 赵琦

    Abstract: 本发明针对CLIQUE算法参数人工选择的缺点,本文提出一种于自适应网格边界划分的多维数据聚类改进算法。首先对人工输入的密度阈值参数进行改进,将每个维度划分为多个网格单元,然后计算每个维度投影的数据点数和和非空单元网格的个数和,计算出密度阈值。之后针对维度过高时产生的问题进行改进,当进行聚类时,子空间的密集连通单元网格的数量等于1时,说明该子空间将所有数据聚为一类,同时也会删除一些孤立点和少部分簇中数据点,故对数据聚类帮助不大,可将此维度舍弃。密集连通单元网格的数量大于1时,说明该子空间能够有效帮助聚类,可将此子空间保留下来。最后采用自适应网格边界划分,改进原先硬划分网格单元的问题。

    一种基于监控检测的教室自习室管理系统

    公开(公告)号:CN113052736A

    公开(公告)日:2021-06-29

    申请号:CN202110431703.X

    申请日:2021-04-21

    Inventor: 赫斌 何云斌 赵琦

    Abstract: 本发明是一种基于监控检测的教室自习室管理系统,主要包括多个从机,从机均包括多个监控检测模块、教室状态切换模块、教室用电控制模块、储物模块、教室显示模块、单片机、继电器、铁电存储器,串口通讯模块、上位机、楼层显示模块、教学楼显示模块;单片机分别与多个监控检测模块、教室状态切换模块、教室用电控制模块、储物模块和教室显示模块连接;然后与铁电存储器相连,由单片机处理,显示在楼层显示模块上;串口通讯模块分别连接从机与上位机,上位机连接教学楼显示模块,由教学楼管理员对上位机进行操作。高校图书馆自习室位置紧张,该系统能帮助学生快速找到有空缺的教室,同时帮助管理员对教学楼进行管理。

    一种基于改进YOLOv8的烟雾检测方法

    公开(公告)号:CN118823307A

    公开(公告)日:2024-10-22

    申请号:CN202410798569.0

    申请日:2024-06-19

    Abstract: 本发明公开了一种基于改进YOLOv8的烟雾检测方法,属于图像处理技术领域。该方法步骤主要包括:获取目标检测常用数据集,对获取的数据进行人工筛选;利用labelimg工具对收集的烟雾图像数据重新进行标注,得到新的数据集;将融合S2注意力机制的C2f模块、BiFPN多尺度特征融合金字塔、CARAFE上采样算子与YOLOv8模型相结合,构建YOLOv8‑CBS模型;将标注好的烟雾数据集输入到YOLOv8‑CBS模型中进行训练;利用经过训练的YOLOv8‑CBS模型对待识别的烟雾图像数据进行目标检测与定位。改进后的模型对比原始模型有效提升了烟雾目标检测的准确率,减少了烟雾目标在检测中出现的错检、漏检的问题。

Patent Agency Ranking