一种基于有效近邻的聚类中心选择方法

    公开(公告)号:CN116257769A

    公开(公告)日:2023-06-13

    申请号:CN202310427341.6

    申请日:2023-04-19

    Abstract: 本发明涉及一种基于有效近邻的聚类中心选择方法。本发明首先计算每个数据点与其k近邻集的近邻距离总和,并求出近邻平均距离;然后定义有效近邻,有效近邻是数据点与其k近邻的距离小于近邻平均距离的点,通过有效近邻来计算数据点的局部密度,并定义平均密度,将大于平均密度的数据点加入候选聚类中心集合中;然后在候选聚类中心集合中选择密度最大的点加入到初始聚类中心集合中,并计算候选聚类中心集合中是否存在有低于其局部密度且属于其有效近邻的数据点,进一步确定每个数据点是新的初始聚类中心还是簇成员,对候选聚类中心集合进行筛选,直到候选聚类中心集合为空。

    基于自适应网格边界划分的多维数据聚类改进算法

    公开(公告)号:CN114943266A

    公开(公告)日:2022-08-26

    申请号:CN202210229884.2

    申请日:2022-03-09

    Inventor: 赫斌 何云斌 赵琦

    Abstract: 本发明针对CLIQUE算法参数人工选择的缺点,本文提出一种于自适应网格边界划分的多维数据聚类改进算法。首先对人工输入的密度阈值参数进行改进,将每个维度划分为多个网格单元,然后计算每个维度投影的数据点数和和非空单元网格的个数和,计算出密度阈值。之后针对维度过高时产生的问题进行改进,当进行聚类时,子空间的密集连通单元网格的数量等于1时,说明该子空间将所有数据聚为一类,同时也会删除一些孤立点和少部分簇中数据点,故对数据聚类帮助不大,可将此维度舍弃。密集连通单元网格的数量大于1时,说明该子空间能够有效帮助聚类,可将此子空间保留下来。最后采用自适应网格边界划分,改进原先硬划分网格单元的问题。

    一种基于监控检测的教室自习室管理系统

    公开(公告)号:CN113052736A

    公开(公告)日:2021-06-29

    申请号:CN202110431703.X

    申请日:2021-04-21

    Inventor: 赫斌 何云斌 赵琦

    Abstract: 本发明是一种基于监控检测的教室自习室管理系统,主要包括多个从机,从机均包括多个监控检测模块、教室状态切换模块、教室用电控制模块、储物模块、教室显示模块、单片机、继电器、铁电存储器,串口通讯模块、上位机、楼层显示模块、教学楼显示模块;单片机分别与多个监控检测模块、教室状态切换模块、教室用电控制模块、储物模块和教室显示模块连接;然后与铁电存储器相连,由单片机处理,显示在楼层显示模块上;串口通讯模块分别连接从机与上位机,上位机连接教学楼显示模块,由教学楼管理员对上位机进行操作。高校图书馆自习室位置紧张,该系统能帮助学生快速找到有空缺的教室,同时帮助管理员对教学楼进行管理。

    一种基于加权局部异常因子的K-近邻聚类算法

    公开(公告)号:CN118211134A

    公开(公告)日:2024-06-18

    申请号:CN202410240864.4

    申请日:2024-03-02

    Inventor: 何云斌 唐璐 亓倩

    Abstract: 本发明涉及一种基于加权局部异常因子的K‑近邻聚类算法。本发明首先对LO算法做出改进,利用改进规则为数据赋予权重,并做归一化处理,使数值范围在(0,1)之间;再根据加权局部离群因子LOF的值找出数据异常点。最终对正常点的数据进行K‑近邻聚类。利用UCI数据库中的6组标准版公开数据集进行测试,验证了该方法可以有效降提高谁选异常点,提高K‑近邻算法精度。本发明更准确分析了数据集原始分布情况,降低了样本间的冗余性,从而提高了分类器的性能。

    一种基于边界样本的混合采样方法

    公开(公告)号:CN113449805A

    公开(公告)日:2021-09-28

    申请号:CN202110781882.X

    申请日:2021-07-12

    Inventor: 张爽 何云斌

    Abstract: 本发明涉及一种基于边界样本的混合采样方法,本发明首先通过基于变异系数的边界点检测算法,将多数类样本划分为边界样本和内部样本,并根据多数类的边界样本反向确定少数类边界样本;然后分别对多数类样本和少数类样本进行k‑means聚类,对于少数类样本根据簇内边界样本密度确定各个簇的过采样权重,对于多数类样本选取离聚类中心最近的样本点进行欠采样,从而使数据达到平衡状态;本发明在一定程度上解决了类不平衡问题,同时又能避免在采样过程中丢失有用信息。

    基于自然邻居扩散的密度峰值聚类方法

    公开(公告)号:CN113378930A

    公开(公告)日:2021-09-10

    申请号:CN202110652190.5

    申请日:2021-06-11

    Abstract: 本发明涉及一种基于自然邻居扩散的密度峰值聚类方法,旨在解决传统DPC聚类方法需要手动选取聚类中心且无法处理复杂流行数据集的缺点,传统的DPC聚类方法通过决策图手动获取数据集的聚类中心点,将非聚类中心点分配到其最近聚类中心点所属的类簇中,导致聚类精度不高,不能够满足实际应用的需求。针对此问题,本文引入了自然邻居的思想,通过样本点的自然邻居扩散自动选取聚类中心点,并基于自然邻居以及簇归属度对非聚类中心点进行聚类。本发明方法能自动选取聚类中心点,并获得理想的聚类结果,且在处理复杂流行数据集上优势较大。

Patent Agency Ranking