一种处理密度分布不均匀数据集的免参数聚类方法

    公开(公告)号:CN116244614A

    公开(公告)日:2023-06-09

    申请号:CN202310070648.5

    申请日:2023-02-06

    Applicant: 南昌大学

    Abstract: 本发明涉及数据挖掘技术领域,尤其涉及一种处理密度分布不均匀数据集的免参数聚类方法。根据自然邻居图算法将数据集划分出数据分片,并剔除全局离群点;给出噪声分片的定义,并将数据集中的噪声分片剔除;根据DBSCAN算法对每一个数据分片进行聚类,现实密度分布不均匀数据的聚类。本发明方法具备去除全局离群点和局部离群点的功能,有更好的抗噪性和鲁棒性;无需设定初始参数,可以根据不同的数据集调整中间参数,解决了参数难设定的问题;提供了一种处理密度分布不均匀数据集的聚类方法,实现了对密度不均匀数据集的自动聚类,并提高了聚类精度。

    一种基于深度图神经网络的关键词抽取方法

    公开(公告)号:CN111666772A

    公开(公告)日:2020-09-15

    申请号:CN202010557742.X

    申请日:2020-06-18

    Applicant: 南昌大学

    Inventor: 段文影

    Abstract: 本发明属于计算机文档检索领域,具体设计一种基于深度图神经网络的关键词抽取方法,包括对文档进行矩阵加权形成有向图,利用图卷积编码器和图卷积解码器从相邻词汇中组合出最合适的关键词;期间为了保证数据的稳定,还可进行正则化的方式,保证数据的稳定性;因此,本方案是在图神经网络的端到端关键词抽取方法的基础上进行改进的,大大提高关键词抽取的效率。

Patent Agency Ranking