一种基于聚类和实例硬度的过采样算法

    公开(公告)号:CN112819060A

    公开(公告)日:2021-05-18

    申请号:CN202110107719.5

    申请日:2021-01-27

    Inventor: 王垚 孙国梓

    Abstract: 本发明公开了一种基于聚类和实例硬度的过采样算法。属于数据挖掘技术领域,本发明首先识别小类数据,即数据集中样本较少的数据类别,计算小类数据的实例硬度,即计算小类样本的近邻样本中不同类别的样本数与总近邻个数之比,然后对所有的小类数据进行聚类,并得到不同聚类中小类样本对应的实例硬度;再计算不同聚类的标准差,得到平均实例硬度和标准差后,由统计学最优分配原理计算各聚类中应生成的数据量;对各个聚类,选择聚类中低硬度样本由插值法生成指定数量的数据。本发明的目的在于解决数据挖掘中数据不平衡而导致分类器性能较差的问题。在数据挖掘中,不平衡数据制约模型性能,过采样通过生成新数据,缩小不同类型数据的差距。

    一种基于概率语言和资源相似度的算力网络容器迁移方法

    公开(公告)号:CN119938227A

    公开(公告)日:2025-05-06

    申请号:CN202510015947.8

    申请日:2025-01-06

    Abstract: 本发明公开了一种基于概率语言和资源相似度的算力网络容器迁移方法,属于算力网络领域,包括:根据容器资源平均需求量计算容器需求语义概率,根据资源实际需求和声明需求,构建多维资源判断矩阵并计算容器需求语义向量,计算容器资源需求概率语言量化向量。计算算力节点资源语义概率矩阵,构建算力节点可用资源概率语言矩阵,计算算力节点可用资源概率语言量化矩阵。根据容器资源需求概率语言量化向量和算力节点可用资源概率语言量化矩阵计算资源相似度向量,选择相似度最大的算力节点进行容器迁移。本发明有效量化了容器资源需求和算力节点资源情况之间多维数据的相似性,保证了迁移结果,既满足用户容器的需求又提高算力网络运行的稳定和高效。

Patent Agency Ranking