-
公开(公告)号:CN114186110A
公开(公告)日:2022-03-15
申请号:CN202111492908.5
申请日:2021-12-08
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/906 , G06K9/62
Abstract: 本申请公开了一种数据聚类方法、装置、设备及可读存储介质,方法包括:将数据库中的数据划分为多个分区,根据每个分区中的数据确定每个分区对应的邻域半径;根据每个分区对应的邻域半径对相应分区内的数据进行聚类,得到分区内数据的聚类结果;获取相邻两个分区的聚类结果中的相同类,并对相同类进行合并。本申请公开的技术方案,通过将数据库中的数据划分为多个分区,根据分区内的数据确定分区对应的邻域半径而解决现有采用全局邻域半径来对整个数据库中的数据进行聚类而带来的聚类准确性低、质量差的问题,以提高数据聚类的准确性和质量,并通过在对各分区内的数据进行聚类之后将相邻两个分区中相同类进行合并而避免相近位置出现类重复的情况。
-
公开(公告)号:CN112131199A
公开(公告)日:2020-12-25
申请号:CN202011023270.6
申请日:2020-09-25
Applicant: 杭州安恒信息技术股份有限公司
Abstract: 本申请公开了一种日志处理方法、装置、设备、介质,该方法包括:获取待分类日志;对所述待分类日志中的各个日志进行特征项提取,得到所述待分类日志中各个日志对应的日志特征项集合;基于所述待分类日志中各个日志对应的日志特征项集合确定所述待分类日志中各个日志对应的日志向量;利用蚁群聚类算法对所述待分类日志中各个日志对应的日志向量进行分类,以对所述待分类日志进行分类。这样能够对日志进行分类,且提高了分类结果的准确性和一致性,适用性强。
-
公开(公告)号:CN111104600B
公开(公告)日:2023-04-07
申请号:CN201911337779.5
申请日:2019-12-23
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/9535 , G06F16/954 , G06N3/006
Abstract: 本申请公开了一种WEB站点网页推荐方法、装置、设备、介质,该方法包括:当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。这样基于带精英策略的蚂蚁算法能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。
-
公开(公告)号:CN111104600A
公开(公告)日:2020-05-05
申请号:CN201911337779.5
申请日:2019-12-23
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/9535 , G06F16/954 , G06N3/00
Abstract: 本申请公开了一种WEB站点网页推荐方法、装置、设备、介质,该方法包括:当WEB站点首页检测到访问请求时,获取相应的访问日志和WEB站点的站点拓扑结构;根据所述访问日志,确定所述访问日志对应的目标网页;基于带精英策略的蚁群算法,确定出从所述WEB站点首页到达所述目标网页的最优路径;根据所述最优路径,进行所述WEB站点的网页推荐。这样基于带精英策略的蚂蚁算法能够快速确定出从WEB站点首页到达目标网页的最优路径,以便根据最优路径,提高网页推荐效率和用户体验。
-
公开(公告)号:CN112131199B
公开(公告)日:2025-01-07
申请号:CN202011023270.6
申请日:2020-09-25
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/18 , G06F18/23213 , G06F18/2415
Abstract: 本申请公开了一种日志处理方法、装置、设备、介质,该方法包括:获取待分类日志;对所述待分类日志中的各个日志进行特征项提取,得到所述待分类日志中各个日志对应的日志特征项集合;基于所述待分类日志中各个日志对应的日志特征项集合确定所述待分类日志中各个日志对应的日志向量;利用蚁群聚类算法对所述待分类日志中各个日志对应的日志向量进行分类,以对所述待分类日志进行分类。这样能够对日志进行分类,且提高了分类结果的准确性和一致性,适用性强。
-
公开(公告)号:CN109543739A
公开(公告)日:2019-03-29
申请号:CN201811362667.0
申请日:2018-11-15
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06K9/62
Abstract: 本发明公开了一种日志分类方法,包括:获取待分类的日志数据,并提取日志数据中的日志特征值,得到日志特征值集合;通过KNN算法和基于均值漂移算法处理得到的样本类别,对日志特征值集合中的日志特征值进行分类,得到日志数据的分类结果;将分类结果进行可视化展示并存储。该方法中使用的KNN算法可以提高分类效率,且样本类别基于均值漂移算法处理得到,降低了数据处理量,还避免了过拟合现象的出现。因此上述方法减少了分类过程的数据处理量,提高了分类效率和准确性。相应地,本发明公开的一种日志分类装置、设备及可读存储介质,也同样具有上述技术效果。
-
-
-
-
-