-
公开(公告)号:CN111597335A
公开(公告)日:2020-08-28
申请号:CN202010364885.9
申请日:2020-04-30
Applicant: 北京科技大学
IPC: G06F16/35 , G06F16/9536 , G06K9/62
Abstract: 本发明提供一种针对微博评论文本的K-means初始聚类中心确定方法,能够快速、准确地确定微博评论文本的最优初始聚类中心。所述方法包括:S1,从微博评论向量集合中选取被点赞过的评论加入到核心评论簇中,并按照评论点赞数从大到小,对核心评论簇中的评论进行排序;S2,选取排序后的核心评论簇中的第一个评论作为中心评论,计算中心评论与核心评论簇中的评论的距离;S3,将核心评论簇中与中心评论的距离小于设定距离阈值的评论删除,并将中心评论加入到初始聚类中心簇中;S4,返回继续执行S2和S3,直至核心评论簇中评论数为0,此时初始聚类中心簇中的评论为微博评论向量集合最终的初始聚类中心。本发明涉及网络通信技术领域。
-
公开(公告)号:CN111597335B
公开(公告)日:2023-07-14
申请号:CN202010364885.9
申请日:2020-04-30
Applicant: 北京科技大学
IPC: G06F16/35 , G06F16/9536 , G06F18/23213
Abstract: 本发明提供一种针对微博评论文本的K‑means初始聚类中心确定方法,能够快速、准确地确定微博评论文本的最优初始聚类中心。所述方法包括:S1,从微博评论向量集合中选取被点赞过的评论加入到核心评论簇中,并按照评论点赞数从大到小,对核心评论簇中的评论进行排序;S2,选取排序后的核心评论簇中的第一个评论作为中心评论,计算中心评论与核心评论簇中的评论的距离;S3,将核心评论簇中与中心评论的距离小于设定距离阈值的评论删除,并将中心评论加入到初始聚类中心簇中;S4,返回继续执行S2和S3,直至核心评论簇中评论数为0,此时初始聚类中心簇中的评论为微博评论向量集合最终的初始聚类中心。本发明涉及网络通信技术领域。
-