-
公开(公告)号:CN114417177A
公开(公告)日:2022-04-29
申请号:CN202111482396.4
申请日:2021-12-06
Applicant: 重庆邮电大学
IPC: G06F16/9536 , G06K9/62
Abstract: 本发明涉及大数据挖掘技术领域,公开了一种基于节点综合影响力的标签传播重叠社区发现方法,根据节点的拓扑信息:度、三角形数和局部平均度计算网络中节点重要性LI;依据节点及其邻居的相似度Sim及节点亲密度NI计算节点相似性影响力SI;根据节点重要性LI和相似性影响力SI计算节点综合影响力CI,将所有节点按节点重要性LI排序,并为每个节点初始化一个唯一标签和主标签,保留满足阈值的标签并归一化;检查所有标签并删除不满足节点个数阈值的标签并保留这些标签中的节点,再次计算隶属系数并重新分配社区。本发明采用异步更新节点的标签,结束条件是两次主标签不变或达到了最大迭代值,能够高效及准确的发现复杂网络中的重叠节点和社区结构。
-
公开(公告)号:CN113704461A
公开(公告)日:2021-11-26
申请号:CN202110330194.1
申请日:2021-03-27
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F16/34 , G06F40/242 , G06F40/289 , G06F40/295 , G06F40/216
Abstract: 本申请公开了一种对文档的主题分类处理方法及其装置,应用于终端设备,该方法包括:预设语料库;该语料库中包括:M个由词语数据组成的词对数据和L个词语数据,各词语数据是通过对参考文档集合中的各个参考文档进行分词处理后得到的;当获取到待分析的目标文档集合时,通过对上述目标文档集合中的各个目标文档进行分词处理得到待归类词语集合;调用基于上述语料库构建的词分类模型,对待归类词语集合进行分类处理,输出K个主题分类词语集合,K为正整数。通过实施本申请提出的方法,有利于判断文档集合所涉及的主题。
-