一种并行社区发现方法和装置

    公开(公告)号:CN104077279B

    公开(公告)日:2019-02-05

    申请号:CN201310096315.6

    申请日:2013-03-25

    Abstract: 本发明公开了一种并行社区发现方法和装置,涉及数据挖掘领域。本发明公开的方法包括:读入原始社交网络数据,将其转换成邻接矩阵的形式并存储在HDFS文件系统上;在配置有Hadoop环境的计算集群上计算存储在HDFS上的图的邻接矩阵的度矩阵D和Laplacian矩阵;对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值对应的特征向量,并构造出特征向量矩阵进行归一化,得到规范化的特征向量矩阵并提取特征,将每行看作一个点,采用聚类方法将其聚类成K类;根据点的对应关系,将原来的社区中的个体等价地划为K类,完成社区的分类。本发明还公开了一种社区发现装置。本申请技术方案对于大规模数据具有良好的适应性。

    一种社交网络推荐系统及方法

    公开(公告)号:CN104077723B

    公开(公告)日:2018-04-27

    申请号:CN201310097930.9

    申请日:2013-03-25

    Abstract: 本发明公开了一种社交网络推荐系统及方法,涉及数据挖掘技术领域。本发明公开的系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息;用户间链接强度计算模块,基于用户间的交互信息并行计算用户间的链接强度;并行化社区发现模块,根据用户间的链接强度,结合相应的聚类算法,实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在社区发现的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。本发明还公开了社交网络推荐方法。本申请技术方案提高了推荐系统的定向性和准确性。

    一种并行社区发现方法和装置

    公开(公告)号:CN104077279A

    公开(公告)日:2014-10-01

    申请号:CN201310096315.6

    申请日:2013-03-25

    CPC classification number: G06F17/30864

    Abstract: 本发明公开了一种并行社区发现方法和装置,涉及数据挖掘领域。本发明公开的方法包括:读入原始社交网络数据,将其转换成邻接矩阵的形式并存储在HDFS文件系统上;在配置有Hadoop环境的计算集群上计算存储在HDFS上的图的邻接矩阵的度矩阵D和Laplacian矩阵;对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值对应的特征向量,并构造出特征向量矩阵进行归一化,得到规范化的特征向量矩阵并提取特征,将每行看作一个点,采用聚类方法将其聚类成K类;根据点的对应关系,将原来的社区中的个体等价地划为K类,完成社区的分类。本发明还公开了一种社区发现装置。本申请技术方案对于大规模数据具有良好的适应性。

    一种搜索方法及系统
    4.
    发明授权

    公开(公告)号:CN103425697B

    公开(公告)日:2017-09-26

    申请号:CN201210164223.2

    申请日:2012-05-24

    Abstract: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。

    传播树的可视化处理方法及装置

    公开(公告)号:CN104572756A

    公开(公告)日:2015-04-29

    申请号:CN201310508534.0

    申请日:2013-10-24

    Inventor: 陈虹 胡磊 徐志明

    CPC classification number: G06F16/957

    Abstract: 本发明提供了一种传播树的可视化处理方法及装置,该方法包括:根据微博网页获取对微博的所有转发关系;依据转发关系生成微博的生成传播树;将生成传播树进行可视化展示,通过本发明,解决了相关技术中存在信息的传播规律或是传播走向抽象、不直观的问题,进而达到了能够很好地掌握信息传播的规律,以及对微博的转发展示更为形象直观的效果。

    一种社交网络推荐系统及方法

    公开(公告)号:CN104077723A

    公开(公告)日:2014-10-01

    申请号:CN201310097930.9

    申请日:2013-03-25

    Abstract: 本发明公开了一种社交网络推荐系统及方法,涉及数据挖掘技术领域。本发明公开的系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息;用户间链接强度计算模块,基于用户间的交互信息并行计算用户间的链接强度;并行化社区发现模块,根据用户间的链接强度,结合相应的聚类算法,实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在社区发现的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。本发明还公开了社交网络推荐方法。本申请技术方案提高了推荐系统的定向性和准确性。

    社区发现并行化方法和系统、主节点和运算节点设备

    公开(公告)号:CN104077280A

    公开(公告)日:2014-10-01

    申请号:CN201310096323.0

    申请日:2013-03-25

    CPC classification number: G06F17/3089

    Abstract: 本发明公开了社区发现并行化方法和系统、主节点和运算节点设备,涉及社交网络系统中分析关系系统。本发明公开的方法包括:根据社交网站数据库中用户的交互信息,计算网络中点与点的链接强度;主节点将所有用户随机分为p个大小相等的社区并派给p个运算节点进行融合操作;主节点根据b个社区之间的链接关系,进行融合操作得到k个社区,并计算社区划分结果的模块度;主节点将k个社区合并成为大小相似的p个社区,重新派给p个运算节点进行粗分类以及融合操作,直到k个社区的模块度小于阈值时,得到社区发现的最终结果。本发明还公开了社区发现并行化系统、主节点及运算节点设备。本申请技术方案具有更高的模块度和分类精度。

    一种获取IP网络中组播拓扑信息的方法和装置

    公开(公告)号:CN101616015B

    公开(公告)日:2011-08-10

    申请号:CN200910161520.X

    申请日:2009-07-24

    Inventor: 胡磊

    Abstract: 本发明公开了一种获取IP网络中组播拓扑信息的方法,包括:选择组播路径上的一网元作为当前网元,获取所述当前网元的组播路由的入接口和所有的协议无关组播PIM邻居网元;查找所述PIM邻居网元中组播路由下一跳的出接口与所述当前网元的组播路由的入接口一致的网元,作为所述当前网元的上一跳网元;重复上述步骤,查找组播路径上所有网元的上一跳网元;将组播路径上所有网元及其上一跳网元串接起来,形成组播拓扑。本发明可以主动及时地获取组播拓扑信息,为网络的监管提供了方便。

    一种搜索方法及系统
    9.
    发明公开

    公开(公告)号:CN103425697A

    公开(公告)日:2013-12-04

    申请号:CN201210164223.2

    申请日:2012-05-24

    Abstract: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。

    一种获取IP网络中组播拓扑信息的方法和装置

    公开(公告)号:CN101616015A

    公开(公告)日:2009-12-30

    申请号:CN200910161520.X

    申请日:2009-07-24

    Inventor: 胡磊

    Abstract: 本发明公开了一种获取IP网络中组播拓扑信息的方法,包括:选择组播路径上的一网元作为当前网元,获取所述当前网元的组播路由的入接口和所有的协议无关组播PIM邻居网元;查找所述PIM邻居网元中组播路由下一跳的出接口与所述当前网元的组播路由的入接口一致的网元,作为所述当前网元的上一跳网元;重复上述步骤,查找组播路径上所有网元的上一跳网元;将组播路径上所有网元及其上一跳网元串接起来,形成组播拓扑。本发明可以主动及时地获取组播拓扑信息,为网络的监管提供了方便。

Patent Agency Ranking