一种并行社区发现方法和装置

    公开(公告)号:CN104077279B

    公开(公告)日:2019-02-05

    申请号:CN201310096315.6

    申请日:2013-03-25

    Abstract: 本发明公开了一种并行社区发现方法和装置,涉及数据挖掘领域。本发明公开的方法包括:读入原始社交网络数据,将其转换成邻接矩阵的形式并存储在HDFS文件系统上;在配置有Hadoop环境的计算集群上计算存储在HDFS上的图的邻接矩阵的度矩阵D和Laplacian矩阵;对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值对应的特征向量,并构造出特征向量矩阵进行归一化,得到规范化的特征向量矩阵并提取特征,将每行看作一个点,采用聚类方法将其聚类成K类;根据点的对应关系,将原来的社区中的个体等价地划为K类,完成社区的分类。本发明还公开了一种社区发现装置。本申请技术方案对于大规模数据具有良好的适应性。

    一种社交网络推荐系统及方法

    公开(公告)号:CN104077723B

    公开(公告)日:2018-04-27

    申请号:CN201310097930.9

    申请日:2013-03-25

    Abstract: 本发明公开了一种社交网络推荐系统及方法,涉及数据挖掘技术领域。本发明公开的系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息;用户间链接强度计算模块,基于用户间的交互信息并行计算用户间的链接强度;并行化社区发现模块,根据用户间的链接强度,结合相应的聚类算法,实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在社区发现的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。本发明还公开了社交网络推荐方法。本申请技术方案提高了推荐系统的定向性和准确性。

    视频版权保护方法、系统及视频发布方实体

    公开(公告)号:CN102164303B

    公开(公告)日:2016-06-22

    申请号:CN201010119146.X

    申请日:2010-02-24

    Inventor: 许建国 王桥 陆巍

    Abstract: 本发明提供了一种视频版权保护方法、系统及视频发布方实体,包括从原始视频信息中选择数字指纹载体;对除数字指纹载体外的原始视频信息采用加密方式进行版权保护;当需要时,对数字指纹载体嵌入数字指纹码;将采用不同版权保护方式进行保护的视频信息组合后向用户发布。在本发明的数字指指纹码嵌入过程中,根据数字指纹码的码长确定部分视频图片作为指纹载体,减少了需要嵌入指纹的视频图片数量;而指纹载体之外的视频图片预先压缩、加密并存储在视频服务器中。通过本发明方法,既降低了服务器嵌入数字指纹时的运算负荷,又保证了在每个视频拷贝中嵌入独特的数字指纹码,增强了版权保护的安全性。

    一种实现多媒体文件分级的方法和装置

    公开(公告)号:CN102143120B

    公开(公告)日:2015-07-22

    申请号:CN201010103525.X

    申请日:2010-02-01

    Abstract: 本发明公开了一种实现多媒体文件分级的方法,建立多媒体文件DNA数据库和多媒体文件热度数据库;将捕获到的网络数据包解析成具有有效载荷的格式,提取有效载荷中的文件DNA,与多媒体文件DNA数据库中的文件DNA进行匹配,在匹配成功时,更新多媒体文件热度数据库中该文件的传播热度,实现对互联网中多媒体文件传播热度的分级;本发明同时还公开了一种实现多媒体文件分级的装置;在本发明的方案中,还可以建立盗版多媒体文件DNA数据库、多媒体网站热度数据库和P2P热度数据库,记录盗版多媒体文件信息、多媒体网站热度及多媒体文件的传播方式,为网络中非法传播的数据的监管提供有利帮助。

    一种并行社区发现方法和装置

    公开(公告)号:CN104077279A

    公开(公告)日:2014-10-01

    申请号:CN201310096315.6

    申请日:2013-03-25

    CPC classification number: G06F17/30864

    Abstract: 本发明公开了一种并行社区发现方法和装置,涉及数据挖掘领域。本发明公开的方法包括:读入原始社交网络数据,将其转换成邻接矩阵的形式并存储在HDFS文件系统上;在配置有Hadoop环境的计算集群上计算存储在HDFS上的图的邻接矩阵的度矩阵D和Laplacian矩阵;对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值对应的特征向量,并构造出特征向量矩阵进行归一化,得到规范化的特征向量矩阵并提取特征,将每行看作一个点,采用聚类方法将其聚类成K类;根据点的对应关系,将原来的社区中的个体等价地划为K类,完成社区的分类。本发明还公开了一种社区发现装置。本申请技术方案对于大规模数据具有良好的适应性。

    一种实现多媒体文件分级的方法和装置

    公开(公告)号:CN102143120A

    公开(公告)日:2011-08-03

    申请号:CN201010103525.X

    申请日:2010-02-01

    Abstract: 本发明公开了一种实现多媒体文件分级的方法,建立多媒体文件DNA数据库和多媒体文件热度数据库;将捕获到的网络数据包解析成具有有效载荷的格式,提取有效载荷中的文件DNA,与多媒体文件DNA数据库中的文件DNA进行匹配,在匹配成功时,更新多媒体文件热度数据库中该文件的传播热度,实现对互联网中多媒体文件传播热度的分级;本发明同时还公开了一种实现多媒体文件分级的装置;在本发明的方案中,还可以建立盗版多媒体文件DNA数据库、多媒体网站热度数据库和P2P热度数据库,记录盗版多媒体文件信息、多媒体网站热度及多媒体文件的传播方式,为网络中非法传播的数据的监管提供有利帮助。

    一种网络应用监测方法及系统

    公开(公告)号:CN102045209A

    公开(公告)日:2011-05-04

    申请号:CN200910180571.7

    申请日:2009-10-20

    Abstract: 本发明公开一种网络应用监测方法,包括:网络数据采集分析分系统分别捕获数据包,并对捕获的数据包进行识别;网络数据汇总处理分析系统获取网络数据采集分析分系统的识别结果,并根据所述识别结果进行统计分析。本发明还相应地公开一种网络应用监测系统,由于本发明将大量数据的采集和处理工作平摊给各个网络数据采集分析分系统完成,以软件方式实现了大范围、大数据量的网络应用监测系统,所以,本发明能够节约成本、提高功能的升级更新速度;并且,本发明提出的根据已有检测结果不断优化提升识别效率的P2P协议识别方法,能够充分利用已有的检测结果,提高系统对P2P协议的识别速度及效率。

    一种社交网络推荐系统及方法

    公开(公告)号:CN104077723A

    公开(公告)日:2014-10-01

    申请号:CN201310097930.9

    申请日:2013-03-25

    Abstract: 本发明公开了一种社交网络推荐系统及方法,涉及数据挖掘技术领域。本发明公开的系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息;用户间链接强度计算模块,基于用户间的交互信息并行计算用户间的链接强度;并行化社区发现模块,根据用户间的链接强度,结合相应的聚类算法,实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在社区发现的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。本发明还公开了社交网络推荐方法。本申请技术方案提高了推荐系统的定向性和准确性。

Patent Agency Ranking