-
公开(公告)号:CN104657434A
公开(公告)日:2015-05-27
申请号:CN201510050126.4
申请日:2015-01-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种社交网络结构构建方法。本方法为:1)基于待构建社交网络的社交网络图模型G=(V,L),获取用户之间交互行为的加权链接矩阵以及该社交网络的用户属性矩阵F;2)将加权链接矩阵和用户属性矩阵合并,构建一综合信息矩阵N;3)根据综合信息矩阵N,对||W||0+λrank(W)求最小化,得到该社交网络的链接强度矩阵W;最小化约束条件为N=NW,diag(W)=0,W≥0;4)将该链接强度矩阵W作为该社交网络图模型中边集L的权重信息,得到G=(V,LW),构建出该社交网络的网络结构。本方法可实现对社交网络整体结构的建模,从而获得社交网络中任意用户之间相互关系的真实、可靠度量,且求解效率高。
-
公开(公告)号:CN103678158A
公开(公告)日:2014-03-26
申请号:CN201310732673.1
申请日:2013-12-26
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种数据布局优化方法,具体包括以下步骤:步骤1:接收业务系统输入的连续数据流;步骤2:将数据流划分为连续无交叉的多个数据块;步骤3:判断待处理的数据块是否达到缓存上限,如果是,进行下一步;否则,跳转至步骤1;步骤4:计算得到缓存中的所有数据块的指纹;步骤5:将缓存中数据块的指纹与指纹列表中的指纹进行匹配,将匹配的数据块标记为重复数据块;将不指纹匹配的指纹存入指纹列表中;步骤6:更新数据块信息表中的数据块的物理位置信息;步骤7:根据数据块信息表中的各个数据块的物理位置信息存储对应的数据块。本发明提高了数据的顺序性,降低了数据布局的离散化,提高了重复数据删除系统的顺序读写性能。
-
公开(公告)号:CN116055081A
公开(公告)日:2023-05-02
申请号:CN202210916122.X
申请日:2022-08-01
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种大规模物联网联邦学习隐私保护方法及系统。本发明使用基于区块链的支付激励方法来迫使矿工和机构诚实行事,从而加快联邦学习收敛;此外,考虑到现实网络环境中矿工存在断网现象,导致共识协议中断,影响收敛速度,本发明设计了基于PVSS的鲁棒权益证明共识来解决这一问题。实验表明,本发明的激励机制能够提高预测的准确性,降低参与者不诚实的可能性;且本发明提出的架构可以很好的具有鲁棒性地保护设备隐私。
-
公开(公告)号:CN109993198B
公开(公告)日:2021-06-22
申请号:CN201811600061.6
申请日:2018-12-26
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
Abstract: 本发明提出了一种基于特征同构共享描述的多源异构离群点检测方法,通过在特征同构空间中统一地检测来自异构数据集的离群点,以避免浪费不同来源之间的互补信息,并提高多源离群点的识别率,能够解决在一个一致的特征同构空间中识别所有类型的多源异构离群点的问题。
-
公开(公告)号:CN109871870B
公开(公告)日:2021-05-25
申请号:CN201910035916.3
申请日:2019-01-15
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
Abstract: 本发明提供一种大数据流中的基于最近邻的时间敏感性异常检测方法,属于大数据流、异常检测技术领域,核心是一个以LSH抽样视图为基础的统计估计器,滑动窗口使用确定波模型,将估计确定波窗口内多个随机时间区间的计数和方差以监测数据在不同时间区间的分布,能够快速寻找大数据流中的各数据的邻居,降低计算开销,无需单独为每个数据保存其邻居信息,节省空间占用,提高更新效率,基于时间敏感性能够快速判断数据分布是否异常以及异常发生的时间范围。
-
公开(公告)号:CN112257865A
公开(公告)日:2021-01-22
申请号:CN202010940174.1
申请日:2020-09-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种GPU上的基于着色优化的置信传播方法。本发明通过使用信息残差大的顶点对信息残差小的顶点进行固定步长的着色操作,在整个图模型上形成多个以信息残差大的顶点为中心的分区,将该顶点命名为中心点;在每个分区中,按照最远顶点到中心点以及中心点到最远点的顺序对边上的信息进行更新操作,以完成每次迭代的置信传播计算。本发明能够保证置信传播方法在短时间内收敛大多数顶点。
-
公开(公告)号:CN111754383A
公开(公告)日:2020-10-09
申请号:CN202010403115.0
申请日:2020-05-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于GPU加速的优化线程调度与分区的强连通图检测方法,为使用异构系统进行强连通图检测的方法,通过将每个warp分成多个虚拟warp并分配多个顶点任务、使用着色分区替换传统的WCC分区等方法平衡了线程分配、增加了每次迭代产生的强连通图数目,从而达到提升算法运行效率的目的。
-
公开(公告)号:CN110287150A
公开(公告)日:2019-09-27
申请号:CN201910405408.X
申请日:2019-05-16
Applicant: 中国科学院信息工程研究所
IPC: G06F16/13 , G06F16/16 , G06F16/182
Abstract: 本发明公开了一种大规模存储系统元数据分布式管理方法与系统。本发明将HDFS存储于NameNode内存中的元数据抽象成二维表的结构,以二维表的形式存储在分布式数据库中;抽象后的各二维表之间通过inode_id相互关联。Namenode成为客户端存取元数据的桥梁,客户端首先连接Namenode,Namenode来操作分布式数据库中的元数据,并将元数据返回给客户端。本发明解决了HDFS的单点故障问题。
-
公开(公告)号:CN104935348B
公开(公告)日:2018-01-05
申请号:CN201510254377.4
申请日:2015-05-18
Applicant: 中国科学院信息工程研究所
IPC: H03M7/30
Abstract: 本发明公开了一种估算误差可控的概要数据压缩方法。本方法为:1)对每个对象的概要数据建立一时间追踪器;对于待写入的概要数据,根据对象定位到对应的时间追踪器,然后时间追踪器对概要数据进行采样并保存对该时间追踪器对应的样本集合中;2)将每个时间追踪器的样本集合中的样本划分为多个时间阶段并设置误差参数;然后时间追踪器根据对应的误差参数对样本进行采样;3)将处理后的样本集合合并成一个样本集合H,然后将集合H中的样本数据划分多个时间阶段并根据对应误差参数采样写入到一新时间追踪器的样本集合内。本发明压缩后的概要数据不仅线性的提升存储空间,而且仍然能够支持误差限定的近似计算。
-
公开(公告)号:CN104657450A
公开(公告)日:2015-05-27
申请号:CN201510061345.2
申请日:2015-02-05
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30536 , G06F17/30321 , G06F17/3033 , G06F17/30371 , G06F17/30539
Abstract: 本发明涉及一种面向大数据环境的概要信息动态构建与查询方法及装置。该方法以Count-Min Sketch方法为基础,采用数据流的第一范数描述数据规模,采用数据的基数值描述数据的分布情况;首先为流式大数据分配一较小空间的Count-min Sketch结构,随着数据不断加载,当Count-min Sketch结构记录的数据项个数达到阈值且数值空间基数达到阈值以后,建立新的Count-min Sketch结构,用以接收后续到来的新数据。本发明能够根据数据量和数值基数自动建立新的Sketch结构,以较高精度统计数据,有效支持流式大数据的高精度的实时统计和分析。
-
-
-
-
-
-
-
-
-