基于云存储的备份数据存储管理方法、装置和系统

    公开(公告)号:CN107729177A

    公开(公告)日:2018-02-23

    申请号:CN201710841028.1

    申请日:2017-09-18

    CPC classification number: G06F11/1464 G06F3/0647 G06F3/067 H04L67/1095

    Abstract: 本发明涉及一种基于云存储的备份数据存储管理方法、装置和系统。备份控制端进行备份作业、恢复作业、迁移作业的管理和调度;备份客户端执行备份作业时将数据复制到本地存储端,执行恢复作业时接收本地存储端或云储存端发送的数据;本地存储端执行备份作业时接收来自备份客户端的数据并将其写入本地存储介质;执行迁移作业时将本地存储介质内的数据迁移到云存储端,执行恢复任务时将本地存储介质内的数据复制到备份客户端;云存储端执行迁移任务时接收来自本地存储端的迁移数据,执行恢复任务时将云存储设备内的数据复制到备份客户端。本发明充分结合了本地存储的高效性与云存储的可靠性,在提升备份效率的同时实现了备份数据云存储的目标。

    一种基于非确定主动学习的多分类器训练方法及分类方法

    公开(公告)号:CN104657744B

    公开(公告)日:2017-10-24

    申请号:CN201510046879.8

    申请日:2015-01-29

    Abstract: 本发明公开了一种基于非确定主动学习的多分类器训练方法及分类方法。本方法为:1)选取或初始化一多分类器;对未标注样本集中的每一样本,利用该多分类器计算该样本的总体信息量Info;所述总体信息量为:模型变更信息量与模型调优信息量之和;2)对该未标注样本集进行聚类,得到J个子类;3)从每个子类中选取总体信息量Info值最小的若干未标注样本;再从所选样本中选取K个样本进行标注后加入到已标注样本集L;4)将更新后的已标注集L作为训练数据重新训练该多分类器;5)迭代执行步骤1)~4)设定次数;然后利用最终得到的多分类器对未标注集进行分类。本发明实现样本信息量的综合评价,从而获得高效化、智能化的多分类器。

    一种社交网络结构构建方法

    公开(公告)号:CN104657434B

    公开(公告)日:2017-10-24

    申请号:CN201510050126.4

    申请日:2015-01-30

    Abstract: 本发明公开了一种社交网络结构构建方法。本方法为:1)基于待构建社交网络的社交网络图模型G=(V,L),获取用户之间交互行为的加权链接矩阵以及该社交网络的用户属性矩阵F;2)将加权链接矩阵和用户属性矩阵合并,构建一综合信息矩阵N;3)根据综合信息矩阵N,对||W||0+λrank(W)求最小化,得到该社交网络的链接强度矩阵W;最小化约束条件为N=NW,diag(W)=0,W≥0;4)将该链接强度矩阵W作为该社交网络图模型中边集L的权重信息,得到G=(V,LW),构建出该社交网络的网络结构。本方法可实现对社交网络整体结构的建模,从而获得社交网络中任意用户之间相互关系的真实、可靠度量,且求解效率高。

    一种通用文件系统的操作获取记录的方法

    公开(公告)号:CN103809981B

    公开(公告)日:2017-06-23

    申请号:CN201410066581.9

    申请日:2014-02-26

    Abstract: 本发明涉及一种通用文件系统的操作获取记录的方法,包括以下步骤:1:为文件操作截获模块与外部文件系统建立连接;2:判断是否是首次连接,如果是,执行步骤3;否则,执行步骤4;3:对不存在对应通信设备的空闲设备号进行创建通信设备,并对创建的通信设备与空闲设备号创建连接;4:接收并向文件操作截获模块发送截获指令信息;5:按照截获指令信息截获操作信息;6:将截获的操作信息发送到通信设备,将接收到的文件的操作信息发送到用户态操作记录模块;7:将处理后的操作信息按照不同类型写入存储空间;8:断开连接,完成卸载。本发明从文件系统级别掌握用户操作的特点,便于进一步的基于用户行为的数据分析和文件系统的特性改进等。

    一种用于海量数据管理的多盘位存储方法及系统

    公开(公告)号:CN103761059B

    公开(公告)日:2017-02-08

    申请号:CN201410035889.7

    申请日:2014-01-24

    Abstract: 本发明涉及一种用于海量数据管理的多盘位存储方法及系统,所述方法包括:建立四层树型的数据存储结构,即一个Master节点、位于Master节点下的若干数据存储节点、位于各数据存储节点下的若干磁盘和位于各磁盘下的若干数据分片;在每个数据存储节点上设置一个多盘位管理器,用于维护当前数据存储节点的磁盘信息,并在多盘位管理器的管理下,在磁盘中进行数据分片的增加或删除;通过多盘位管理器,对各数据存储节点之间的负载进行负载均衡分析,且同时对数据存储节点内部各磁盘间的负载进行负载均衡分析。本发明既能充分利用多盘的并行读写的特点,又能够最小化数据盘出现故障时对其他盘的数据的影响,同时还能够不增加数据的冗余度,大大提高了系统效率。

    一种滑动窗口下多维数据重复检测快速索引方法

    公开(公告)号:CN105989061A

    公开(公告)日:2016-10-05

    申请号:CN201510066798.4

    申请日:2015-02-09

    Abstract: 本发明涉及一种滑动窗口下多维数据重复检测快速索引方法。该方法采用压缩计数型布隆过滤器矩阵数组来维护滑动窗口内的数据项,在滑动窗口内维护多个子窗口,队首子窗口以滑动方式接收新元素,队尾子窗口以滑动方式淘汰老元素;每个独立子窗口由一个计数型布隆过滤器矩阵组成,计数型布隆过滤器矩阵具备面向多维数据的维度删减能力,并且其内部维护计数器单元。通过对所有计数型布隆过滤器矩阵均采用相同的设计容量并共享同一组k个哈希函数,能够有效提升重复元素检测效率;通过在计数器单元中维护系统基础时钟,能够有效支持滑动窗口的元素隐式删除;通过矩阵方式维护多维数据,有效降低多维数据的组合误差率,降低整体误判率。

    一种多源异构大数据的一致性表示方法

    公开(公告)号:CN105893612A

    公开(公告)日:2016-08-24

    申请号:CN201610266857.7

    申请日:2016-04-26

    CPC classification number: G06F16/217 G06F16/215 G06F17/2785

    Abstract: 本发明公开了一种多源异构大数据的一致性表示方法。本方法针对多源异构数据的特征异构性问题,利用多源异构数据间的语义互补性,基于子空间学习方法,将多源异构数据投影到一个中层冗余特征同构空间。并在这个同构空间中,将来自不同来源的相关描述耦合到一起。为了挖掘出中层空间中同构描述之间的语义一致性,利用先验知识,将特征同构描述投影到高层语义共享子空间上,进而消除冗余和噪声信息。由此,可以获得多源异构数据的语义一致模式。本发明有助于在多媒体分析、信息检索和医疗诊断等领域,获得准确且鲁棒的多源数据评估分析结果。

    一种多源异构大数据的缺失源补全方法

    公开(公告)号:CN105893610A

    公开(公告)日:2016-08-24

    申请号:CN201610265744.5

    申请日:2016-04-26

    CPC classification number: G06F16/215 G06F2216/03

    Abstract: 本发明公开了一种多源异构大数据的缺失源补全方法。本方法针对多源异构数据的缺失源问题,利用多源异构数据间的语义互补性和分布相似性,基于子空间学习方法,通过对完整的多源异构数据的语义互补性和分布相似性的挖掘,获得一个不同来源间的特征同构的语义共享子空间,从而在这个特征同构空间中,利用学习到的语义互补性和分布相似性,补全多源异构数据的缺失来源。本方法中,假设不同的来源都服从正态分布,那么缺失源的数据矩阵可以塑造为低秩(捕捉类间差异,代表期望)加稀疏(捕捉类内差异,代表方差)两个成分的和。由此,利用异源间的语义互补性和等同分布补全多源异构数据的缺失描述。

    一种多源异构大数据的冗余源协同缩减方法

    公开(公告)号:CN105843896A

    公开(公告)日:2016-08-10

    申请号:CN201610166631.X

    申请日:2016-03-22

    CPC classification number: G06F16/215

    Abstract: 本发明涉及一种多源异构大数据的冗余源协同缩减方法。该方法包括两个模型,一个为异构流形平滑学习(HMSL)模型,另一个为基于相关性的多源冗余缩减(CMRR)模型。其中,HMSL模型将多源异构数据线性投影到一个低维特征同构空间,并在这个空间中,使信息相关描述的流形距离更近,而语义互补样本的欧氏距离更近;CMRR模型利用基于梯度能量竞争策略的广义初等变换约束,在由HMSL模型学习得来的特征同构空间中,消除多源冗余数据的三向冗余和双层异构性。本发明能够消除多源冗余数据的三向冗余和双层异构性,进而精简多源异构数据的冗余源。

    一种有向链接式分类器构造方法及分类方法

    公开(公告)号:CN104820687A

    公开(公告)日:2015-08-05

    申请号:CN201510192537.7

    申请日:2015-04-22

    Abstract: 本发明公开了一种有向链接式分类器构造方法及分类方法。本方法为:1)初始化一已标注训练数据集T的权值分布、一增量集和迭代截止条件;2)对于第m次迭代,采用已标注训练集T(m)训练一弱分类器Gm(x),并用当前的Gm(x)的分类误差率和系数更新已标注训练集T(m)的权值分布;并且利用当前的Gm(x)对一未标注集U进行预测,然后从预测结果中选出置信度最高的前K个样本及其对应的预测标签放入或更新到增量集中;3)当满足迭代截止条件时,停止迭代并根据每次迭代得到的弱分类器构建一强分类器G(x)。该方法通过有价值知识的共享传递与协同指导,充分挖掘与利用已标注和未标注这两种样本,实现了模型信息的有效利用与融合增强。

Patent Agency Ranking