分布式文件系统数据导入方法及装置

    公开(公告)号:CN104077315A

    公开(公告)日:2014-10-01

    申请号:CN201310106281.4

    申请日:2013-03-29

    Abstract: 本发明公开了一种分布式文件系统数据导入方法及装置。该方法包括:将数据内容存储在源文件系统和目标文件系统都能够访问的存储节点或者存储介质上;根据目标文件系统的存储格式,确定数据组织方式;根据源文件系统的元数据组织结构和/或用户要求,构建目标文件系统中元数据的元数据组织结构和索引节点;根据数据组织方式调整目标文件系统中元数据的存储信息,使元数据的存储信息正确的指向保存在存储节点或者存储介质上的数据内容;根据目标文件系统中的元数据从存储节点或者存储介质上读取相应的数据内容。

    分布式文件系统数据导入方法及装置

    公开(公告)号:CN104077315B

    公开(公告)日:2017-08-11

    申请号:CN201310106281.4

    申请日:2013-03-29

    Abstract: 本发明公开了一种分布式文件系统数据导入方法及装置。该方法包括:将数据内容存储在源文件系统和目标文件系统都能够访问的存储节点或者存储介质上;根据目标文件系统的存储格式,确定数据组织方式;根据源文件系统的元数据组织结构和/或用户要求,构建目标文件系统中元数据的元数据组织结构和索引节点;根据数据组织方式调整目标文件系统中元数据的存储信息,使元数据的存储信息正确的指向保存在存储节点或者存储介质上的数据内容;根据目标文件系统中的元数据从存储节点或者存储介质上读取相应的数据内容。

    基于稀疏采样时空数据的目标同行关系分析方法及电子装置

    公开(公告)号:CN112256982B

    公开(公告)日:2022-08-16

    申请号:CN202010967453.7

    申请日:2020-09-15

    Abstract: 本发明提供一种基于稀疏采样时空数据的目标同行关系分析方法及电子装置,包括采集目标用户E0各关联设备Uk的时空数据,依据各关联设备Uk出现记录,计算与其他设备Vj的两两同行组合集合,选取符合设定的其他设备Vj组成关联设备Uk的候选设备集合Sk;通过候选设备集合Sk中各其他设备Vj时空数据获取的出现记录,计算与相应设备Ul的两两同行组合集合,选取符合设定的相应设备Vl组成若干设备集合S′k,j;若设备集合S′k,j包含关联设备Uk,则目标用户E0与用户Ej存在同行行为,得到关联设备Uk同行设备列表Qk;依据各同行设备列表Qk,得到同行用户列表Y。本发明通过多种过滤与排序机制,可以挖掘出有效的目标同行关系,同时支持不同类型数据之间的融合使用。

    社交网络上可疑账号的检测方法及装置

    公开(公告)号:CN114861177A

    公开(公告)日:2022-08-05

    申请号:CN202210411321.5

    申请日:2022-04-19

    Abstract: 本发明公开了一种社交网络上可疑账号的检测方法及装置,所述方法包括:针对待检测账号集合,获取各待检测账号i的特征;计算各特征j的特征异常值基于特征异常值与动态更新的特征异常值权重计算待检测账号i的账号异常值以构建第t次检测的可疑账号推荐列表Bt,并通过人机交互方式由人工确定可疑账号检测结果;同时动态更新各特征异常值的权重值进一步,将上述由人工确定的可疑账号作为种子,对待检测账号集做基于网络扩散的关联分析,构建扩展的可疑账号推荐列表,再交由人工审核,确定进一步扩展的可疑账号检测结果。本发明规避现有方法对基于历史数据训练的模型的过分依赖,有利于发现隐密伪装的问题账号。

    基于伪增益类别再平衡的半监督目标检测方法及平台

    公开(公告)号:CN114842277A

    公开(公告)日:2022-08-02

    申请号:CN202210398479.3

    申请日:2022-04-15

    Abstract: 本发明公开了一种基于伪增益类别再平衡的半监督目标检测方法及平台,所述方法包括:建立训练数据集S0,所述训练数据集S0包括:标注样本和若干未标注样本;基于所述标注样本进行监督学习,得到目标检测器M0;根据目标检测器Mi对训练数据集Si中未标注样本的推理结果,计算训练数据集Si中各未标注样本的伪增益分数,以在训练数据集Si中选取K个未标注样本进行人工标注,得到训练数据集Si+1;直至标注完所有未标注样本后,获取目标检测器M;基于所述目标检测器M对待检测图片进行目标检测。本发明基于伪增益的样本挖掘策略获得分布均衡且信息含量丰富的数据集,使得未标注数据中的信息利用程度最大化。

    基于稀疏采样时空数据的目标同行关系分析方法及电子装置

    公开(公告)号:CN112256982A

    公开(公告)日:2021-01-22

    申请号:CN202010967453.7

    申请日:2020-09-15

    Abstract: 本发明提供一种基于稀疏采样时空数据的目标同行关系分析方法及电子装置,包括采集目标用户E0各关联设备Uk的时空数据,依据各关联设备Uk出现记录,计算与其他设备Vj的两两同行组合集合,选取符合设定的其他设备Vj组成关联设备Uk的候选设备集合Sk;通过候选设备集合Sk中各其他设备Vj时空数据获取的出现记录,计算与相应设备Ul的两两同行组合集合,选取符合设定的相应设备Vl组成若干设备集合S′k,j;若设备集合S′k,j包含关联设备Uk,则目标用户E0与用户Ej存在同行行为,得到关联设备Uk同行设备列表Qk;依据各同行设备列表Qk,得到同行用户列表Y。本发明通过多种过滤与排序机制,可以挖掘出有效的目标同行关系,同时支持不同类型数据之间的融合使用。

    基于多规则关联分析的网络舆情信息智能处理方法及系统

    公开(公告)号:CN112199583A

    公开(公告)日:2021-01-08

    申请号:CN202011003073.8

    申请日:2020-09-22

    Abstract: 本发明公开了一种基于多规则关联分析的网络舆情信息智能处理方法及系统。本方法步骤包括:1)为所选对象构建标签体系,所述标签体系为树形结构,其中首先按照标签类型建立多个二级标签节点,每一二级标签节点下面设置若干层节点;2)调度器按照引擎配置为各引擎设置对应所需过滤的数据类型和接收字段,并从标签体系中读取对应标签分配给对应引擎;3)调度器在接收到消息队列数据后将数据发送给对应引擎,各引擎根据所分配标签对收到的数据进行识别,然后将识别结果返回给调度器;4)调度器根据识别结果为对应的数据设置相应标签,同时统计各引擎的处理信息并存入到任务统计库;5)任务统计库根据统计信息获取当前的网络舆情。

    社交网络上可疑账号的检测方法及装置

    公开(公告)号:CN114861177B

    公开(公告)日:2024-08-23

    申请号:CN202210411321.5

    申请日:2022-04-19

    Abstract: 本发明公开了一种社交网络上可疑账号的检测方法及装置,所述方法包括:针对待检测账号集合,获取各待检测账号i的特征;计算各特征j的特征异常值#imgabs0#基于特征异常值#imgabs1#与动态更新的特征异常值权重#imgabs2#计算待检测账号i的账号异常值#imgabs3#以构建第t次检测的可疑账号推荐列表Bt,并通过人机交互方式由人工确定可疑账号检测结果;同时动态更新各特征异常值的权重值#imgabs4#进一步,将上述由人工确定的可疑账号作为种子,对待检测账号集做基于网络扩散的关联分析,构建扩展的可疑账号推荐列表,再交由人工审核,确定进一步扩展的可疑账号检测结果。本发明规避现有方法对基于历史数据训练的模型的过分依赖,有利于发现隐密伪装的问题账号。

    一种基于共享存储池的分布式事务处理方法

    公开(公告)号:CN103399894A

    公开(公告)日:2013-11-20

    申请号:CN201310311824.6

    申请日:2013-07-23

    Abstract: 本发明涉及一种基于共享存储池的分布式事务处理方法,包括:基于哈希将分布式文件系统目录全路径映射到元数据服务器;从需参与分布式事务的元数据服务器集合中指定一个协调器和多个参与器;元数据服务器评估其需要完成的分布式事务操作,若不能完成向协调器汇报“终止”,否则汇报“提交”并锁定资源;协调器根据参与器汇报结果向共享存储池的全局日志中写入“提交”或“终止”,并通知参与器;参与器执行分布式事务操作或者取消锁定资源;当有协调器或参与器故障时,第一个从共享存储池中检查分布式事务状态的参与器或协调器将分布式事务的状态设为“终止”。本发明解决了分布式文件系统中元数据服务在可扩展环境下的快速事务处理问题。

Patent Agency Ranking