-
公开(公告)号:CN110288507A
公开(公告)日:2019-09-27
申请号:CN201910371230.1
申请日:2019-05-06
Applicant: 中国科学院信息工程研究所
IPC: G06T1/20 , G06F16/901
Abstract: 本发明提出一种基于GPU的多分区强连通图检测方法,包括以下步骤:加载图数据并统一存储格式;在图数据上基于GPU进行第一剪枝操作,检测出1-SCC;在除1-SCC外的部分上选取中心点,从中心点开始并行地前向和后向遍历,更新状态得到SCC和多个分区;在未被检测的图数据上基于GPU进行第二剪枝操作,检测出2-SCC;在未被检测的图数据上检测弱连通区域,并在弱连通区域上每个选取中心点,从中心点开始前向遍历;在弱连通区域的中未被前向遍历到的区域随机选取保存的最后一个顶点做为副中心点,从中心点与副中心点开始后向遍历,再进行第一剪枝操作,再次更新状态得到SCC和分区;通过上述步骤获得全部的SCC。
-
公开(公告)号:CN107729177A
公开(公告)日:2018-02-23
申请号:CN201710841028.1
申请日:2017-09-18
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F11/1464 , G06F3/0647 , G06F3/067 , H04L67/1095
Abstract: 本发明涉及一种基于云存储的备份数据存储管理方法、装置和系统。备份控制端进行备份作业、恢复作业、迁移作业的管理和调度;备份客户端执行备份作业时将数据复制到本地存储端,执行恢复作业时接收本地存储端或云储存端发送的数据;本地存储端执行备份作业时接收来自备份客户端的数据并将其写入本地存储介质;执行迁移作业时将本地存储介质内的数据迁移到云存储端,执行恢复任务时将本地存储介质内的数据复制到备份客户端;云存储端执行迁移任务时接收来自本地存储端的迁移数据,执行恢复任务时将云存储设备内的数据复制到备份客户端。本发明充分结合了本地存储的高效性与云存储的可靠性,在提升备份效率的同时实现了备份数据云存储的目标。
-
公开(公告)号:CN105989061A
公开(公告)日:2016-10-05
申请号:CN201510066798.4
申请日:2015-02-09
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种滑动窗口下多维数据重复检测快速索引方法。该方法采用压缩计数型布隆过滤器矩阵数组来维护滑动窗口内的数据项,在滑动窗口内维护多个子窗口,队首子窗口以滑动方式接收新元素,队尾子窗口以滑动方式淘汰老元素;每个独立子窗口由一个计数型布隆过滤器矩阵组成,计数型布隆过滤器矩阵具备面向多维数据的维度删减能力,并且其内部维护计数器单元。通过对所有计数型布隆过滤器矩阵均采用相同的设计容量并共享同一组k个哈希函数,能够有效提升重复元素检测效率;通过在计数器单元中维护系统基础时钟,能够有效支持滑动窗口的元素隐式删除;通过矩阵方式维护多维数据,有效降低多维数据的组合误差率,降低整体误判率。
-
公开(公告)号:CN114489964B
公开(公告)日:2025-03-04
申请号:CN202111517469.9
申请日:2021-12-08
Applicant: 中国科学院信息工程研究所
IPC: G06F9/48 , G06N3/098 , G06N3/084 , G06N3/0499
Abstract: 本发明公开了一种基于联邦学习的车载网络信用优先任务卸载方法,其步骤包括:1)EC、CV分别将自己的位置信息和可用资源信息发送给CC;其中,EC为边缘云服务器,CV为车辆网中的车辆,CC为云中心;2)当CV需要进行任务卸载时,发送卸载任务信息给DC;其中,DC为车辆网中的决策中心;3)对于当前一批待处理的卸载任务,DC从CC获取发送卸载任务的各CV的信誉值;然后根据信用值设置各卸载任务的处理优先级,优先为处理优先级高的卸载任务制定任务卸载决策并发送给对应的EC和CV;其中,CC根据CV的行为信息计算对应CV的所述信誉值。本发明将信誉值用在任务卸载决策中,从而实现决策性能的提高。
-
公开(公告)号:CN111754383B
公开(公告)日:2023-03-10
申请号:CN202010403115.0
申请日:2020-05-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于GPU加速的优化线程调度与分区的强连通图检测方法,为使用异构系统进行强连通图检测的方法,通过将每个warp分成多个虚拟warp并分配多个顶点任务、使用着色分区替换传统的WCC分区等方法平衡了线程分配、增加了每次迭代产生的强连通图数目,从而达到提升算法运行效率的目的。
-
公开(公告)号:CN114461906A
公开(公告)日:2022-05-10
申请号:CN202210024433.5
申请日:2022-01-06
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种聚焦于用户核心兴趣的序列推荐方法及装置,包括获取用户与项目的交互序列以及所述交互序列中每个交互行为对应的时间戳;得到所述交互序列的嵌入矩阵;对所述嵌入矩阵进行自注意力计算,得到每一查询对于所有键的注意力值概率分布;获取每一查询的预先定义固定默认概率分布;根据两个概率分布相似性,得到各查询的活跃性度量;基于所述活跃性度量分别计算各键的注意力值,以构建自注意力矩阵;依据所述自注意力矩阵,得到所述用户的项目推荐结果。本发明通过在嵌入层加入时间间隔,并加入了活跃性度量指标,从而可以自适应地衡量项目与用户核心兴趣之间的相关性,提高了模型表达能力和推荐结果的准确率。
-
公开(公告)号:CN107491487B
公开(公告)日:2020-12-04
申请号:CN201710582509.5
申请日:2017-07-17
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/2452 , G06F16/2453
Abstract: 本发明公开了一种全文数据库架构及位图索引创建、数据查询方法、服务器及介质。本发明的全文数据库架构包括:数据模块,用于记录全文数据库的数据库表名及其索引字段信息;存储模块,包括若干独立的数据块,用于存储数据库表的数据和索引信息;加载模块,用于根据元数据模块中的索引信息将各所述数据库表的数据加载到所述数据块,当一数据块写满时,则将该数据块标记为稳态;索引创建模块,用于对于标记为稳态数据块,生成该数据块的索引;查询模块,用于根据查询语句在所述元数据模块中进行查找,如果找到匹配的索引字段,则查找各数据块的索引,然后根据数据块的索引判断该数据块是否满足查询条件。本发明大大提高了查询速度和数据库吞吐率。
-
公开(公告)号:CN104657459B
公开(公告)日:2018-02-16
申请号:CN201510066822.4
申请日:2015-02-09
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于文件粒度的海量数据存储方法。本方法为:1)将数据存储集群划分为多个分区,每一分区具有一分区值;2)对每一部门的记录创建一业务数据表,并设置每一业务数据表中记录的分区规则;3)对于待存储业务数据的每一记录,根据其编号和分区规则将其存储到对应分区的文件中并创建索引文件;然后将该记录的编号、所在文件的路径、所属存储节点编号、存储设备编号存储到元数据文件中。进一步的,本发明创建设定业务数据表之间的视图,根据所述元数据文件,将属于同一业务场景的业务数据表、视图、记录所在分区、索引信息划入到同一数据库中,得到一海量元数据管理模型。本发明既提高了数据管理精度,又提高数据划分、组织灵活性。
-
公开(公告)号:CN107491487A
公开(公告)日:2017-12-19
申请号:CN201710582509.5
申请日:2017-07-17
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明公开了一种全文数据库架构及位图索引创建、数据查询方法、服务器及介质。本发明的全文数据库架构包括:数据模块,用于记录全文数据库的数据库表名及其索引字段信息;存储模块,包括若干独立的数据块,用于存储数据库表的数据和索引信息;加载模块,用于根据元数据模块中的索引信息将各所述数据库表的数据加载到所述数据块,当一数据块写满时,则将该数据块标记为稳态;索引创建模块,用于对于标记为稳态数据块,生成该数据块的索引;查询模块,用于根据查询语句在所述元数据模块中进行查找,如果找到匹配的索引字段,则查找各数据块的索引,然后根据数据块的索引判断该数据块是否满足查询条件。本发明大大提高了查询速度和数据库吞吐率。
-
公开(公告)号:CN107391555A
公开(公告)日:2017-11-24
申请号:CN201710422553.X
申请日:2017-06-07
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/2379 , G06F16/24552 , G06F16/27
Abstract: 本发明涉及一种面向Spark-Sql检索的元数据实时更新方法。该方法在Spark Sql进行检索时,会将使用的元数据进行缓存,将被检索的数据块文件元数据以集合的形式缓存于内存中;当获得文件元数据的增量信息时,将首先检查该增量信息所属的表的检索元数据是否存在于缓存之中,若存在,则将增量的文件元数据增加至缓存的该表文件元数据的集合之中,由此完成Spark Sql检索元数据的增量更新。本发明还提出了对Spark Sql检索元数据增加情况的处理方法,可以实时的对检索元数据的增加情况进行处理,提高检索结果的实时性。本发明可以避免对检索元数据进行经常性的全量更新,以减少更新元数据时的时间和资源开销。
-
-
-
-
-
-
-
-
-