-
公开(公告)号:CN104657459A
公开(公告)日:2015-05-27
申请号:CN201510066822.4
申请日:2015-02-09
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30091 , G06F17/30082 , G06F17/30194
Abstract: 本发明公开了一种基于文件粒度的海量数据存储方法。本方法为:1)将数据存储集群划分为多个分区,每一分区具有一分区值;2)对每一部门的记录创建一业务数据表,并设置每一业务数据表中记录的分区规则;3)对于待存储业务数据的每一记录,根据其编号和分区规则将其存储到对应分区的文件中并创建索引文件;然后将该记录的编号、所在文件的路径、所属存储节点编号、存储设备编号存储到元数据文件中。进一步的,本发明创建设定业务数据表之间的视图,根据所述元数据文件,将属于同一业务场景的业务数据表、视图、记录所在分区、索引信息划入到同一数据库中,得到一海量元数据管理模型。本发明既提高了数据管理精度,又提高数据划分、组织灵活性。
-
公开(公告)号:CN114461906B
公开(公告)日:2025-05-02
申请号:CN202210024433.5
申请日:2022-01-06
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06N3/045 , G06N3/0464 , G06N3/0499 , G06F18/25 , G06N3/048
Abstract: 本发明公开了一种聚焦于用户核心兴趣的序列推荐方法及装置,包括获取用户与项目的交互序列以及所述交互序列中每个交互行为对应的时间戳;得到所述交互序列的嵌入矩阵;对所述嵌入矩阵进行自注意力计算,得到每一查询对于所有键的注意力值概率分布;获取每一查询的预先定义固定默认概率分布;根据两个概率分布相似性,得到各查询的活跃性度量;基于所述活跃性度量分别计算各键的注意力值,以构建自注意力矩阵;依据所述自注意力矩阵,得到所述用户的项目推荐结果。本发明通过在嵌入层加入时间间隔,并加入了活跃性度量指标,从而可以自适应地衡量项目与用户核心兴趣之间的相关性,提高了模型表达能力和推荐结果的准确率。
-
公开(公告)号:CN114489964A
公开(公告)日:2022-05-13
申请号:CN202111517469.9
申请日:2021-12-08
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于联邦学习的车载网络信用优先任务卸载方法,其步骤包括:1)EC、CV分别将自己的位置信息和可用资源信息发送给CC;其中,EC为边缘云服务器,CV为车辆网中的车辆,CC为云中心;2)当CV需要进行任务卸载时,发送卸载任务信息给DC;其中,DC为车辆网中的决策中心;3)对于当前一批待处理的卸载任务,DC从CC获取发送卸载任务的各CV的信誉值;然后根据信用值设置各卸载任务的处理优先级,优先为处理优先级高的卸载任务制定任务卸载决策并发送给对应的EC和CV;其中,CC根据CV的行为信息计算对应CV的所述信誉值。本发明将信誉值用在任务卸载决策中,从而实现决策性能的提高。
-
公开(公告)号:CN110288507B
公开(公告)日:2021-03-09
申请号:CN201910371230.1
申请日:2019-05-06
Applicant: 中国科学院信息工程研究所
IPC: G06T1/20 , G06F16/901
Abstract: 本发明提出一种基于GPU的多分区强连通图检测方法,包括以下步骤:加载图数据并统一存储格式;在图数据上基于GPU进行第一剪枝操作,检测出1‑SCC;在除1‑SCC外的部分上选取中心点,从中心点开始并行地前向和后向遍历,更新状态得到SCC和多个分区;在未被检测的图数据上基于GPU进行第二剪枝操作,检测出2‑SCC;在未被检测的图数据上检测弱连通区域,并在弱连通区域上每个选取中心点,从中心点开始前向遍历;在弱连通区域的中未被前向遍历到的区域随机选取保存的最后一个顶点做为副中心点,从中心点与副中心点开始后向遍历,再进行第一剪枝操作,再次更新状态得到SCC和分区;通过上述步骤获得全部的SCC。
-
公开(公告)号:CN107220363A
公开(公告)日:2017-09-29
申请号:CN201710422561.4
申请日:2017-06-07
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/2282 , G06F16/2471
Abstract: 本发明涉及一种支持全局复杂检索的跨地域查询方法及系统。该方法包括:1)建立用于跨地域查询的全局元数据组织结构,其包括全局视图以及全局视图与各数据中心的数据表的映射关系;2)根据各数据中心的数据表的结构调整,动态调整全局视图与各数据中心的数据表的映射关系;3)解析用户的查询请求,根据全局元数据组织结构将查询任务下发至各数据中心执行查询,各数据中心将查询结果反馈至全局点;4)全局点将各数据中心返回的查询结果进行汇总,并将汇总后的数据展示给用户,从而实现跨地域查询。本发明能够提高对各数据中心大数据的综合分析能力,在大数据处理领域具有很强的实用性和应用范围,具有广阔的应用前景。
-
-
-
-