-
公开(公告)号:CN108959425B
公开(公告)日:2021-08-06
申请号:CN201810592946.X
申请日:2018-06-11
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2455 , G06F16/2458
Abstract: 本发明提供一种海量数据Top‑k选择查询方法,有效地处理大数据上的top‑k选择查询,提出了基于表扫描的TKS算法,该算法通过对预排序表PT的顺序扫描来计算top‑k选择查询结果。本发明具有早结束特性;在连续扫描预排序表的过程中,只需要维护k个候选结果;并且选择剪切和分数剪切可以有效的减少I/O的代价,选择剪切是利用位图编码去掉不满足选择条件的元组,而分数剪切是利用评分函数的单调性和预排序列表的有序性跳过那些不满足分数要求的元组。
-
公开(公告)号:CN108959425A
公开(公告)日:2018-12-07
申请号:CN201810592946.X
申请日:2018-06-11
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/30
Abstract: 本发明提供一种海量数据Top‑k选择查询方法,有效地处理大数据上的top‑k选择查询,提出了基于表扫描的TKS算法,该算法通过对预排序表PT的顺序扫描来计算top‑k选择查询结果。本发明具有早结束特性;在连续扫描预排序表的过程中,只需要维护k个候选结果;并且选择剪切和分数剪切可以有效的减少I/O的代价,选择剪切是利用位图编码去掉不满足选择条件的元组,而分数剪切是利用评分函数的单调性和预排序列表的有序性跳过那些不满足分数要求的元组。
-
公开(公告)号:CN109284306B
公开(公告)日:2021-08-31
申请号:CN201811039452.5
申请日:2018-09-06
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2455
Abstract: 本发明提供一种海量不完整数据的skyline查询方法,设备及存储介质,扫描的TSI算法,可以有效地在海量不完整数据上进行skyline的计算处理。TSI通过对表执行两遍扫描来计算出skyline的结果。第一遍扫描的时候TSI忽略了非传递性以及循环支配特性,并且将skyline结果的精化留到第二遍扫描时进行。还针对第一个顺序扫描阶段提出了跳过不必要的元组的方法,进一步地增加了TSI的性能。
-
公开(公告)号:CN109284306A
公开(公告)日:2019-01-29
申请号:CN201811039452.5
申请日:2018-09-06
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2455
Abstract: 本发明提供一种海量不完整数据的skyline查询方法,设备及存储介质,扫描的TSI算法,可以有效地在海量不完整数据上进行skyline的计算处理。TSI通过对表执行两遍扫描来计算出skyline的结果。第一遍扫描的时候TSI忽略了非传递性以及循环支配特性,并且将skyline结果的精化留到第二遍扫描时进行。还针对第一个顺序扫描阶段提出了跳过不必要的元组的方法,进一步地增加了TSI的性能。
-
-
-