-
公开(公告)号:CN102043857B
公开(公告)日:2012-06-20
申请号:CN201010607741.8
申请日:2010-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种最近邻查询方法,用于为基础数据集中的至少一个待查找对象在参考数据集中查找与所述待查找对象距离最近的对象;该方法包括:对基础数据集进行分割,得到多个分片;对参考数据集进行分割,得到多个分片;在与所述待查找对象所在的基础数据集分片相对应的参考数据集分片内计算与所述待查找对象距离最近的对象;根据边界判定条件将计算结果分为确定结果或待定结果;计算待定结果中的待查找对象的最近邻;将确定结果与待定结果中的待查找对象的最近邻进行合并,得到所述至少一个待查找对象的最近邻。本发明在实现最近邻查询时考虑到了节点间的通信,避免了一些对象的最近邻在不同分片中时容易发生的误查询现象。
-
公开(公告)号:CN102075584B
公开(公告)日:2014-08-06
申请号:CN201110033439.0
申请日:2011-01-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种HDFS及其访问方法和系统。所述方法,包括下列步骤:分布式文件系统接收客户端发来的访问请求,根据实际情况设置packet的大小;获取所述访问请求的数据的起始偏移值,以及请求数据的长度,计算需要chunk的数量;将所述chunk封装成数据包传给客户端。其能够在保证HDFS顺序访问性能的情况下,优化随机访问性能。
-
公开(公告)号:CN102043857A
公开(公告)日:2011-05-04
申请号:CN201010607741.8
申请日:2010-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种最近邻查询方法,用于为基础数据集中的至少一个待查找对象在参考数据集中查找与所述待查找对象距离最近的对象;该方法包括:对基础数据集进行分割,得到多个分片;对参考数据集进行分割,得到多个分片;在与所述待查找对象所在的基础数据集分片相对应的参考数据集分片内计算与所述待查找对象距离最近的对象;根据边界判定条件将计算结果分为确定结果或待定结果;计算待定结果中的待查找对象的最近邻;将确定结果与待定结果中的待查找对象的最近邻进行合并,得到所述至少一个待查找对象的最近邻。本发明在实现最近邻查询时考虑到了节点间的通信,避免了一些对象的最近邻在不同分片中时容易发生的误查询现象。
-
公开(公告)号:CN102075584A
公开(公告)日:2011-05-25
申请号:CN201110033439.0
申请日:2011-01-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种HDFS及其访问方法和系统。所述方法,包括下列步骤:分布式文件系统接收客户端发来的访问请求,根据实际情况设置packet的大小;获取所述访问请求的数据的起始偏移值,以及请求数据的长度,计算需要chunk的数量;将所述chunk封装成数据包传给客户端。其能够在保证HDFS顺序访问性能的情况下,优化随机访问性能。
-
-
-