-
公开(公告)号:CN104199924A
公开(公告)日:2014-12-10
申请号:CN201410441120.5
申请日:2014-09-01
Applicant: 北京交通大学长三角研究院
IPC: G06F17/30
CPC classification number: G06F17/30477 , G06F17/30864
Abstract: 本发明公开了一种选择具有快照关系的网络表格的方法及装置,该方法包括:将网络表格的集合按照网络表格的实体列的内容的领域进行分类,其中,实体列为能够标识网络表格的记录的属性列;在分类后的网络表格集合中,根据预设规则,选择与第一表格对应的多个第二表格,其中,多个第二表格是与第一表格具有快照关系的网络表格。通过本发明,选择与第一表格具有快照关系的多个第二表格,第二表格可用于优化查询以提高查询的效率,也可以用于大数据环境,使得系统能够实时地返回部分查询结果。
-
公开(公告)号:CN103761305B
公开(公告)日:2016-10-12
申请号:CN201410030391.1
申请日:2014-01-22
Applicant: 北京交通大学长三角研究院
IPC: G06F17/30
Abstract: 本发明公开了一种适合大数据环境具有抗噪声能力的实体解析方法,所述方法是在传统相关性聚类方法的基础上进行改进,通过引入邻居关系和核概念,由两层算法实现。上层算法基于邻居关系对数据进行粗糙的、允许重叠的预分块处理;下层算法通过引入核的概念,精确地定义了节点与类之间的关联程度,以便准确地判断节点的归属,进而提高相关性聚类的准确度。
-
公开(公告)号:CN103761305A
公开(公告)日:2014-04-30
申请号:CN201410030391.1
申请日:2014-01-22
Applicant: 北京交通大学长三角研究院
IPC: G06F17/30
Abstract: 本发明公开了一种适合大数据环境具有抗噪声能力的实体解析方法,所述方法是在传统相关性聚类方法的基础上进行改进,通过引入邻居关系和核概念,由两层算法实现。上层算法基于邻居关系对数据进行粗糙的、允许重叠的预分块处理;下层算法通过引入核的概念,精确地定义了节点与类之间的关联程度,以便准确地判断节点的归属,进而提高相关性聚类的准确度。
-
公开(公告)号:CN104199924B
公开(公告)日:2018-05-11
申请号:CN201410441120.5
申请日:2014-09-01
Applicant: 北京交通大学长三角研究院
IPC: G06F17/30
Abstract: 本发明公开了一种选择具有快照关系的网络表格的方法及装置,该方法包括:将网络表格的集合按照网络表格的实体列的内容的领域进行分类,其中,实体列为能够标识网络表格的记录的属性列;在分类后的网络表格集合中,根据预设规则,选择与第一表格对应的多个第二表格,其中,多个第二表格是与第一表格具有快照关系的网络表格。通过本发明,选择与第一表格具有快照关系的多个第二表格,第二表格可用于优化查询以提高查询的效率,也可以用于大数据环境,使得系统能够实时地返回部分查询结果。
-
-
-