Automatic selection of blocking column for de-duplication
    9.
    发明授权
    Automatic selection of blocking column for de-duplication 失效
    自动选择用于重复数据删除的阻止列

    公开(公告)号:US08560506B2

    公开(公告)日:2013-10-15

    申请号:US13447726

    申请日:2012-04-16

    CPC classification number: G06F17/30303

    Abstract: A method of blocking column selection can include determining a first parameter for each column set of a plurality of column sets, wherein the first parameter indicates distribution of blocks in the column set, and determining a second parameter for each column set. The second parameter can indicate block size for the column set. For each column set, a measure of blockability that is dependent upon at least the first parameter and the second parameter can be calculated using a processor. The plurality of column sets can be ranked according to the measures of blockability.

    Abstract translation: 阻止列选择的方法可以包括为多个列集合的每个列集合确定第一参数,其中第一参数指示列集合中的块的分布,以及为每个列集合确定第二参数。 第二个参数可以指示列集的块大小。 对于每个列集合,可以使用处理器来计算取决于至少第一参数和第二参数的可阻止性的度量。 可以根据阻塞性的测量对多个列集进行排序。

    AUTOMATIC SELECTION OF BLOCKING COLUMN FOR DE-DUPLICATION
    10.
    发明申请
    AUTOMATIC SELECTION OF BLOCKING COLUMN FOR DE-DUPLICATION 失效
    自动选择阻塞柱进行去重现

    公开(公告)号:US20130151490A1

    公开(公告)日:2013-06-13

    申请号:US13447726

    申请日:2012-04-16

    CPC classification number: G06F17/30303

    Abstract: A method of blocking column selection can include determining a first parameter for each column set of a plurality of column sets, wherein the first parameter indicates distribution of blocks in the column set, and determining a second parameter for each column set. The second parameter can indicate block size for the column set. For each column set, a measure of blockability that is dependent upon at least the first parameter and the second parameter can be calculated using a processor. The plurality of column sets can be ranked according to the measures of blockability.

    Abstract translation: 阻止列选择的方法可以包括为多个列集合的每个列集合确定第一参数,其中第一参数指示列集合中的块的分布,以及为每个列集合确定第二参数。 第二个参数可以指示列集的块大小。 对于每个列集合,可以使用处理器来计算取决于至少第一参数和第二参数的可阻止性的度量。 可以根据阻塞性的测量对多个列集进行排序。

Patent Agency Ranking