-
公开(公告)号:CN101702179B
公开(公告)日:2012-07-25
申请号:CN200910246673.4
申请日:2009-12-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种在数据挖掘中去除重复的方法、设备和系统。所述方法包括:接收两个或者更多标识信息的特征值;当两个或者更多标识信息的特征值相同时,确定所述两个或者更多标识信息是重复的;以及选取重复的标识信息中的一个作为重复标识信息的代表。
-
公开(公告)号:CN101702179A
公开(公告)日:2010-05-05
申请号:CN200910246673.4
申请日:2009-12-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种在数据挖掘中去除重复的方法、设备和系统。所述方法包括:接收两个或者更多标识信息的特征值;当两个或者更多标识信息的特征值相同时,确定所述两个或者更多标识信息是重复的;以及选取重复的标识信息中的一个作为重复标识信息的代表。
-