-
公开(公告)号:CN116108296A
公开(公告)日:2023-05-12
申请号:CN202310082978.6
申请日:2023-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/955 , G06F16/22 , G06F18/22
Abstract: 本公开提供了一种相似站点识别方法、装置、电子设备和存储介质,涉及计算机技术领域领域,尤其涉及智能搜索领域。具体实现方案为:查询待识别站点对应的目标记录信息,目标记录信息包括待识别站点对应的目标规范名称CNAME;从预设数据库中查找目标记录信息对应的关联站点,预设数据库中存储有多个记录信息,以及每个记录信息对应的至少一个站点;计算待识别站点和关联站点之间的相似度;若相似度大于预设阈值,则确定待识别站点与所述关联站点为相似站点。如此,可以简单快捷的识别相似站点,减少识别同质化网站的工作量。