-
公开(公告)号:CN104978431B
公开(公告)日:2019-05-17
申请号:CN201510409072.6
申请日:2015-07-13
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/958
Abstract: 本发明实施例公开了一种网页数据融合方法和装置。该方法包括:对待融合的至少两个基础网页,通过语义识别提取基础实体的信息;对于基础实体的信息相同的至少两个基础网页,根据各基础网页中包括的超级链接关系,获取各基础网页的链接网页;将链接网页满足设定融合条件的至少两个基础网页进行融合。本发明实施例在对至少两个基础网页进行融合时,不只考虑了基础网页的自身属性,还融入了基础网页的链接网页的属性,提高了数据融合的准确率。
-
公开(公告)号:CN104978431A
公开(公告)日:2015-10-14
申请号:CN201510409072.6
申请日:2015-07-13
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明实施例公开了一种网页数据融合方法和装置。该方法包括:对待融合的至少两个基础网页,通过语义识别提取基础实体的信息;对于基础实体的信息相同的至少两个基础网页,根据各基础网页中包括的超级链接关系,获取各基础网页的链接网页;将链接网页满足设定融合条件的至少两个基础网页进行融合。本发明实施例在对至少两个基础网页进行融合时,不只考虑了基础网页的自身属性,还融入了基础网页的链接网页的属性,提高了数据融合的准确率。
-