-
公开(公告)号:CN111177522B
公开(公告)日:2023-08-18
申请号:CN201811330607.0
申请日:2018-11-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535
Abstract: 本发明公开了页面聚合方法、装置、计算机设备及存储介质,其中方法包括:按照抓取要求从站点抓取页面,并将抓取到的页面作为一条物料存储到物料库中;根据物料库中的页面的URL挖掘出分页与封面页之间的映射规则;根据映射规则,将物料库中的封面页对应的分页内容聚合到封面页,生成一条新的物料。应用本发明所述方案,能够优化推荐结果等。
-
公开(公告)号:CN111177522A
公开(公告)日:2020-05-19
申请号:CN201811330607.0
申请日:2018-11-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535
Abstract: 本发明公开了页面聚合方法、装置、计算机设备及存储介质,其中方法包括:按照抓取要求从站点抓取页面,并将抓取到的页面作为一条物料存储到物料库中;根据物料库中的页面的URL挖掘出分页与封面页之间的映射规则;根据映射规则,将物料库中的封面页对应的分页内容聚合到封面页,生成一条新的物料。应用本发明所述方案,能够优化推荐结果等。
-