-
公开(公告)号:CN110737757A
公开(公告)日:2020-01-31
申请号:CN201810719687.2
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F40/247
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:从目标搜索引擎的查询语句集合中确定出包括目标属性文本的查询语句;基于目标搜索引擎的点击日志,获取与确定出的查询语句点击内容相关,且包括相同实体概念文本的查询语句,其中,点击日志用于记录输入的查询语句和与输入的查询语句关联的点击内容;根据所获取的查询语句包括的属性文本的集合生成目标属性文本的同义文本。该实施方式提供了一种基于搜索引擎点击日志的同义文本挖掘机制,丰富了属性文本的同义文本的生成方法。
-
公开(公告)号:CN111177522B
公开(公告)日:2023-08-18
申请号:CN201811330607.0
申请日:2018-11-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535
Abstract: 本发明公开了页面聚合方法、装置、计算机设备及存储介质,其中方法包括:按照抓取要求从站点抓取页面,并将抓取到的页面作为一条物料存储到物料库中;根据物料库中的页面的URL挖掘出分页与封面页之间的映射规则;根据映射规则,将物料库中的封面页对应的分页内容聚合到封面页,生成一条新的物料。应用本发明所述方案,能够优化推荐结果等。
-
公开(公告)号:CN110737757B
公开(公告)日:2022-07-05
申请号:CN201810719687.2
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F40/247
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:从目标搜索引擎的查询语句集合中确定出包括目标属性文本的查询语句;基于目标搜索引擎的点击日志,获取与确定出的查询语句点击内容相关,且包括相同实体概念文本的查询语句,其中,点击日志用于记录输入的查询语句和与输入的查询语句关联的点击内容;根据所获取的查询语句包括的属性文本的集合生成目标属性文本的同义文本。该实施方式提供了一种基于搜索引擎点击日志的同义文本挖掘机制,丰富了属性文本的同义文本的生成方法。
-
公开(公告)号:CN111177522A
公开(公告)日:2020-05-19
申请号:CN201811330607.0
申请日:2018-11-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535
Abstract: 本发明公开了页面聚合方法、装置、计算机设备及存储介质,其中方法包括:按照抓取要求从站点抓取页面,并将抓取到的页面作为一条物料存储到物料库中;根据物料库中的页面的URL挖掘出分页与封面页之间的映射规则;根据映射规则,将物料库中的封面页对应的分页内容聚合到封面页,生成一条新的物料。应用本发明所述方案,能够优化推荐结果等。
-
公开(公告)号:CN110737755A
公开(公告)日:2020-01-31
申请号:CN201810717387.0
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332
Abstract: 本发明实施例提出一种检索方法,包括:根据待检索问题进行常问问题FAQ检索,得到FAQ检索结果;根据所述待检索问题进行表格检索,得到表格检索结果;对FAQ检索结果和表格检索结果进行排序,以确定所述待检索问题对应的答案。本发明实施例采用FAQ检索和表格检索结合,能够扩大可检索到的问题的范围,得到的答案更加符合用户的意图,能够满足用户更多方面的检索需求。
-
-
-
-