-
公开(公告)号:CN114172725B
公开(公告)日:2023-11-14
申请号:CN202111485889.3
申请日:2021-12-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L9/40 , G06F16/958
Abstract: 本公开提供了一种非法网站的处理方法、装置、设备和存储介质,涉及计算机技术领域,尤其大数据技术领域。具体实现方案为:确定非法网站;基于网站之间的链接指向关系,确定非法网站的候选传播网站;根据所述候选传播网站进行分析,确定非法网站的源头传播网站。本公开实施例能够提高非法网站的处理效率。
-
公开(公告)号:CN116628306A
公开(公告)日:2023-08-22
申请号:CN202310124802.2
申请日:2023-02-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/953 , G06F16/955
Abstract: 本公开提供了一种网页资源获取方法、装置、电子设备以及存储介质,涉及大数据技术领域,尤其涉及智能搜索领域。具体实现方案为:在预设站点集合中,确定目标站点集合;在第一时间段内,采用第二地址段,获取所述目标站点集合中的网页资源;基于该第一时间段内获取网页资源的成功率,在该第一地址段和该第二地址段中确定目标地址段;采用该目标地址段,获取该预设站点集合中的各个网页资源。根据本公开,能够在多个地址段内进行择优适配,对网页资源进行多出口获取调度,可以尽可能地抓取预设站点集合中的全量资源,提升网页资源获取的覆盖度。
-
公开(公告)号:CN116108296A
公开(公告)日:2023-05-12
申请号:CN202310082978.6
申请日:2023-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/955 , G06F16/22 , G06F18/22
Abstract: 本公开提供了一种相似站点识别方法、装置、电子设备和存储介质,涉及计算机技术领域领域,尤其涉及智能搜索领域。具体实现方案为:查询待识别站点对应的目标记录信息,目标记录信息包括待识别站点对应的目标规范名称CNAME;从预设数据库中查找目标记录信息对应的关联站点,预设数据库中存储有多个记录信息,以及每个记录信息对应的至少一个站点;计算待识别站点和关联站点之间的相似度;若相似度大于预设阈值,则确定待识别站点与所述关联站点为相似站点。如此,可以简单快捷的识别相似站点,减少识别同质化网站的工作量。
-
公开(公告)号:CN113076480A
公开(公告)日:2021-07-06
申请号:CN202110432753.X
申请日:2021-04-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F16/955 , G06Q30/02
Abstract: 本公开提供了一种页面推荐方法、装置、电子设备、存储介质和计算机程序产品,涉及计算机领域,更具体地涉及内容推荐。一种页面推荐方法,包括:获取用于描述页面的源码数据;基于源码数据,确定页面的一个或多个显示区域;基于一个或多个显示区域中的每个显示区域中包括的页面元素,确定页面的页面推荐度;以及基于页面的页面推荐度控制是否将页面提供给终端设备。
-
公开(公告)号:CN111831878A
公开(公告)日:2020-10-27
申请号:CN201910322043.4
申请日:2019-04-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951 , G06F16/955
Abstract: 本发明提供一种构建索引关系的方法,属于互联网内容索引技术领域。该方法包括:获取对象的对象类,并选取部分的对象类为目标对象类,获取对象的数字内容和按不同范围方式获取数字内容的不同层级的标识符,再将对应目标对象类中对象的标识符索引于对应剩余对象类中对象的标识符之前;将标识符进行分类,获得标识符类并选取部分的标识符类为目标标识符类,接着将处于剩余标识符类中且属于与目标对象类中对象对应的标识符加入至目标标识符类中,然后将属于目标标识符类中的标识符索引于属于剩余标识符类中的标识符之前;通过目标标识符类中的标识符和对应在目标标识符类中标识符的数字内容映射生成索引关系。
-
公开(公告)号:CN104239570B
公开(公告)日:2018-04-13
申请号:CN201410519986.3
申请日:2014-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种论文的搜索方法,包括:接收搜索词;根据搜索词生成多个搜索结果并提供,其中,每个搜索结果包括多个属性参数,其中,多个属性参数中至少有部分属性参数具有对应的实体标识;以及当搜索结果中的属性参数被触发时,根据属性参数对应的实体标识生成新的搜索结果并提供。本发明实施例的方法,彻底解决了实体重名、长搜索词的部分匹配等的问题,提高了搜索结果的精确度,提升了用户体验。本发明还公开了一种论文的搜索装置。
-
公开(公告)号:CN104731926B
公开(公告)日:2018-03-09
申请号:CN201510140722.1
申请日:2015-03-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提出一种推荐词的展现方法和装置,该推荐词的展现方法包括:针对至少两个维度中的每个维度从基础数据中提取推荐词;从提取的推荐词中提取至少两种特征,并根据所述至少两种特征对所述推荐词进行处理;根据行为数据展现处理后的推荐词。本发明可以摆脱用户的知识背景以及检索词的局限性,真正地为用户推荐相关知识,引导用户搜索,可以很好地满足用户无法描述或者描述不精确的知识需求,并且通过用户行为挖掘以及历史大数据分析可以有效避免时滞问题,推荐的知识都具有很高的时效性。
-
公开(公告)号:CN104573015A
公开(公告)日:2015-04-29
申请号:CN201510012725.7
申请日:2015-01-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明提出一种信息检索方法和装置,该信息检索方法包括接收检索词;获取与所述检索词对应的检索结果,其中,所述检索结果中记录有词集合,所述词集合包括所述检索词以及所述检索词的其他表述方式的词;展示所述检索结果。该方法能够增加获取的检索结果的数量,提升检索效果。
-
公开(公告)号:CN102025559B
公开(公告)日:2013-07-03
申请号:CN201010536638.9
申请日:2010-11-09
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张博
IPC: H04L12/26
Abstract: 本发明涉及一种用于基于分级来进行死链检测和处理的方法和网络设备,本发明中,通过基于第一预定规则,结合死链库中链接的当前链接状态,以更新或维持该链接的链接记录,并基于第二预定规则,根据所述更新后或所维持的链接记录,来对该链接及/或其链接记录执行相应的操作。与现有技术相比,本发明具有以下优点:本发明根据死链的多次检测结果,将死链划分为多种状态,并对各种状态的死链采用不同的处理方式,使得根据本发明的方案能够在检测海量死链的同时,实现死链的快速检测。
-
公开(公告)号:CN117130524A
公开(公告)日:2023-11-28
申请号:CN202311149394.2
申请日:2023-09-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F3/0484 , G06F3/0488 , G06F3/0481 , G06Q30/0251
Abstract: 本公开提供了交互方法、装置、电子设备以及存储介质,涉及计算机技术领域,尤其涉及自然语言处理技术领域和信息流技术领域。具体实现方案为:展示资源投放平台的对话交互界面;获取输入至对话交互界面中的资源投放需求信息;执行与资源投放需求信息相匹配的编排逻辑,得到执行结果;以及在对话交互界面中展示执行结果。
-
-
-
-
-
-
-
-
-