-
公开(公告)号:CN112884501A
公开(公告)日:2021-06-01
申请号:CN201911207323.7
申请日:2019-11-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种数据处理方法、装置、电子设备及存储介质,涉及机器学习模型的处理技术领域。具体实现方案为:获取目标用户使用的任务模型的训练状态;根据训练状态将目标用户划分到目标任务,目标任务为多任务学习模型中的一个任务,多任务学习模型配置有与训练状态匹配的任务;使用任务对目标用户进行预测。本申请实施例提供的数据处理方案,能够获取单任务模型对于目标用户的训练状态。多任务模型中根据不同的训练状态配置有不同的任务,根据训练状态将目标用户划分到相应的目标任务中,由目标任务对目标用户进行预测,进而使用与目标用户匹配度更高的目标任务对目标用户进行预测,能够更加准确的预测转化率,优化转化率的预测效果。
-
公开(公告)号:CN112822302A
公开(公告)日:2021-05-18
申请号:CN201911127228.6
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L29/12
Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。
-
公开(公告)号:CN105677764B
公开(公告)日:2020-05-08
申请号:CN201511022937.X
申请日:2015-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951 , G06F16/957
Abstract: 本申请公开了信息提取方法和装置。所述方法的一具体实施方式包括:将预先获取的网页文件解析为标签树结构,并从所述标签树的节点中识别出所述网页文件中的网页正文所在的至少一个正文节点;将所述至少一个正文节点包含的内容进行段落划分,生成各个段落块,并根据各个段落块关联的标签的属性为各个段落块设定标签属性;基于各个段落块的标签属性将各个段落块包含的文本内容进行分类;基于分类结果从段落块包含的文本内容中提取包含问题和答案的信息。该实施方式实现了信息自动、精确的提取。
-
公开(公告)号:CN105677927B
公开(公告)日:2019-04-12
申请号:CN201610200781.8
申请日:2016-03-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535
Abstract: 本申请公开了用于提供搜索结果的方法和装置。所述方法的一具体实施方式包括:获取用户输入的查询关键词以及用户的特征信息;根据所述查询关键词和所述特征信息确定所述用户的需求信息;基于所述查询关键词和所述需求信息进行搜索,得出至少一个待展示网页;以及根据所述至少一个待展示网页生成交互式对话。该实施方式能够为用户提供包含关键内容的个性化搜索结果,减少了搜索结果中的冗余信息,缩短了用户获取信息的时间。
-
公开(公告)号:CN104537072B
公开(公告)日:2019-03-12
申请号:CN201410843836.8
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/35 , G06F16/332
Abstract: 本发明提出一种搜索方法和装置,该搜索方法包括接收客户端发送的当前搜索词;获取与所述当前搜索词对应的图片可表词集合,并根据所述图片可表词集合获取对应的图片结果;将所述图片结果发送给所述客户端。该方法能够提高搜索结果的信息表达效果。
-
公开(公告)号:CN108540508A
公开(公告)日:2018-09-14
申请号:CN201710119807.0
申请日:2017-03-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了用于推送信息的方法、装置和设备。该方法的一具体实施方式包括:接收用户通过终端输入的搜索信息;获取与搜索信息匹配的自然搜索结果集合和自然搜索结果集合的历史点击记录;根据历史点击记录确定是否向终端推送待推送信息;若确定向终端推送待推送信息,则获取与搜索信息匹配的待推送信息集合,并向终端推送自然搜索结果集合和待推送信息集合。该实施方式实现了有针对性地信息推送,提高推送的信息的点击率。
-
公开(公告)号:CN108205532A
公开(公告)日:2018-06-26
申请号:CN201611168916.3
申请日:2016-12-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本申请公开了一种生成网页的方法和装置。该方法的一具体实施方式包括:获取用户的浏览目标信息;对根据上述浏览目标信息所抓取的网页的页面内容进行识别,以得到至少一个内容单元集合,其中,每个上述内容项集合包括至少一个内容单元;计算上述浏览目标信息与各个内容单元集合所包含的内容的第一相关度;基于上述内容单元集合,按照上述第一相关度由高到低的排列顺序生成新网页。该实施方式可以根据用户的浏览目标信息重新生成新网页,使网页内容具有针对性,可以有效缩短用户获取信息的路径,从而提高信息呈现效率。
-
公开(公告)号:CN107742128A
公开(公告)日:2018-02-27
申请号:CN201710984693.6
申请日:2017-10-20
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/6268 , G06F17/30268 , G06F17/30705 , G06K9/46
Abstract: 本申请实施例公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:获取待分类图像;提取所述待分类图像的特征信息;将所述特征信息导入预先建立的图像分类模型,得到所述待分类图像的行业标签信息,并输出得到的行业标签信息,其中,所述图像分类模型用于表征图像的特征信息与行业标签信息之间的对应关系,所述图像分类模型为包括残差神经网络的深度神经网络模型。该实施方式通过使用图像分类模型,提高了所生成的、待分类图像的行业标签信息的准确性。
-
公开(公告)号:CN104504712B
公开(公告)日:2017-08-18
申请号:CN201410842993.7
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种图片处理方法和装置,该图片处理方法包括获取待处理的图片;识别所述图片是否是拼接图;如果所述图片是拼接图,根据预设的拼接图分割算法,对所述图片进行分割,得到组成所述图片的子图片。该图片处理方法能够识别出拼接图,并按照拼接图的处理方式处理拼接图,从而实现根据图片类别的不同选择对应的处理方式,提高处理效果。
-
公开(公告)号:CN106874507A
公开(公告)日:2017-06-20
申请号:CN201710111055.3
申请日:2017-02-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本申请公开了用于推送信息的方法、装置及服务器。该方法的一具体实施方式包括:接收终端设备发来的搜索关键词;查询上述终端设备的用户网络搜索记录,上述用户网络搜索记录包括与接收到上述搜索关键词的时间相差设定时间内的网络搜索记录;根据上述搜索关键词和用户网络搜索记录从预置的搜索信息集合中确定上述搜索关键词对应的搜索信息;将所确定的搜索信息发送给上述终端设备,以供在上述终端设备上进行呈现。该实施方式提高了用户获取信息的效率。
-
-
-
-
-
-
-
-
-