-
公开(公告)号:CN112819498A
公开(公告)日:2021-05-18
申请号:CN201911130009.3
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/02
Abstract: 本申请公开了一种转化率确定方法、装置、电子设备和存储介质,涉及人工智能技术领域。具体实现方案为:基于多任务模型中特征表示网络层,根据待预测用户数据和待预测媒介信息生成用户媒介特征表示;基于多任务模型中的通用模型,根据用户媒介特征表示确定待预测用户对待预测媒介信息的转化率;其中,多任务模型包括所述通用模型以及至少两个区间模型,不同区间模型关联有不同转化率区间,且通用模型与至少两个区间模型共享特征表示网络层。本申请实施例的多任务模型中包括通用模型及关联有不同转化率区间的区间模型,使得训练完的特征表示网络层可以准确全面的提取数据的特征表示,提高多任务模型的泛化能力,进而提高转化率预估的准确性。
-
公开(公告)号:CN112819497A
公开(公告)日:2021-05-18
申请号:CN201911128977.0
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开一种转化率预测方法、装置、设备和存储介质,涉及大数据技术领域。具体实现方案为:获取待预测用户数据,以及待预测媒介信息;根据待预测媒介信息所属的投放方,在多任务模型中确定投放方关联的目标子模型;其中,多任务模型中的子模型是基于样本数据的场景信息训练得到,目标子模型是基于子模型对于投放方的预测结果确定的;基于目标子模型,根据待预测用户数据和待预测媒介信息,得到待预测用户对待预测媒介信息的转化率。本申请实施例通过采用多任务模型来预测用户对媒介信息的转化率,避免单任务模型中无法进行多层面的特征学习,充分考虑媒介信息在各场景维度下的场景特征,提高多任务模型进行转化率预测的准确率。
-
公开(公告)号:CN112818291A
公开(公告)日:2021-05-18
申请号:CN201911130006.X
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了一种转化率预测方法、装置、设备和介质,涉及大数据技术领域。具体实现方案为:若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型;基于所述目标区间子模型,对所述新增候选对象进行转化率预测。因为采用了由通用子模型过度至区间子模型进行转化率预测的技术手段,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
-
公开(公告)号:CN112817965A
公开(公告)日:2021-05-18
申请号:CN201911128994.4
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种数据拼接方法、装置、电子设备和存储介质,涉及大数据处理技术领域。具体实现方案为:从至少两个数据分桶中为待拼接的目标数据选择目标分桶;将所述目标数据分发到所述目标分桶的未拼接数据中,以指示所述目标分桶在监测到拼接触发事件时,对所述未拼接数据进行拼接;其中所述拼接触发事件根据所述目标分桶中的未拼接数据和已拼接数据生成。本申请实施例由于目标分桶中的未拼接数据和已拼接数据是动态变化的,而根据未拼接数据和已拼接数据的数量生成拼接触发事件,可到达动态调整拼接时间间隔的目的,也即可自适应调整数据拼接频率,由此既保证了数据的时效性,还能减少整个拼接过程中计算资源的消耗,提升计算效率。
-
公开(公告)号:CN106326386B
公开(公告)日:2021-05-18
申请号:CN201610677187.8
申请日:2016-08-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9038 , G06F16/951 , G06F16/953 , G06F16/9532
Abstract: 本申请提出一种搜索结果的展示方法和装置,该搜索结果的展示方法包括:接收查询词;获取与所述查询词对应的搜索结果;根据所述查询词识别用户意图;根据所述用户意图和所述搜索结果,得到更新后的搜索结果;展示所述更新后的搜索结果。该方法能够实现搜索结果中内容的动态更新,更好的满足用户需求。
-
公开(公告)号:CN108334489B
公开(公告)日:2021-05-14
申请号:CN201710044590.1
申请日:2017-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/284 , G06F40/289
Abstract: 本申请公开了一种文本核心词识别方法和装置,其中,该方法包括:根据一级样本文本、所述一级样本文本的一级优选核心词,以及所述一级优选核心词的实体特征,训练得到条件随机场CRF模型;从利用所述CRF模型和至少一种关键词提取算法分别针对二级样本文本所提取出的关键词中,选出所述二级样本文本的二级优选核心词;根据所述二级样本文本和所述二级优选核心词,对深度神经网络模型进行训练,得到文本核心词识别模型;以及利用所述文本核心词识别模型,识别目标文本的核心词。应用本申请,可通过多层次优化训练样本,提高文本核心词识别模型的识别准确率,以此提高抽取的核心词的准确度。
-
公开(公告)号:CN112541145A
公开(公告)日:2021-03-23
申请号:CN201910893817.9
申请日:2019-09-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/958 , G06Q30/02
Abstract: 本申请公开了一种页面展现方法、装置、设备及存储介质,涉及大数据领域。具体实现方案为:获取多个备选的展现页面,所述展现页面与第一类展现转化和至少一个第二类展现转化关联,第二类展现转化概率高于第一类展现转化概率;根据与所述第一类展现转化匹配的第一类历史展现页面,以及与所述第二类展现转化匹配的第二类历史展现页面,对各所述备选的展现页面的第一类展现转化概率进行预测;根据预测结果,在所述多个备选的展现页面中获取至少一个目标页面,并对所述至少一个目标页面进行展示。本申请实施例的技术方案可以在深层转化正样本数量较少的情况下,提高深层转化概率预估的准确性。
-
公开(公告)号:CN104504104B
公开(公告)日:2018-09-07
申请号:CN201410841895.1
申请日:2014-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提出一种用于搜索引擎的图片物料处理方法、装置和搜索引擎,其中,该用于搜索引擎的图片物料处理方法,包括以下步骤:获取源图片物料;对源图片物料进行过滤以生成待处理图片物料;对待处理图片物料进行特征提取以生成待处理图片物料对应的信息特征;根据待处理图片物料对应的信息特征确定待处理图片物料的目标区域;以及根据目标区域对待处理图片物料进行处理以生成图片。本发明的用于搜索引擎的图片物料处理方法,通过利用深度学习处理技术对待处理图片进行处理后可为搜索引擎提供充足、丰富且高质量的图片物料,能够适应不同的搜索引擎产品规范和要求、满足网民对高质量的图片的需求。
-
公开(公告)号:CN108334489A
公开(公告)日:2018-07-27
申请号:CN201710044590.1
申请日:2017-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本申请公开了一种文本核心词识别方法和装置,其中,该方法包括:根据一级样本文本、所述一级样本文本的一级优选核心词,以及所述一级优选核心词的实体特征,训练得到条件随机场CRF模型;从利用所述CRF模型和至少一种关键词提取算法分别针对二级样本文本所提取出的关键词中,选出所述二级样本文本的二级优选核心词;根据所述二级样本文本和所述二级优选核心词,对深度神经网络模型进行训练,得到文本核心词识别模型;以及利用所述文本核心词识别模型,识别目标文本的核心词。应用本申请,可通过多层次优化训练样本,提高文本核心词识别模型的识别准确率,以此提高抽取的核心词的准确度。
-
公开(公告)号:CN108268506A
公开(公告)日:2018-07-10
申请号:CN201611262654.7
申请日:2016-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种推广信息的处理方法及装置,该方法包括:获取检索词对应的检索结果以及检索词在预设推广数据库中对应的多个推广信息,检索结果具有利用第一评价模型,基于检索结果特征数据获得的检索结果评分;利用第二评价模型,基于推广信息的推广信息特征数据,对多个推广信息进行评分,得到第二评分;将第二评分转换为第一评分模型下对应的第一评分;基于转换后的第一评分以及检索结果的检索结果评分,将推广信息插入到检索结果中。本发明实施例将推荐信息的第二评分与检索结果的第一评分进行对齐,根据对齐的第一评分实现搜索结果与推广信息混合排序,进而达到显示推广信息的同时避免在搜索结果前优先显示搜索结果,提高搜索结果露出率。
-
-
-
-
-
-
-
-
-