-
公开(公告)号:CN113642635B
公开(公告)日:2023-09-15
申请号:CN202110925544.9
申请日:2021-08-12
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
IPC: G06F18/241 , G06F18/214
Abstract: 本公开提供了一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及深度学习技术领域。实现方案为:获取离散化的多个待变换的样本标签值;确定对待变换的样本标签值进行数据变换的约束条件;通过参数寻优方法确定满足约束条件的变换后的样本标签值集合,变换后的样本标签值集合中的样本标签值与该多个待变换的样本标签值一一对应;以及基于变换后的样本标签值集合对模型进行训练。
-
公开(公告)号:CN113642740A
公开(公告)日:2021-11-12
申请号:CN202110925460.5
申请日:2021-08-12
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
IPC: G06N20/00
Abstract: 本公开提供了一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及深度学习技术领域。实现方案为:确定待训练模型的损失函数梯度的约束条件;对损失函数梯度的多个参数分别进行离散化取值,以获得多个参数组,该多个参数组中的每一个参数组包括该多个参数中的每一个参数离散化取值所获得的相应参数值,该多个参数组中的任意两个参数组之间至少一个参数的参数值不同;通过参数寻优方法确定满足约束条件的第一梯度值集合,第一梯度值集合中的每一个梯度值与该多个参数组分别对应;以及对待训练模型进行训练,以基于第一梯度值集合确定每次训练过程所对应的梯度值进行反向传播。
-
公开(公告)号:CN113642635A
公开(公告)日:2021-11-12
申请号:CN202110925544.9
申请日:2021-08-12
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
IPC: G06K9/62
Abstract: 本公开提供了一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及深度学习技术领域。实现方案为:获取离散化的多个待变换的样本标签值;确定对待变换的样本标签值进行数据变换的约束条件;通过参数寻优方法确定满足约束条件的变换后的样本标签值集合,变换后的样本标签值集合中的样本标签值与该多个待变换的样本标签值一一对应;以及基于变换后的样本标签值集合对模型进行训练。
-
公开(公告)号:CN105447005A
公开(公告)日:2016-03-30
申请号:CN201410389486.2
申请日:2014-08-08
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
IPC: G06F17/30
Abstract: 本发明实施例提供了一种对象推送方法,包括:获得客户端对应的关键词;获得所述关键词所指代的M个实体,M为大于或者等于2的整数;依据使用所述客户端的用户的历史记录,对所述M个实体中第i个实体的第一概率进行调整,以获得所述第i个实体的第二概率;依据所述M个实体的第二概率,对与所述M个实体相匹配的目标对象进行排序,以获得排序结果;向所述客户端推送所述排序结果。本发明实施例还提供一种对象推送装置。根据本发明实施例提供的技术方案,可以实现提高对象推送的可靠性。
-
公开(公告)号:CN105447004A
公开(公告)日:2016-03-30
申请号:CN201410389467.X
申请日:2014-08-08
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
IPC: G06F17/30
Abstract: 本发明提供一种查询推荐词的挖掘、相关查询方法及装置。本发明实施例通过对M个查询候选词中每个查询候选词进行分词处理,以获得所述每个查询候选词的N个分词结果,M为大于或等于1的整数,N为大于或等于2的整数,进而根据所述每个查询候选词的N个分词结果,生成所述每个查询候选词所对应的P个主词,P为大于或等于1的整数,使得能够根据所述每个查询候选词所对应的P个主词,获得与每个主词对应的Q个查询候选词,以作为Q个查询推荐词,Q为大于或等于1,且小于或等于M的整数,这样,查询推荐词与查询关键词之间,不再只是具有包含与被包含关系,还具有层次结构关系,且若干个查询推荐词之间具有层次结构关系。
-
公开(公告)号:CN104156458A
公开(公告)日:2014-11-19
申请号:CN201410412587.7
申请日:2014-08-20
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
IPC: G06F17/30
CPC classification number: G06F17/30896 , G06F17/30017
Abstract: 本发明实施例提供了一种信息的提取方法,包括:抓取网页,所述网页为用于显示至少一个多媒体资源的网页;获得所述网页的源代码中至少一个目标节点;利用每个所述目标节点,从所述源代码中获得目标代码,所述目标代码为所述网页的源代码中该目标节点所对应的多媒体资源的源代码;从所述目标代码中,提取所述多媒体资源的描述信息。本发明实施例还提供一种信息的提取装置。根据本发明实施例提供的技术方案,可以实现提高多媒体资源的描述信息的提取操作的可靠性。
-
公开(公告)号:CN111967599B
公开(公告)日:2023-07-28
申请号:CN202010876261.5
申请日:2020-08-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06N3/08
Abstract: 本申请实施例公开了用于训练模型的方法、装置、电子设备及计算机可读存储介质,涉及深度学习、神经网络、信息匹配、模型训练、信息推荐技术领域。该方法的一具体实施方式包括:获取用户的兴趣特征和样本待推荐信息的属性特征;按隐式特征组合的方式分别获取兴趣特征和属性特征的至少一个中间表示;将至少两个中间表示按预设的精简交叉方式构造为隐式特征组合;根据隐式特征组合进行训练,得到目标模型。该实施方式通过对基于中间表示构造出的隐式特征组合进行训练,使得训练出的目标模型具有更强的泛化能力、精简的交叉方式尽可能的避免了组合爆炸,也更加便于构造出高阶的特征组合。
-
公开(公告)号:CN113642740B
公开(公告)日:2023-08-01
申请号:CN202110925460.5
申请日:2021-08-12
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
IPC: G06N20/00
Abstract: 本公开提供了一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及深度学习技术领域。实现方案为:确定待训练模型的损失函数梯度的约束条件;对损失函数梯度的多个参数分别进行离散化取值,以获得多个参数组,该多个参数组中的每一个参数组包括该多个参数中的每一个参数离散化取值所获得的相应参数值,该多个参数组中的任意两个参数组之间至少一个参数的参数值不同;通过参数寻优方法确定满足约束条件的第一梯度值集合,第一梯度值集合中的每一个梯度值与该多个参数组分别对应;以及对待训练模型进行训练,以基于第一梯度值集合确定每次训练过程所对应的梯度值进行反向传播。
-
公开(公告)号:CN111967599A
公开(公告)日:2020-11-20
申请号:CN202010876261.5
申请日:2020-08-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06N3/08
Abstract: 本申请实施例公开了用于训练模型的方法、装置、电子设备及计算机可读存储介质,涉及深度学习、神经网络、信息匹配、模型训练、信息推荐技术领域。该方法的一具体实施方式包括:获取用户的兴趣特征和样本待推荐信息的属性特征;按隐式特征组合的方式分别获取兴趣特征和属性特征的至少一个中间表示;将至少两个中间表示按预设的精简交叉方式构造为隐式特征组合;根据隐式特征组合进行训练,得到目标模型。该实施方式通过对基于中间表示构造出的隐式特征组合进行训练,使得训练出的目标模型具有更强的泛化能力、精简的交叉方式尽可能的避免了组合爆炸,也更加便于构造出高阶的特征组合。
-
公开(公告)号:CN104199898A
公开(公告)日:2014-12-10
申请号:CN201410425516.0
申请日:2014-08-26
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 马小龙
CPC classification number: G06F17/30864
Abstract: 本发明实施例提供了一种属性信息的获取方法,包括:依据语料库中的文本信息,获得N个关键词,N为大于或者等于1的整数;获得M个候选词,所述M个候选词为N个关键词中的M个关键词或者标签库中的M个标签,M为大于0且小于或者等于N的整数;依据所述M个候选词中第i个候选词与所述N个关键词中每个所述关键词的共现概率,从所述M个候选词中选择K个候选词,以作为所述文本信息对应的对象的属性信息,i的取值为1到M中的整数,K为小于或者等于M且大于0的整数;本发明实施例还提供一种属性信息的获取装置、推送方法及装置。本发明实施例提供的技术方案可以实现提高获得对象的属性信息的准确性。
-
-
-
-
-
-
-
-
-