-
公开(公告)号:CN104408087A
公开(公告)日:2015-03-11
申请号:CN201410641811.X
申请日:2014-11-13
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F16/3334 , G06F17/2765
Abstract: 本发明实施例提供一种作弊文本的识别方法和系统,方法包括:接收文本信息;将文本信息按自然语序划分为多个语句段,并计算各所述语句段在训练语料中出现的概率;根据文本信息中包含的各语句段在训练语料中出现的概率确定文本信息是否为作弊文本。本发明的技术方案实现了一种针对作弊文本的有效识别方法,同时也提高了识别的准确率。
-
公开(公告)号:CN104361077B
公开(公告)日:2017-11-03
申请号:CN201410638360.4
申请日:2014-11-06
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 杨燕
IPC: G06F17/30
Abstract: 本发明实施例公开了一种网页打分模型的创建方法及装置。所述方法包括:获取网页训练样本集,其中网页训练样本集包括与预设的至少一个查询词中各个查询词下的多个样本网页的特征向量和标注打分;根据网页训练样本集中各样本网页的标注打分以及预先确定的至少一个网页待调整特征,生成目标损失函数;根据所生成的目标损失函数以及网页训练样本集中各样本网页的特征向量,创建网页打分模型。本发明实施例提供的技术方案,能够提高网页排序结果的准确率,提升用户的搜索体验。
-
公开(公告)号:CN104361077A
公开(公告)日:2015-02-18
申请号:CN201410638360.4
申请日:2014-11-06
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 杨燕
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明实施例公开了一种网页打分模型的创建方法及装置。所述方法包括:获取网页训练样本集,其中网页训练样本集包括与预设的至少一个查询词中各个查询词下的多个样本网页的特征向量和标注打分;根据网页训练样本集中各样本网页的标注打分以及预先确定的至少一个网页待调整特征,生成目标损失函数;根据所生成的目标损失函数以及网页训练样本集中各样本网页的特征向量,创建网页打分模型。本发明实施例提供的技术方案,能够提高网页排序结果的准确率,提升用户的搜索体验。
-
-