-
公开(公告)号:CN110706015B
公开(公告)日:2023-06-13
申请号:CN201910775155.5
申请日:2019-08-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院
IPC: G06Q30/0242
Abstract: 本发明公开了一种面向广告点击率预测的特征选取方法,包括:步骤(1)构造特征集;步骤(2)对特征集的所有特征进行评估,筛选并标记所有无益特征,并将对模型影响最大的无益特征从特征集中删除,再更新特征集;步骤(3)对无益特征进行评估,筛选并标记该次评估产生的新无益特征,将对模型影响最大的新无益特征删除,再次更新特征集;若未产生新无益特征,则停止操作,得到的特征集为有效特征集;若产生新无益特征,则迭代执行步骤(3),直至未产生新无益特征。本发明采用双向式特征选择方式对特征集进行选择筛选,降低了迭代次数,不需再对特征全集进行迭代,能得到较大的模型提升效果,特征选择工程时间复杂度低,工作效率高。
-
公开(公告)号:CN110689368B
公开(公告)日:2022-07-19
申请号:CN201910780066.X
申请日:2019-08-22
Applicant: 北京大学(天津滨海)新一代信息技术研究院
IPC: G06Q30/02
Abstract: 本发明公开了一种移动应用内广告点击率预测系统设计方法,包括:对广告数据进行集成、清洗和变换的预处理;利用预处理后的广告数据生成特征并构造特征全集;针对所述特征全集进行有效特征选取,选出有效特征集;利用所述有效特征集对广告点击率预测模型进行训练。本发明实施例提供的移动应用内广告点击率预测方法,对广告数据中的长尾数据按照相似性进行归类,按照数据取值频次进行归类,克服了现有技术无法有效利用隐含在长尾数据中的信息的缺陷,充分利用了长尾数据中的信息提升了预测效果。
-
公开(公告)号:CN110706015A
公开(公告)日:2020-01-17
申请号:CN201910775155.5
申请日:2019-08-21
Applicant: 北京大学(天津滨海)新一代信息技术研究院
IPC: G06Q30/02
Abstract: 本发明公开了一种面向广告点击率预测的特征选取方法,包括:步骤(1)构造特征集;步骤(2)对特征集的所有特征进行评估,筛选并标记所有无益特征,并将对模型影响最大的无益特征从特征集中删除,再更新特征集;步骤(3)对无益特征进行评估,筛选并标记该次评估产生的新无益特征,将对模型影响最大的新无益特征删除,再次更新特征集;若未产生新无益特征,则停止操作,得到的特征集为有效特征集;若产生新无益特征,则迭代执行步骤(3),直至未产生新无益特征。本发明采用双向式特征选择方式对特征集进行选择筛选,降低了迭代次数,不需再对特征全集进行迭代,能得到较大的模型提升效果,特征选择工程时间复杂度低,工作效率高。
-
公开(公告)号:CN110689368A
公开(公告)日:2020-01-14
申请号:CN201910780066.X
申请日:2019-08-22
Applicant: 北京大学(天津滨海)新一代信息技术研究院
IPC: G06Q30/02
Abstract: 本发明公开了一种移动应用内广告点击率预测系统设计方法,包括:对广告数据进行集成、清洗和变换的预处理;利用预处理后的广告数据生成特征并构造特征全集;针对所述特征全集进行有效特征选取,选出有效特征集;利用所述有效特征集对广告点击率预测模型进行训练。本发明实施例提供的移动应用内广告点击率预测方法,对广告数据中的长尾数据按照相似性进行归类,按照数据取值频次进行归类,克服了现有技术无法有效利用隐含在长尾数据中的信息的缺陷,充分利用了长尾数据中的信息提升了预测效果。
-
-
-