- 专利标题: 一种基于强化学习的个性化短视频推荐方法以及系统
-
申请号: CN202110567524.9申请日: 2021-05-24
-
公开(公告)号: CN113282787B公开(公告)日: 2022-01-04
- 发明人: 郭洪飞 , 廖梓钧 , 陈世帆 , 曾云辉 , 何智慧 , 吴千华 , 蔡泽炬 , 张恒基
- 申请人: 暨南大学
- 申请人地址: 广东省广州市黄埔大道西601号
- 专利权人: 暨南大学
- 当前专利权人: 暨南大学
- 当前专利权人地址: 广东省广州市黄埔大道西601号
- 代理机构: 深圳新创友知识产权代理有限公司
- 代理商 江耀纯
- 主分类号: G06F16/735
- IPC分类号: G06F16/735 ; G06K9/62 ; G06N20/00
摘要:
本发明提出一种基于强化学习的个性化短视频推荐方法以及系统,个性化短视频推荐方法包括:收集单个用户的历史记录,得到真实数据分布和专家轨迹;将真实数据分布输入GAN‑SD算法,对用户的特征进行建模,得到用户特征分布;将用户特征分布和专家轨迹输入到MAIL算法,对用户的交互行为建模,得到用户的决策函数;得到用户特征分布和决策函数后,完成对用户的建模;建模推荐引擎和用户的马尔科夫决策过程,用TRPO+ANC算法训练推荐引擎的马尔科夫决策过程,根据得到的累积回报值确定不同动作下的短视频推荐策略,从短视频推荐策略中选择最优的短视频推荐策略,将该策略加载为实际使用的推荐引擎。
公开/授权文献
- CN113282787A 一种基于强化学习的个性化短视频推荐方法以及系统 公开/授权日:2021-08-20