-
公开(公告)号:CN117112902A
公开(公告)日:2023-11-24
申请号:CN202311106875.5
申请日:2023-08-30
Applicant: 南京大学
IPC: G06F16/9535 , G06Q30/0601 , G06N20/00
Abstract: 本发明公开一种基于多模态对比学习算法的离线强化学习商品推荐系统,首先获取商品的相关图像、描述商品的文字以及其他商品的相关特征,通过对比学习算法融合多个模态的信息,得到商品的特征表示;将商品推荐过程建模为强化学习问题,通过用户曾经产生行为的商品特征和用户的基本信息得到用户的状态,系统推荐的商品作为动作,用户对于推荐的商品的反馈作为奖赏。利用离线强化学习算法在现有用户行为日志数据上进行训练,得到推荐系统的策略。本发明利用对比学习算法综合多个模态的信息构造物品的特征,在将推荐系统建模为强化学习问题的前提下,通过离线强化学习算法得到了推荐策略,使得商品推荐系统能够更好地完成推荐任务。