基于遗憾探索的推荐方法、装置、电子设备与存储介质

    公开(公告)号:CN113626721A

    公开(公告)日:2021-11-09

    申请号:CN202111185156.8

    申请日:2021-10-12

    Inventor: 白栋栋 洪志理

    Abstract: 本发明提供一种基于遗憾探索的推荐方法、装置、电子设备与存储介质,所述方法包括:基于目标用户的用户特征和各候选对象的对象特征,确定各候选对象的状态;将各候选对象的状态输入至评分模型,得到评分模型输出的各候选对象的评分;基于各候选对象的评分,确定向目标用户推荐的对象;评分模型是基于样本对象的样本状态进行强化学习得到的;在强化学习过程中,评分模型基于遗憾值集合,以及当前样本状态进行评分探索,遗憾值集合存储有历史状态及其对应的遗憾值,遗憾值基于历史状态下各候选评分的优势确定,历史状态是在当前样本状态之前的样本状态,从而提高了探索的效率,实现了对不同用户进行个性化的精确推荐,提高了用户体验。

    基于遗憾探索的推荐方法、装置、电子设备与存储介质

    公开(公告)号:CN113626721B

    公开(公告)日:2022-01-25

    申请号:CN202111185156.8

    申请日:2021-10-12

    Inventor: 白栋栋 洪志理

    Abstract: 本发明提供一种基于遗憾探索的推荐方法、装置、电子设备与存储介质,所述方法包括:基于目标用户的用户特征和各候选对象的对象特征,确定各候选对象的状态;将各候选对象的状态输入至评分模型,得到评分模型输出的各候选对象的评分;基于各候选对象的评分,确定向目标用户推荐的对象;评分模型是基于样本对象的样本状态进行强化学习得到的;在强化学习过程中,评分模型基于遗憾值集合,以及当前样本状态进行评分探索,遗憾值集合存储有历史状态及其对应的遗憾值,遗憾值基于历史状态下各候选评分的优势确定,历史状态是在当前样本状态之前的样本状态,从而提高了探索的效率,实现了对不同用户进行个性化的精确推荐,提高了用户体验。

Patent Agency Ranking