一种多任务强化学习推荐方法

    公开(公告)号:CN114417124B

    公开(公告)日:2024-11-01

    申请号:CN202111450470.4

    申请日:2021-11-30

    Abstract: 本发明公开了一种多任务强化学习推荐方法,步骤1:采集用户在项目集上的评分信息,根据项目的配置文件构造项目的向量表示;步骤2:采集有用户评分的项目以及与其相关的所有知识图谱信息,构造对应的三元组;步骤3:构造马尔科夫决策过程,并建立Q网络;步骤4:建立基于DDQN的推荐模型;步骤5:建立知识表示学习模型;步骤6:将知识表示学习作为DDQN推荐模型的辅助任务进行训练,交替更新DDQN推荐模型和知识表示学习模型。本发明使得推荐模型能够更深入挖掘项目与动作之间潜在的语义关系,从而提高了推荐的长期收益以及推荐精确度;同时由于使用多任务模型,提高了强化学习训练中的泛化性,也提升了训练的速度。

    一种三角距离估计的水下传感器网络定位方法

    公开(公告)号:CN107623895A

    公开(公告)日:2018-01-23

    申请号:CN201710722305.7

    申请日:2017-08-22

    Abstract: 本发明公开了一种三角距离估计的水下传感器网络定位方法,属于水下无线传感器网络技术领域。其特征在于:锚节点广播坐标信息,未知节点接收锚节点信息建立本地存储列表,保存相关信息。当未知节点具有三个及以上参考节点信息时通过投影技术实现未知节点的定位。未知节点的参考节点信息不足时,通过三角距离估计两跳参考节点的距离来增加参考节点数量,参考节点数量满足定位要求时,通过投影技术进行定位。定位成功的信任值高的节点升级为参考节点辅助其他节点定位。本发明是一种三维分布式的定位方法,实验证明该方法有较高的节点定位覆盖率和较小的定位误差。

    一种基于动态检测点和标签估计的RFID防碰撞方法

    公开(公告)号:CN107506676A

    公开(公告)日:2017-12-22

    申请号:CN201710722326.9

    申请日:2017-08-22

    Abstract: 本发明公开了一种基于动态检测点和标签估计的RFID防碰撞方法,属于射频识别技术领域。其特征在于,采用样本时隙的计算方法得出部分时隙的大小,进而确定检测点在帧中的位置,使得检测点随着帧长动态的调整,同时采用采用空闲、成功和碰撞三种时隙的实际持续时间结合碰撞比率提前求出碰撞时隙与剩余标签数量的关系。具体步骤包括:阅读器激活标签然后发送选择命令选中与阅读器匹配的标签;阅读器发送请求问询命令,标签收到命令之后随机选择帧中时隙;阅读器盘存帧中时隙;在帧中检测点位置判断是否有剩余标签;判断当前帧长是否最优;继续盘存时隙直至帧的末尾,更新下一周期帧长。

    一种在神经网络下结合人格特征的跨域推荐方法

    公开(公告)号:CN109766493B

    公开(公告)日:2022-08-02

    申请号:CN201811584347.X

    申请日:2018-12-24

    Inventor: 曲立平 刘云鹏

    Abstract: 本发明属于基于大数据的个性化推荐领域,具体说是提出一种在神经网络下结合人格特征的跨域推荐方法。在神经网络下结合人格特征的跨域推荐方法,具体包括:(1)获取数据;(2)筛选用户;(3)提取关键词。(4)搭建神经网络。(5)针对人格特征,给具有相似人格特征的人进行个性化物品推荐。本发明通过结合人格特征,在神经网络的基础上,利用卷积神经网络CNN搭建神行网络体系,为具有相似人格特征的用户推荐相关物品。由于人格特征是不易改变且容易预测的,因为基于人格特征做个性化推荐能够提高推荐准确度的。

    一种多任务强化学习推荐方法

    公开(公告)号:CN114417124A

    公开(公告)日:2022-04-29

    申请号:CN202111450470.4

    申请日:2021-11-30

    Abstract: 本发明公开了一种多任务强化学习推荐方法,步骤1:采集用户在项目集上的评分信息,根据项目的配置文件构造项目的向量表示;步骤2:采集有用户评分的项目以及与其相关的所有知识图谱信息,构造对应的三元组;步骤3:构造马尔科夫决策过程,并建立Q网络;步骤4:建立基于DDQN的推荐模型;步骤5:建立知识表示学习模型;步骤6:将知识表示学习作为DDQN推荐模型的辅助任务进行训练,交替更新DDQN推荐模型和知识表示学习模型。本发明使得推荐模型能够更深入挖掘项目与动作之间潜在的语义关系,从而提高了推荐的长期收益以及推荐精确度;同时由于使用多任务模型,提高了强化学习训练中的泛化性,也提升了训练的速度。

    一种深度强化学习的机会路由候选集节点排序方法

    公开(公告)号:CN113783782A

    公开(公告)日:2021-12-10

    申请号:CN202111053638.8

    申请日:2021-09-09

    Abstract: 本发明属于水下声学传感器网络技术领域,具体涉及一种深度强化学习的机会路由候选集节点排序方法。本发明克服了现有机会路由候选集节点排序算法存在考虑因素单一和适应性差等问题,利用深度强化学习智能体与水下机会路由网络模型进行交互,使用深度神经网络拟合候选集节点信息与节点转发优先级的关系。本发明结合了深度学习和强化学习的优势,智能体通过与水下机会路由网络模型交互来自动学到一个机会路由候选集节点排序算法,此过程极少依赖人工经验和外部数据信息。本发明使得候选集节点排序更加智能,且适应性更好。

    一种多普勒辅助水下传感器网络时间同步方法

    公开(公告)号:CN106028437B

    公开(公告)日:2019-06-14

    申请号:CN201610289417.3

    申请日:2016-05-04

    Abstract: 本发明公开了一种多普勒辅助水下传感器网络时间同步方法。信标节点不断广播信息数据包,待同步节点不断接收信标节点广播的信息,在每次接收到信息时记录待同步节点的本地时间,并且计算与信标节点之间的相对速度;待同步节点利用收集到的数据计算时钟的频率偏斜;待同步节点计算出时钟频率偏斜后给信标节点发送一个请求信息;信标节点收到待同步节点发送的请求信息后,随机等待一段时间给待同步节点发送一个响应信息;待同步节点接收信标节点发送的响应信息时记录本地时间,并计算方法计算与信标节点之间的相对速度,最后通过收集的数据计算最终的时钟相位偏差。本发明能减少节点移动对时间同步的负面影响,从而提高时间同步精度。

    一种基于移动信标的分布式水下网络定位方法

    公开(公告)号:CN106028278B

    公开(公告)日:2019-06-14

    申请号:CN201610289418.8

    申请日:2016-05-04

    Abstract: 本发明公开了一种基于移动信标的分布式水下网络定位方法,属于水下无线传感器网络技术领域。1)AUV逐层移动,每隔相同时间广播发送信标信号,未知节点根据收到AUV发射信号的顺序,对其信号进行编码。2)未知节点收到的相邻路径上的信号覆盖范围的几何模型相交产生最内相交体,估计最内相交体的质心作为自身位置。本发明是一种三维分布式的定位方法,通过计算最内相交体的质心,来确定未知节点的位置。实验证明本发明有较高的节点定位准确率和节点定位覆盖率。

Patent Agency Ranking