基于多步新奇度的时态序列迭代预测算法、介质和设备

    公开(公告)号:CN112287599B

    公开(公告)日:2023-08-04

    申请号:CN202011071114.7

    申请日:2020-10-09

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于多步新奇度的时态序列迭代预测算法、介质和设备,算法包括先基于时态序列数据建立内、外部模型,初始化多维经验矩阵;外部模型抽样训练;外部模型在每一次交互中,从时态序列数据获取当前状态和奖励,并输出当前状态、行为和预测的执行行为后的状态;内部模型对外部模型预测的状态进行多步预测,预测信息存储到多维经验矩阵中,不断迭代更新内部模型;定义新奇度,在外部模型的每一次迭代,从多维经验矩阵中抽出对应元素,并比较每个元素和外部模型预测的状态来计算新奇度;基于新奇度不断迭代更新内、外部模型,多维经验矩阵也根据时间节点不断更新。本发明解决强化学习中稀疏奖励的训练障碍,可达到模型更快收敛的效果。

    基于多步新奇度的时态序列迭代预测算法、介质和设备

    公开(公告)号:CN112287599A

    公开(公告)日:2021-01-29

    申请号:CN202011071114.7

    申请日:2020-10-09

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于多步新奇度的时态序列迭代预测算法、介质和设备,算法包括先基于时态序列数据建立内、外部模型,初始化多维经验矩阵;外部模型抽样训练;外部模型在每一次交互中,从时态序列数据获取当前状态和奖励,并输出当前状态、行为和预测的执行行为后的状态;内部模型对外部模型预测的状态进行多步预测,预测信息存储到多维经验矩阵中,不断迭代更新内部模型;定义新奇度,在外部模型的每一次迭代,从多维经验矩阵中抽出对应元素,并比较每个元素和外部模型预测的状态来计算新奇度;基于新奇度不断迭代更新内、外部模型,多维经验矩阵也根据时间节点不断更新。本发明解决强化学习中稀疏奖励的训练障碍,可达到模型更快收敛的效果。

    一种双目视觉裸眼3D图像生成方法

    公开(公告)号:CN111047709A

    公开(公告)日:2020-04-21

    申请号:CN201911202342.0

    申请日:2019-11-29

    Applicant: 暨南大学

    Abstract: 本发明公开的一种双目视觉裸眼3D图像生成方法,包括以下步骤:通过采集装置进行图像采集,获取彩色+灰色的原始双目图像对;对所获取的原始双目图像对完成采集装置的标定,获得采集装置之间相对位置;通过采集装置之间相对位置,将原始双目图像进行双目校正,得到校正后的双目图像,包括黑白右目图像和彩色目左图像;利用双目匹配算法将校正后的双目图像进行双目匹配,生成视差图像;利用视差图像对黑白右目图像进行图像绘制,生成彩色右目图像,将彩色左目图像与彩色右目图像合成一张图像,进行像素交织,生成最终双目图像;本发明采用匹配精度高的双目匹配方法,降低硬件成本,能够以更高的精度以及舒适度应用于实时场景。

    一种满足实时数据带宽需求的时隙分配方法

    公开(公告)号:CN106792972B

    公开(公告)日:2019-06-18

    申请号:CN201611085682.6

    申请日:2016-11-30

    Applicant: 暨南大学

    Abstract: 本发明公开了一种满足实时数据带宽需求的时隙分配方法,该方法包括:一种三跳链路时隙分配算法,在路由建立过程中以三跳链路为单位进行时隙分配,在三跳链路范围内对每一跳链路可用时隙集合的时隙进行干扰程度统计,统计每个时隙在三跳链路范围内出现的次数,在三跳链路范围内分配时隙时,选择可用时隙集合元素最少的链路,在该链路分配干扰程度最小的时隙;一种在路由控制包保存时隙状态信息的轻量级存储方法,通过使用二进制整数记录节点时隙集合,减小路由控制包由于记录时隙信息产生的存储开销;一种在TDMA协议区分路由控制包和实时数据包进行处理的方法,避免数据包队列阻塞引起的时隙资源利用率下降的问题。

    基于深度强化学习的个性化学习推荐方法

    公开(公告)号:CN108614865A

    公开(公告)日:2018-10-02

    申请号:CN201810307140.1

    申请日:2018-04-08

    Applicant: 暨南大学

    Inventor: 汤胤 黄书强 王雯

    CPC classification number: G06Q50/205

    Abstract: 本发明公开了一种基于深度强化学习的个性化学习推荐方法,包括以下步骤:定义知识点及题目的难度属性,根据知识点之间的关系构建知识点网络图;根据知识点之间的关系确定知识点下题目之间的关系,构建题目网络图;根据用户行为数据,在题目网络图中得到针对指定用户当前状态下的子图,作为学习边界;进而使用深度强化学习算法,利用用户历史记录建模,训练得到在用户当前状态下的子图中如何选取割集策略。本发明方法可智能化地为用户推荐最佳题目,节省用户学习时间,使其学习效率提高,学习体验提升。

    一种双目视觉裸眼3D图像生成方法

    公开(公告)号:CN111047709B

    公开(公告)日:2023-05-05

    申请号:CN201911202342.0

    申请日:2019-11-29

    Applicant: 暨南大学

    Abstract: 本发明公开的一种双目视觉裸眼3D图像生成方法,包括以下步骤:通过采集装置进行图像采集,获取彩色+灰色的原始双目图像对;对所获取的原始双目图像对完成采集装置的标定,获得采集装置之间相对位置;通过采集装置之间相对位置,将原始双目图像进行双目校正,得到校正后的双目图像,包括黑白右目图像和彩色目左图像;利用双目匹配算法将校正后的双目图像进行双目匹配,生成视差图像;利用视差图像对黑白右目图像进行图像绘制,生成彩色右目图像,将彩色左目图像与彩色右目图像合成一张图像,进行像素交织,生成最终双目图像;本发明采用匹配精度高的双目匹配方法,降低硬件成本,能够以更高的精度以及舒适度应用于实时场景。

    无线网络中基于概率重传的包调度方法

    公开(公告)号:CN104219170B

    公开(公告)日:2017-08-08

    申请号:CN201410449883.4

    申请日:2014-09-04

    Applicant: 暨南大学

    Abstract: 本发明公开了一种无线网络中基于概率重传的包调度方法,该方法在设定调度权的时候考虑了链路状态跟队列拥塞情况两方面因素:链路状态通过对每个队列设置估测因子来确定,重传概率则考虑了具体的队列拥塞情况,整个调度过程提出了一种概率重传机制,从而避免队头阻塞问题。此外,调度算法还对先前发送失败的队列进行发包补偿以保证公平性。本发明在概率重传机制的保障下能“择优而行”地调度待发送的队列数据包,由于考虑基站处队列情况进行调度,从而缓解了瓶颈结点处的数据包累积压力。该方法对于无线网络调度方法的研究有着广阔的应用前景。

Patent Agency Ranking