-
公开(公告)号:CN114186749A
公开(公告)日:2022-03-15
申请号:CN202111546245.0
申请日:2021-12-16
Applicant: 暨南大学
Abstract: 本发明提供了一种基于强化学习及遗传算法的柔性车间调度方法及模型,属于人工智能技术领域。根据柔性作业车间的特点,建立柔性作业车间调度模型;对遗传算法和基于熵的置信域优化强化学习算法中的基本参数进行初始化;利用基于熵的置信域优化算法更新遗传算法中的参数,并分别对参与交叉和变异的染色体种群进行交叉和变异操作,生成参与交叉和变异的新染色体种群;计算新种群中每个个体的适应度,确定基于熵的置信域优化算法中的状态参数,对新染色体种群执行遗传算法操作;反复执行上述迭代至截止,并输出结果。本发明将基于熵的置信域优化强化学习算法与遗传算法相结合,提高了柔性车间调度的性能,增强车间生产的鲁棒性,提高生产效率。
-
公开(公告)号:CN113421346A
公开(公告)日:2021-09-21
申请号:CN202110739853.7
申请日:2021-06-30
Applicant: 暨南大学
Abstract: 本发明涉及一种增强驾驶感的AR‑HUD抬头显示界面的设计方法,属于虚拟现实领域,其包括:通过摄像头采集驾驶环境的影像信息;调整摄像头参数,完成相机标定;对图像进行预处理;虚拟呈像,标定AR‑HUD系统相关的参数并实现物体的虚实注册,实现导航虚拟标记与道路现实目标匹配、对准、提示;对AR‑HUD界面进行设计,在游戏引擎中进行虚拟驾驶场景的构建,并通过相关端口连接实体车辆设备,然后结合头戴式VR显示系统构建虚拟测试平台,遴选出最优的AR‑HUD显示系统。本发明有效避免了实车测试周期长、成本高、危险性大等缺点,同时也弥补了现有技术中对界面设计架构与用户的视觉匹配等方面的短板。
-
公开(公告)号:CN113359744A
公开(公告)日:2021-09-07
申请号:CN202110684879.6
申请日:2021-06-21
Applicant: 暨南大学
IPC: G05D1/02
Abstract: 本发明公开了一种基于安全强化学习及视觉传感器的机器人避障系统,包括卷积神经模块,所述卷积神经网络模块包括长短期记忆单元;还包括加入LSTM单元、第一卷积层、第二卷积层、第一全连接层、第二全连接层、输出层。本发明采用强化学习算法的增强,使多维,连续,多约束问题能够较好的收敛于信任域内,解决了以往带约束的强化学习算法的诸多问题。可以大幅提高生产安全,普适地应用在不同场合的危险工作上,在解放劳动力的同时,提高了操作安全性、精准性。
-
公开(公告)号:CN114143737B
公开(公告)日:2023-11-24
申请号:CN202111561251.3
申请日:2021-12-17
Applicant: 暨南大学
Abstract: 本发明公开了一种基于WiFi无接触感知的多人室内定位方法,该方法包括单人离线指纹数据库构建和多人在线定位匹配两个阶段。首先通过对收集到的信道状态信息进行预处理、特征提取等步骤构建单人指纹数据库,所提取的特征反映位置信息;其次,将多人室内定位场景建模为盲源分离问题,并采用RobustICA算法对混合的CSI信号进行分离;最后,对分离后的信号提取特征,利用KNN算法与指纹库进行匹配,完成对多个人的无接触感知定位。本发明通过对WiFi的信道状态信息进行特征提取、分离、匹配,实现成本低、可用性大、适用性强的多人无接触感知定位。
-
公开(公告)号:CN115034653A
公开(公告)日:2022-09-09
申请号:CN202210738071.6
申请日:2022-06-27
Applicant: 暨南大学
Abstract: 本发明涉及用于人工智能技术领域,具体涉及一种基于transformer的端到端动态作业车间调度模型,可以应用于不同尺寸的DJSSP(作业车间调度问题)。由特征提取模块、特征压缩模块、动作选择模块所构成。特征提取模块提取生产环境特征,并利用特征压缩模块将生产环境的特征进一步压缩成定长向量。然后,动作选择模块根据压缩后的能够反映生产环境状态的定长向量,实时选择简单优先级规则。本发明所建立的模型是Transformer在DJSSP中的第一个应用,不仅提高了工业调度的生产能力,而且为未来深度学习在DJSSP中的研究提供了范式。
-
公开(公告)号:CN113282787B
公开(公告)日:2022-01-04
申请号:CN202110567524.9
申请日:2021-05-24
Applicant: 暨南大学
IPC: G06F16/735 , G06K9/62 , G06N20/00
Abstract: 本发明提出一种基于强化学习的个性化短视频推荐方法以及系统,个性化短视频推荐方法包括:收集单个用户的历史记录,得到真实数据分布和专家轨迹;将真实数据分布输入GAN‑SD算法,对用户的特征进行建模,得到用户特征分布;将用户特征分布和专家轨迹输入到MAIL算法,对用户的交互行为建模,得到用户的决策函数;得到用户特征分布和决策函数后,完成对用户的建模;建模推荐引擎和用户的马尔科夫决策过程,用TRPO+ANC算法训练推荐引擎的马尔科夫决策过程,根据得到的累积回报值确定不同动作下的短视频推荐策略,从短视频推荐策略中选择最优的短视频推荐策略,将该策略加载为实际使用的推荐引擎。
-
-
-
-
-