-
公开(公告)号:CN114218867B
公开(公告)日:2022-06-28
申请号:CN202111563799.1
申请日:2021-12-20
Applicant: 暨南大学
IPC: G06F30/27 , G06Q10/04 , G06F111/04
Abstract: 本发明提供了一种基于熵优化安全强化学习的特种设备流程控制方法及系统,属于人工智能技术领域。本发明根据特种设备生产的特点和实现的功能建立特种设备模型;提取生产线所需优化的参数,并定义符合特种设备生产特点的状态、动作、奖励函数、折扣因子、成本函数和策略模型,构建安全强化学习模型训练系统,采用马尔科夫决策过程进行训练;采用泛化优势估计算法实现基于Actor‑critic框架的熵优化安全强化学习算法,对马尔科夫决策过程中的每个策略设置上下边界,对特种设备进行流程控制。本发明采用的熵优化安全强化学习算法的流程控制,使得所构建的模型具有更好的泛化性,能够有效提高操作安全性、精准性。
-
公开(公告)号:CN114580937A
公开(公告)日:2022-06-03
申请号:CN202210237299.7
申请日:2022-03-10
Applicant: 暨南大学
Abstract: 本发明涉及用于数据处理方法技术领域,具体涉及一种基于强化学习和注意力机制的智能作业调度系统;包括:从给定的由机器矩阵MO和工时矩阵TO描述的调度实例,生成包含动态事件的由新的机器矩阵MO′和新的工时矩阵TO′描述的调度实例,并将其作为当前交互环境;调度系统与环境进行交互,收集经验并训练;提取特征,输入D3QPN得到当前状态下不同动作的Q值;根据Q值表进行作业调度。本发明通过注意力机制有效提取出关键信息,并使用强化学习算法选择最优的调度策略解决动态作业车间问题,以此解决实际智能制造中作业的动态变化问题,让智能调度作业系统在动态作业调度环境下依然拥有不错的性能。
-
公开(公告)号:CN114066232A
公开(公告)日:2022-02-18
申请号:CN202111349982.1
申请日:2021-11-15
Applicant: 内蒙古北方重工业集团有限公司 , 暨南大学 , 内蒙古工业大学
Abstract: 本发明属于工业物联网技术领域,公开了基于分布式强化学习和边缘计算的工厂调度方法及系统。所述系统包括本地动作模型、边缘设备、云端数据存储器和云端策略模型。方法为:初始化本地动作模型和边缘设备;本地动作模型实时生成适配不同流水线的调度规则;边缘设备对实时产生的生产信息进行编码,生成两参数元组和五参数元组分别发送至本地动作模型和云端数据存储器;云端策略模型对云端存储的数据进行优先级采样、重要性排序和更新;同步云端策略模型和本地动作模型。本发明将边缘计算与分布式强化学习算法结合应用于工业生产,实现了数据实时传输和工业生产实时调度,并通过本地设备与云端设备的交互,不断提高模型准确性,优化工业生产效率。
-
公开(公告)号:CN113393495B
公开(公告)日:2022-02-01
申请号:CN202110685692.8
申请日:2021-06-21
Applicant: 暨南大学
IPC: G06T7/246 , G06T7/277 , G06T5/00 , G06T5/50 , G06T3/00 , G06V20/10 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于强化学习的高空抛物轨迹识别方法。所述方法包括:通过图像传感器采集被监控窗户区域的高空抛物轨迹图像;对所述高空抛物轨迹图像进行预处理得到预处理图像信息;根据所述预处理图像信息判断所述图像传感器是否被遮挡;在判断所述图像传感器未被遮挡时,将所述预处理图像信息输入至处理器,所述处理器获取经过强化学习后的预训练目标模型,并通过所述预训练目标模型对所述预处理图像信息进行高空抛物识别得到高空抛物识别结果信息;所述处理器将高空抛物识别结果信息存储至数据存储单元和云服务器及储存器中,以对所述预训练目标模型进行训练及更新。本发明通过强化学习模型对高空抛物轨迹进行识别,提高了识别准确率。
-
公开(公告)号:CN113360618A
公开(公告)日:2021-09-07
申请号:CN202110633919.4
申请日:2021-06-07
Applicant: 暨南大学
IPC: G06F16/332 , G06F16/33 , G06N3/04
Abstract: 本发明提出一种基于离线强化学习的智能机器人对话方法及系统,方法包括获取已有的对话数据信息,基于对话数据构建训练集;在训练集抽取预设关键信息,对关键信息进行数据处理,引入非策略的批量强化学习算法;构建基于对话预判模型,并利用基于关键信息得到的数据对模型进行训练;获取待交流对话的数据信息;从数据信息中抽取预设关键信息,通过数据处理得到第一向量;利用已训练的模型处理第一向量,得到对应的第一标签,根据第一向量和第一标签进行决策输出;基于决策与用户进行对话。系统包括GPU服务器、模型存储器、存储模块、语言数据库、离线强化学习处理器、CPU处理器、语言收集模块和智能对话执行模块。
-
公开(公告)号:CN113284613A
公开(公告)日:2021-08-20
申请号:CN202110565687.3
申请日:2021-05-24
Applicant: 暨南大学
Abstract: 本发明公开一种基于深度学习的人脸诊断系统,人脸诊断系统包括模型构建模块和模型应用模块,模型构建模块包括中央处理器、GPU服务器和模型构建存储器,模型构建存储器中存储有可以被中央处理器运行的程序,并且可以存储相关疾病患者的面部图像,模型应用模块包括神经网络芯片和摄像头,摄像头用于采集患者的面部照片,神经网络芯片可以搭载辅助诊断模型,辅助诊断模型基于深度卷积神经网络,通过训练、验证和优化得到,可基于人脸图像预测出特定疾病的患病概率。本发明采用上述基于深度学习的人脸诊断系统,可预测出某些疾病的患病概率,从而协助医生进行疾病的筛查工作,提高了诊断准确率和效率。
-
公开(公告)号:CN113282787A
公开(公告)日:2021-08-20
申请号:CN202110567524.9
申请日:2021-05-24
Applicant: 暨南大学
IPC: G06F16/735 , G06K9/62 , G06N20/00
Abstract: 本发明提出一种基于强化学习的个性化短视频推荐方法以及系统,个性化短视频推荐方法包括:收集单个用户的历史记录,得到真实数据分布和专家轨迹;将真实数据分布输入GAN‑SD算法,对用户的特征进行建模,得到用户特征分布;将用户特征分布和专家轨迹输入到MAIL算法,对用户的交互行为建模,得到用户的决策函数;得到用户特征分布和决策函数后,完成对用户的建模;建模推荐引擎和用户的马尔科夫决策过程,用TRPO+ANC算法训练推荐引擎的马尔科夫决策过程,根据得到的累积回报值确定不同动作下的短视频推荐策略,从短视频推荐策略中选择最优的短视频推荐策略,将该策略加载为实际使用的推荐引擎。
-
公开(公告)号:CN113065480A
公开(公告)日:2021-07-02
申请号:CN202110382382.9
申请日:2021-04-09
Applicant: 暨南大学
IPC: G06K9/00 , G06K9/32 , G06K9/34 , G06K9/62 , G06N3/08 , G06T3/40 , G06T5/00 , G06T5/20 , G06T5/30
Abstract: 本申请涉及书法作品风格的识别方法、装置、电子装置和存储介质,其中,该书法作品风格的识别方法包括:通过获取待识别的书法作品图像;对书法作品图像进行预处理,并对预处理后的图像进行书法字定位裁剪,得到至少一幅字图像,其中,预处理包括:中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理;利用胶囊网络模型处理至少一幅字图像,获得每一幅字图像对应的第一分类标签,其中,胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签;根据第一分类标签确定书法作品图像的风格识别结果。通过本申请,解决了相关技术中书法作品风格的识别准确率低、效率不高的问题,实现了书法作品风格的快速准确识别。
-
公开(公告)号:CN113010849A
公开(公告)日:2021-06-22
申请号:CN202110208156.9
申请日:2021-02-24
Applicant: 暨南大学
IPC: G06F17/18 , G06F17/16 , G06K9/00 , G01D21/02 , G06F16/901 , G06F16/9035 , G06F16/907 , H04W4/38 , G16Y10/05 , G16Y20/10 , G16Y40/10 , G16Y40/20
Abstract: 本发明提供了一种基于物联网的草场环境评价方法,属于生态环境监测技术领域。本发明提出了基于物联网的草场环境评价方法,草场信息中的各种环境因素对牧民放牧的权重不同,分析对比各因素特征,采用了一种多传感器数据融合算法,对草场环境数据进行分析处理,构建评价矩阵,对草场环境等级作出科学的评价。
-
公开(公告)号:CN112883873A
公开(公告)日:2021-06-01
申请号:CN202110197703.8
申请日:2021-02-22
Applicant: 暨南大学
Abstract: 本申请涉及一种叶部病害的识别方法、装置、电子装置和存储介质,其中,该叶部病害的识别方法包括:通过获取待识别的植物叶片图像;对所述植物叶片图像进行预处理,得到多幅第一叶片图像;利用注意力机制模型处理多幅所述第一叶片图像,获得多幅所述第一叶片图像对应的第一分类标签,其中,所述注意力机制模型被训练为用于根据叶片图像得到与该叶片图像对应的分类标签,所述分类标签包括该叶片图像对应各种叶部病害类别的病害概率;根据所述第一分类标签确定所述植物叶片图像的识别结果。通过本申请,解决了相关技术中叶部病害识别费时费力、时效性低的问题,实现了叶部病害的实时检测识别。
-
-
-
-
-
-
-
-
-