-
公开(公告)号:CN116560239B
公开(公告)日:2023-09-12
申请号:CN202310824569.9
申请日:2023-07-06
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
Abstract: 本发明公开了一种多智能体强化学习方法、装置及介质,属于多个智能体行为自主控制技术领域。其中方法包括:获取观测,智能体根据观测获取动作概率分布,以及推理队友智能体基于观测的动作概率分布;根据获得的动作概率分布,计算每个智能体与队友智能体的行为一致性;通过动态缩放网络获取动态调节因子,根据动态调节因子计算行为一致性的内部奖励;根据链式求导法则,以最大化外部回报为目标,对动态缩放网络的参数进行优化;使用优化完成的策略实现多智能体的协作任务。本发明提出一种基于行为一致性的内在奖励,解决多智能体协作算法忽略智能体之间行为意图的配合,从而导致出现次优化策略的问题,能够有效地提高多智能体之间的协作性能。
-
公开(公告)号:CN119048798A
公开(公告)日:2024-11-29
申请号:CN202411001498.3
申请日:2024-07-25
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V20/52 , G06V20/40 , G06T7/90
Abstract: 本发明公开了一种钢筋库存变化检测方法、电子设备及存储介质,涉及计算机视觉技术领域,包括:对钢筋堆进行实时视频流采集;利用预设相机拍摄指引生成模型检测预设钢筋堆参考图像与所述钢筋堆实时视频流当前帧,获得相机拍摄指引;根据所述获得的相机拍摄指引调整所述钢筋堆实时视频流的拍摄视角,提取钢筋堆目标图像;利用预设图像变化检测模型与目标检测模型检测所述预设钢筋堆参考图像与所述钢筋堆目标图像,获得钢筋的初始变化库存数;判断钢筋实际变化库存数与所述初始变化库存数是否一致,并在必要时进行库存更新以得到目标变化库存数。这样一来,操作员可在复杂、恶劣、危险的钢筋仓库中,准确、高效、智能地完成钢筋库存变化检测任务。
-
公开(公告)号:CN116468974B
公开(公告)日:2023-10-13
申请号:CN202310702062.6
申请日:2023-06-14
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
Abstract: 本发明公开了一种基于图像生成的烟雾检测方法、装置及存储介质,属于图像数据处理领域。其中方法包括:获取烟雾数据集和无烟雾数据集;根据烟雾数据集训练基于图像掩码生成图像的图像生成网络;采用训练后的图像生成网络对无烟雾数据集进行处理,生成含有不同浓度烟雾的图像以及对应的图像掩码;根据烟雾数据集以及生成的图像获取训练集,根据训练集训练烟雾检测模型;获取待检测图像,将待检测图像输入训练后的烟雾检测模型,检测待检测图像中是否存有火灾烟雾。本发明通过图像生成网络生成场景丰富、浓度不同的逼真的烟雾图像,避免繁琐人工标注的前提下能够极大地扩充烟雾检测模型训练的数据量,提高烟雾检测模型的检测精度以及效果。
-
公开(公告)号:CN116560239A
公开(公告)日:2023-08-08
申请号:CN202310824569.9
申请日:2023-07-06
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
Abstract: 本发明公开了一种多智能体强化学习方法、装置及介质,属于多个智能体行为自主控制技术领域。其中方法包括:获取观测,智能体根据观测获取动作概率分布,以及推理队友智能体基于观测的动作概率分布;根据获得的动作概率分布,计算每个智能体与队友智能体的行为一致性;通过动态缩放网络获取动态调节因子,根据动态调节因子计算行为一致性的内部奖励;根据链式求导法则,以最大化外部回报为目标,对动态缩放网络的参数进行优化;使用优化完成的策略实现多智能体的协作任务。本发明提出一种基于行为一致性的内在奖励,解决多智能体协作算法忽略智能体之间行为意图的配合,从而导致出现次优化策略的问题,能够有效地提高多智能体之间的协作性能。
-
公开(公告)号:CN116468974A
公开(公告)日:2023-07-21
申请号:CN202310702062.6
申请日:2023-06-14
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
Abstract: 本发明公开了一种基于图像生成的烟雾检测方法、装置及存储介质,属于图像数据处理领域。其中方法包括:获取烟雾数据集和无烟雾数据集;根据烟雾数据集训练基于图像掩码生成图像的图像生成网络;采用训练后的图像生成网络对无烟雾数据集进行处理,生成含有不同浓度烟雾的图像以及对应的图像掩码;根据烟雾数据集以及生成的图像获取训练集,根据训练集训练烟雾检测模型;获取待检测图像,将待检测图像输入训练后的烟雾检测模型,检测待检测图像中是否存有火灾烟雾。本发明通过图像生成网络生成场景丰富、浓度不同的逼真的烟雾图像,避免繁琐人工标注的前提下能够极大地扩充烟雾检测模型训练的数据量,提高烟雾检测模型的检测精度以及效果。
-
公开(公告)号:CN116342817A
公开(公告)日:2023-06-27
申请号:CN202310622513.5
申请日:2023-05-30
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
Abstract: 本发明公开了一种室外大规模三维场景重建方法、系统、设备和介质,属于三维场景重建的技术领域。该方法包括:获取室外场景数据集,根据室外场景数据集获取场景重建数据集;构建三维场景重建模型,在场景重建数据集上迭代训练三维场景重建模型;将待处理的相机轨迹输入训练后的三维场景重建模型,输出场景重建的结果;其中,三维场景重建模型包括外观编码模块、颜色预测模块、图卷积模块和距离场表示模块。本发明的三维场景重建模型,通过图卷积模块对采样点位置、距离场和预测颜色向量进行信息的传递,改进预测质量,有效解决了室外大规模场景重建表面不精确和训练效率低下的问题,提升训练三维重建模型的效率的同时,提高了场景重建表面精度。
-
公开(公告)号:CN115620110A
公开(公告)日:2023-01-17
申请号:CN202211619599.8
申请日:2022-12-16
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
IPC: G06V10/80 , G06V10/764 , G06V10/77 , G06V20/40 , G06V10/82 , G06N3/047 , G06N3/048 , G06N3/0464 , G10L25/30 , G10L25/51
Abstract: 本发明公开了一种视频事件定位与识别方法、装置及存储介质,其中方法包括:获取同步的视频数据和音频数据;提取视觉特征和音频特征;利用声音引导的视觉注意力机制模块和视觉引导的声音注意力机制模块进行特征增强;将增强的特征输入跨模态关系感知模块,进行建模以及利用音视频模态内和模态间的关系,实现模态间的信息互补,增强特征表达能力,输出事件定位和识别的结果。本发明有效地建模和利用了音视频模态内和模态间的关系,实现跨模态信息互相补充,具有更强的表征能力;同时,能够有效缓解复杂视频背景和音频无关声音带来的干扰,因而事件的定位和识别的准确度更高。本发明可广泛应用于智能识别技术领域。
-
公开(公告)号:CN117292041A
公开(公告)日:2023-12-26
申请号:CN202311586576.6
申请日:2023-11-27
Applicant: 广东广物互联网科技有限公司 , 华南理工大学
IPC: G06T15/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06V20/70
Abstract: 本发明公开了一种语义感知多视角三维人体重建方法、装置及介质,属于计算机视觉技术领域。其中方法包括:采集人体多视角图像数据集;将人物图像和语义类别定义为高斯变量和类别变量的连续‑离散联合分布;构建并训练一个文本引导的高斯‑类别扩散生成模型,生成语义感知的人物图像;训练一个基于单幅人物图像和相机相对参数的合成新视角图像的扩散模型;构建一个仰角估计模块,通过再投影误差估计输入图像的仰角;根据估计的仰角,将人物图像输入到合成新视角图像的扩散模型,生成多视角人物图像;引入量化坐标从多视图图像中学习神经隐式函数,重建三维人体。本发明可根据给定的一句人物相关的文本描述,生成相对应的高仿真度隐式三维人体模型。
-
公开(公告)号:CN116342817B
公开(公告)日:2023-08-15
申请号:CN202310622513.5
申请日:2023-05-30
Applicant: 华南理工大学 , 广东广物互联网科技有限公司
Abstract: 本发明公开了一种室外大规模三维场景重建方法、系统、设备和介质,属于三维场景重建的技术领域。该方法包括:获取室外场景数据集,根据室外场景数据集获取场景重建数据集;构建三维场景重建模型,在场景重建数据集上迭代训练三维场景重建模型;将待处理的相机轨迹输入训练后的三维场景重建模型,输出场景重建的结果;其中,三维场景重建模型包括外观编码模块、颜色预测模块、图卷积模块和距离场表示模块。本发明的三维场景重建模型,通过图卷积模块对采样点位置、距离场和预测颜色向量进行信息的传递,改进预测质量,有效解决了室外大规模场景重建表面不精确和训练效率低下的问题,提升训练三维重建模型的效率的同时,提高了场景重建表面精度。
-
公开(公告)号:CN117292041B
公开(公告)日:2024-03-26
申请号:CN202311586576.6
申请日:2023-11-27
Applicant: 广东广物互联网科技有限公司 , 华南理工大学
IPC: G06T15/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06V20/70
Abstract: 本发明公开了一种语义感知多视角三维人体重建方法、装置及介质,属于计算机视觉技术领域。其中方法包括:采集人体多视角图像数据集;将人物图像和语义类别定义为高斯变量和类别变量的连续‑离散联合分布;构建并训练一个文本引导的高斯‑类别扩散生成模型,生成语义感知的人物图像;训练一个基于单幅人物图像和相机相对参数的合成新视角图像的扩散模型;构建一个仰角估计模块,通过再投影误差估计输入图像的仰角;根据估计的仰角,将人物图像输入到合成新视角图像的扩散模型,生成多视角人物图像;引入量化坐标从多视图图像中学习神经隐式函数,重建三维人体。本发明可根据给定的一句人物相关的文本描述,生成相对应的高仿真度隐式三维人体模型。
-
-
-
-
-
-
-
-
-