-
公开(公告)号:CN113554013A
公开(公告)日:2021-10-26
申请号:CN202111106779.1
申请日:2021-09-22
申请人: 华南理工大学
摘要: 本发明公开了跨场景识别模型训练方法、跨场景道路识别方法以及装置。本发明以源领域图像Xs和源领域真实标签图ys以及跨场景的无标签目标领域图像Xt作为训练数据,采用前向传导和链式反向梯度传导更新方法,分别在像素级、局部级与图像级计算输出跨场景识别的预测以及识别损失值和领域适配的预测以及领域适配损失值;分别在区域水平和样本水平联合跨场景识别和领域适配的像素级、局部级与图像级的预测以及损失值进行跨场景识别模型的迭代训练,最终得到训练完成的区域水平和样本水平跨场景识别模型。本发明所构建的跨场景道路识别方法,基于判定策略输出精准且安全的识别结果,可以为智能驾驶系统在新场景下提供有效的数据支撑。
-
公开(公告)号:CN110008996B
公开(公告)日:2021-08-10
申请号:CN201910167377.9
申请日:2019-03-06
申请人: 华南理工大学
IPC分类号: G06K9/62
摘要: 本发明公开了一种基于散度计算的异构域适应方法,包括如下步骤:数据预处理;分别学习映射,将源域和目标域映射至同一共享子空间,同时利用最大均值差异(MMD)距离进行分布匹配,减小分布差异,并进行核化处理以适应非线性问题;遵循结构一致性,保证相近数据在映射后保持相近;引入正则项进行特征选择;通过散度计算进一步增加不同类别数据间的可分性,提高算法效率;综合优化。本发明采用迁移学习思想,通过对异构的源域及目标域数据分别进行映射和特征转换,得到具有相似特征及分布的子空间;并在异构应用中引入散度,利用散度特性进一步加强数据可分性,强化对具有不同特征不同分布的异构数据的分类,帮助提升目标任务的学习效果。
-
公开(公告)号:CN113554013B
公开(公告)日:2022-03-29
申请号:CN202111106779.1
申请日:2021-09-22
申请人: 华南理工大学
摘要: 本发明公开了跨场景识别模型训练方法、跨场景道路识别方法以及装置。本发明以源领域图像Xs和源领域真实标签图ys以及跨场景的无标签目标领域图像Xt作为训练数据,采用前向传导和链式反向梯度传导更新方法,分别在像素级、局部级与图像级计算输出跨场景识别的预测以及识别损失值和领域适配的预测以及领域适配损失值;分别在区域水平和样本水平联合跨场景识别和领域适配的像素级、局部级与图像级的预测以及损失值进行跨场景识别模型的迭代训练,最终得到训练完成的区域水平和样本水平跨场景识别模型。本发明所构建的跨场景道路识别方法,基于判定策略输出精准且安全的识别结果,可以为智能驾驶系统在新场景下提供有效的数据支撑。
-
公开(公告)号:CN106934406A
公开(公告)日:2017-07-07
申请号:CN201710242018.6
申请日:2017-04-14
申请人: 华南理工大学
IPC分类号: G06K9/46 , G06K9/00 , G06F17/30 , G11B27/031
CPC分类号: G11B27/031 , G06F17/30761 , G06K9/00355 , G06K9/00389 , G06K9/4671
摘要: 本发明公开了一种基于手势识别的音乐编辑器及音乐编辑方法,该音乐编辑器包括用于接收手势信号的摄像头模块、用于显示手势的显示器模块、用于检测、识别与处理手势信号的主控模块和用于播放音乐的扬声器,其工作过程如下:通过摄像头模块实时录入用户手势,获取手势图像并传递给主控模块;主控模块对用户手势进行实时识别与处理,对于获取的每个手势图像通过OpenCV算法进行二值化和中值滤波处理并计算其HOG特征,然后利用手势分类器匹配产生识别结果,并利用事先设定的音色调用关系调用音色;调用与识别结果对应的音色文件控制扬声器输出音频。该发明能够结合动作进行音乐的创作,扩展了音乐编辑的方式,更具娱乐性。
-
公开(公告)号:CN110008996A
公开(公告)日:2019-07-12
申请号:CN201910167377.9
申请日:2019-03-06
申请人: 华南理工大学
IPC分类号: G06K9/62
摘要: 本发明公开了一种基于散度计算的异构域适应方法,包括如下步骤:数据预处理;分别学习映射,将源域和目标域映射至同一共享子空间,同时利用最大均值差异(MMD)距离进行分布匹配,减小分布差异,并进行核化处理以适应非线性问题;遵循结构一致性,保证相近数据在映射后保持相近;引入正则项进行特征选择;通过散度计算进一步增加不同类别数据间的可分性,提高算法效率;综合优化。本发明采用迁移学习思想,通过对异构的源域及目标域数据分别进行映射和特征转换,得到具有相似特征及分布的子空间;并在异构应用中引入散度,利用散度特性进一步加强数据可分性,强化对具有不同特征不同分布的异构数据的分类,帮助提升目标任务的学习效果。
-
公开(公告)号:CN206696868U
公开(公告)日:2017-12-01
申请号:CN201720396630.4
申请日:2017-04-14
申请人: 华南理工大学
IPC分类号: G06K9/46 , G06K9/00 , G06F17/30 , G11B27/031
摘要: 本实用新型公开了一种基于手势识别的音乐编辑器,该音乐编辑器包括用于接收手势信号的摄像头模块、用于显示手势的显示器模块、用于检测、识别与处理手势信号的主控模块和用于播放音乐的扬声器,其工作过程如下:通过摄像头模块实时录入用户手势,获取手势图像并传递给主控模块;主控模块对用户手势进行实时识别与处理,对于获取的每个手势图像通过OpenCV算法进行二值化和中值滤波处理并计算其HOG特征,然后利用手势分类器匹配产生识别结果,并利用事先设定的音色调用关系调用音色;调用与识别结果对应的音色文件控制扬声器输出音频。该实用新型能够结合动作进行音乐的创作,扩展了音乐编辑的方式,更具娱乐性。(ESM)同样的发明创造已同日申请发明专利
-
-
-
-
-