-
公开(公告)号:CN115209119B
公开(公告)日:2023-06-23
申请号:CN202210678884.0
申请日:2022-06-15
Applicant: 华南理工大学
IPC: H04N9/64 , H04N9/73 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于深度神经网络的视频自动着色方法,包括以下步骤:获取原始彩色视频数据集,将彩色视频转化为黑白视频,得到用于网络训练的黑白视频帧序列和彩色视频帧序列;分别计算彩色视频帧序列和黑白视频帧序列中相邻两帧间的正向和反向光流;从数据集中选择相邻的三帧输入至特征提取网络中提取出特征信息图;在目标图像中计算出每个像素点的相邻相似区域;将特征信息图输入初步着色网络得到每一帧图像的多张初步着色图;输入三帧的初步着色图输入光流对齐模块,利用时序损失函数来对初步着色网络进行约束;将初步着色网络的输出和光流对齐模块的输出输入至加强着色网络得到最终输出,并利用L1范数计算最终输出和真实值的误差。
-
公开(公告)号:CN115209119A
公开(公告)日:2022-10-18
申请号:CN202210678884.0
申请日:2022-06-15
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度神经网络的视频自动着色方法,包括以下步骤:获取原始彩色视频数据集,将彩色视频转化为黑白视频,得到用于网络训练的黑白视频帧序列和彩色视频帧序列;分别计算彩色视频帧序列和黑白视频帧序列中相邻两帧间的正向和反向光流;从数据集中选择相邻的三帧输入至特征提取网络中提取出特征信息图;在目标图像中计算出每个像素点的相邻相似区域;将特征信息图输入初步着色网络得到每一帧图像的多张初步着色图;输入三帧的初步着色图输入光流对齐模块,利用时序损失函数来对初步着色网络进行约束;将初步着色网络的输出和光流对齐模块的输出输入至加强着色网络得到最终输出,并利用L1范数计算最终输出和真实值的误差。
-
公开(公告)号:CN113011504A
公开(公告)日:2021-06-22
申请号:CN202110306180.6
申请日:2021-03-23
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于视角权重和特征融合的虚拟现实场景情感识别方法,包括:对待识别虚拟现实场景进行预处理;使用已训练好的卷积神经网络提取待识别虚拟现实场景的深度情感特征,对深度情感特征赋予视角权重后,得到加权深度情感特征;提取待识别虚拟现实场景中关联情感的手工情感特征,手工情感特征包含颜色特征、纹理特征和形状特征;将加权深度情感特征和手工情感特征依次进行归一化、特征融合;将融合后的特征输入分类器进行情感分类,分类器输出待识别虚拟现实场景的情感识别结果。本发明方法针对虚拟现实场景视觉显示特点,加入各视角区域对情感的贡献度,同时融合关联情感的多个手工特征,提升虚拟现实场景情感识别的准确率。
-
公开(公告)号:CN113011493A
公开(公告)日:2021-06-22
申请号:CN202110290152.X
申请日:2021-03-18
Applicant: 华南理工大学
Abstract: 本发明提供了一种基于多核宽度学习脑电情绪分类方法、装置、介质及设备;其中方法包括如下步骤:获取被试者的脑电信号,并对脑电信号进行预处理;对预处理的脑电信号采用卷积神经网络进行特征提取,得到一维空间向量V;将一维空间特征V输入到多核宽度学习系统中,得到脑电信号的情绪类型。该方法整合了卷积神经网络和多核宽度学习系统的优点,多核函数映射可以在组合空间中更准确、更合理地表达脑电信号特征数据,从而提高了分类精度。
-
公开(公告)号:CN102750699A
公开(公告)日:2012-10-24
申请号:CN201210190993.4
申请日:2012-06-11
Applicant: 华南理工大学
IPC: G06T7/00
Abstract: 本发明公开了一种基于信息熵的图像置乱程度衡量方法。包括下列步骤:(1)获取图像;(2)对图像进行分块;(3)分别计算各个图像分块的信息熵;(4)求所有图像分块的信息熵方差;(5)将求得的图像分块信息熵方差代入最终的图像置乱程度衡量公式,即得到了图像的置乱程度。本发明提供的图像置乱程度判别依据,表达简洁,计算过程不需要原始图像的参与,能够有效地衡量图像的置乱程度,与人视觉的主观评价基本一致,同时具有对各种类型的图像置乱技术都适用的高泛化性,为图像置乱技术的选择提供了一个衡量标准。
-
公开(公告)号:CN206224997U
公开(公告)日:2017-06-06
申请号:CN201621208369.2
申请日:2016-11-09
Applicant: 华南理工大学
Abstract: 本实用新型公开了一种语音识别Soc芯片架构,包括:MCU内核、APB总线译码器、ADC语音信号采样模块、浮点运算加速模块、看门狗模块、GPIO模块、数据传输控制模块以及片内SRAM存储器;其中,所述APB总线译码器、片内SRAM存储器均与所述MCU内核连接,所述ADC语音信号采样模块、浮点运算加速模块、看门狗模块、GPIO模块均与所述APB总线译码器连接,所述片内SRAM存储器与数据传输控制模块连接。本实用新型结合各模块优势,设计出适合语音识别算法芯片化的架构;具有低成本、高性能、易于语音算法移植、升级的优点。
-
-
-
-
-
-