-
公开(公告)号:CN119785403A
公开(公告)日:2025-04-08
申请号:CN202411879010.7
申请日:2024-12-19
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V40/16 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 本发明公开了一种面向威廉斯综合症的面部图像分析系统,包括:面部检测模块,用于识别并裁剪面部图像中的人脸区域,得到训练图像和测试图像;面部特征提取模块,用于根据训练图像,通过MobileFaceNet网络提取局部面部区域并重映射坐标值;其中局部面部区域包括:眼部区域、鼻子区域、嘴巴区域;逐像素加权模块,用于对训练图像的局部面部区域进行加权处理,得到加权图像;网络训练模块,用于通过VMamba网络对加权图像进行分类预测,得到训练好的VMamba网络;图像分析模块,用于将测试图像输入至训练好的VMamba网络,得到面向威廉斯综合症的面部图像分析结果。本发明能够准确分析具有威廉斯综合证的面孔图像。
-
公开(公告)号:CN119205513A
公开(公告)日:2024-12-27
申请号:CN202411586232.X
申请日:2024-11-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T3/4053 , G06T3/4046 , G06V10/80
Abstract: 本发明公开了一种视频超分辨率方法、系统、电子设备及存储介质,所述方法包括建立复杂运动场景下的视频超分辨率模型并训练和测试所述模型,模型包括特征提取子模块、跨帧对齐子模块、特征增强子模块和上采样重建子模块,特征提取子模块用于提取输入连续视频帧的浅层特征;跨帧对齐子模块利用可变形卷积对不同帧进行特征级对齐,实现跨帧的时空信息融合和运动补偿;特征增强子模块对特征进行增强;上采样重建子模块针对特征增强子模块输出的增强特征进行分辨率放大,并将分辨率放大后的增强特征重构为视频帧。本发明提高了复杂运动场景下视频的超分效果,增强视频的质量和视觉效果。
-
公开(公告)号:CN118799187B
公开(公告)日:2024-12-10
申请号:CN202411281438.1
申请日:2024-09-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T3/4053 , G06T3/4046 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0985
Abstract: 本发明公开了一种全景图像超分辨率方法、系统、电子设备及存储介质,包括:建立基于纬度分级强化的全景图像超分辨率模型,模型包括特征提取子网、深度特征增强子网、上采样子网和重建子网,特征提取子网用于提取输入全景图片的浅层特征;深度特征增强子网通过级联的纬度分级强化单元,对不同纬度区域的浅层特征进行分等级的深度增强,基于全景图像中不同纬度区域特征分布的差异性,提炼不同纬度的高频信息,得到增强特征;上采样子网采用亚像素卷积层放大增强特征的空间分辨率尺寸;重建子网将放大后的增强特征复原成高分辨率全景图;本发明解决了全景图像中不同纬度特征分布的差异性难题,提高对不同场景环境下全景图像的超分效果。
-
公开(公告)号:CN118866011A
公开(公告)日:2024-10-29
申请号:CN202411333837.8
申请日:2024-09-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明属于环境噪声监测技术领域,本发明公开了一种基于自注意力机制的环境噪声监测方法,包括以下步骤:通过短时傅里叶变换将音频信号转换为频谱图;通过自注意力机制提取频谱图的声纹特征;通过神经网络声纹特征对应到具体的环境声源类别,本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。
-
公开(公告)号:CN118505504A
公开(公告)日:2024-08-16
申请号:CN202410500537.8
申请日:2024-04-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06T3/4053 , G06T3/4046 , G06T3/4038 , G06V30/16 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/084
Abstract: 本发明属于图像处理技术领域,且公开了一种面向文本图像的超分辨率方法,包括:生成文本超分数据集,识别并转换图像中目标文本区域为矩形,以便输入超分网络,提取待超分图像的特征,得到特征图X0,利用文本先验提取模块生成注意力图A,将特征图X0与注意力图A通过多个带注意力机制的残差块进行升维,得到特征图Xn,对特征图Xn进行像素和通道重组,生成超分图像SR,计算SR图像的文本序列损失lctc和像素间损失l2,求得总损失l。通过迭代优化网络参数,评估模型性能,将SR图像输入文本识别模型,获取预测文本,逆变换后拼接到原图,增强视觉效果,有效解决了传统超分模型对于文本图像质量的提升效果有限甚至产生负优化效果的问题。
-
公开(公告)号:CN120014234A
公开(公告)日:2025-05-16
申请号:CN202510092114.1
申请日:2025-01-21
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/25 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于误分类修正的弱监督目标检测方法、系统、电子设备及存储介质,方法包括利用卷积神经网络提取目标候选位置的区域特征;通过分类器对提取的区域特征分配所属类别标签;根据类别间的置信度差异,设计误分类修正驱动的标签分配模块,以识别误分类情况并予以修正,并重新分配标签用于目标检测模型训练。本发明方法通过修正训练阶段生成的错误类别标签,显著提高弱监督目标检测方法的分类性能。
-
公开(公告)号:CN118866011B
公开(公告)日:2025-02-07
申请号:CN202411333837.8
申请日:2024-09-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明属于环境噪声监测技术领域,本发明公开了一种基于自注意力机制的环境噪声监测方法,包括以下步骤:通过短时傅里叶变换将音频信号转换为频谱图;通过自注意力机制提取频谱图的声纹特征;通过神经网络声纹特征对应到具体的环境声源类别,本发明通过利用短时傅里叶变换将音频信号转换为频谱图,并结合自注意力机制提取频谱图中的声纹特征,实现了对环境声音的多维度监测与分析。这种方法能够捕捉到声音的频率、能量分布、时间变化等丰富信息,为环境声监测提供更加全面和准确的指标,并且自注意力机制能够自动学习频谱图中的关键信息,并赋予其更高的权重,从而有效提取出对分类任务至关重要的声纹特征。
-
公开(公告)号:CN119048759A
公开(公告)日:2024-11-29
申请号:CN202411271128.1
申请日:2024-09-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V10/26 , G06V10/20 , G06V10/44 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06V40/18
Abstract: 本发明属于模式识别技术领域,且公开了基于异构卷积感知网络的糖尿病视网膜病变病灶分割方法,包括如下步骤:将输入的眼底图像进行预处理,使眼底图像的分辨率统一调整为预设分辨率,并去除多余的背景部分;构建基于异构卷积感知网络的模型,并使用加权交叉熵损失函数和噪声调整损失函数相结合的训练策略进行训练;将预处理后的测试眼底图像输入到训练好的模型中进行预测,输出预测结果;对模型输出的预测结果进行后处理,后处理包括特征图大小的还原、病灶涂色,获得最终的分割结果,本发明采用异构条形卷积、异构调制可变形卷积和异构近远感知卷积结构,提高了分割精度,还增强了模型的鲁棒性。
-
公开(公告)号:CN111724303B
公开(公告)日:2024-11-29
申请号:CN202010398292.4
申请日:2020-05-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Inventor: 徐勇
IPC: G06T3/4076 , G06T7/40 , G06T7/90 , G06F17/16 , G06V10/774
Abstract: 本发明提供了一种具有图像类型适应性的超分辨率图像处理方法,包括以下步骤:S1、构建基于多类型图像的“通用”超分辨率模,将待处理图像作为基于多类型图像的“通用”超分辨率模的输入,运行基于多类型图像的“通用”超分辨率模型后,得出待处理图像的初步高分辨率图像;S2、构建基于单一类型图像的“精细”超分辨率模型,将初步高分辨率图像作为基于单一类型图像的“精细”超分辨率模型的输入,运行基于单一类型图像的“精细”超分辨率模型后,得出最终的高分辨率图像。本发明还提供了一种具有图像类型适应性的超分辨率图像处理系统。本发明的有益效果是:在提升图像分辨率的同时,还可以克服原图像中存在的局部亮度异常等问题。
-
公开(公告)号:CN118471268B
公开(公告)日:2024-10-18
申请号:CN202410926523.2
申请日:2024-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Inventor: 徐勇
Abstract: 本发明公开了一种智能识别环境噪声类别的方法、系统及存储介质,包括:将环境噪声划分为多个环境噪声类别;针对各环境噪声类别,均采集一段声音文件,并人工打标噪声类别标签;对已打标噪声类别标签的各声音文件进行预处理,获取预处理后的若干声音片段;对预处理后的各声音片段进行特征提取,获取各声音片段特征;基于所述环境噪声类别和所述声音片段特征构建噪声类别识别模型;将各声音片段特征输入噪声类别识别模型进行模型训练,并利用训练后的所述噪声类别识别模型识别待识别声音片段的噪声类型及其对应的置信度。本发明完善了当前的环境噪声监测指标以及可为噪声治理提供依据。
-
-
-
-
-
-
-
-
-