-
公开(公告)号:CN105320956A
公开(公告)日:2016-02-10
申请号:CN201510661393.5
申请日:2015-10-14
Applicant: 华侨大学
IPC: G06K9/46
CPC classification number: G06K9/4642
Abstract: 本发明公开了一种基于中心窗口变差的四象限分块模式的图像纹理特征提取方法,对任一2M×2N像素的图像区域,首先计算其中心部分M×N个像素值的和作为阈值,然后把该2M×2N像素的图像区域分解为4个M×N像素的子区域,再分别计算这4个子区域像素值的和并与阈值进行比较,若像素值的和大于或等于阈值,就置该子区域的位置编码值为1,否则为0;最后将四个子区域的位置编码值乘以对应的权重后进行求和,得到该2M×2N像素的图像区域的纹理特征值。本发明只需要用4个比特就能有效地表示物体的局部纹理信息,可应用于目标检测、识别和跟踪。
-
公开(公告)号:CN119544430B
公开(公告)日:2025-04-29
申请号:CN202510080480.5
申请日:2025-01-20
Applicant: 华侨大学
IPC: H04L27/00 , G06N3/0442
Abstract: 本发明公开了一种基于深度学习的非相干混沌通信方法及装置,涉及数据处理领域,包括:获取待解调的混沌接收信号并进行功率谱密度估计,得到PSD序列并输入到经训练的混沌接收信号解调模型,通过输入层接收PSD序列,PSD序列经过第一BiLSTM层,提取到PSD序列的第一时域特征,再经过自注意力层,得到第一中间特征,第一中间特征经过第一Dropout层,得到第二中间特征,第二中间特征经过第二BiLSTM层,提取得到PSD序列的第二时域特征,再经过第二Dropout层,得到第三中间特征;将第三中间特征输入到全连接层和Softmax层进行特征整合,得到概率分布向量,概率分布向量通过分类层进行最大似然判决,得到估计的二进制信息比特。本发明解决现有的混沌通信系统频谱效率低的问题。
-
公开(公告)号:CN119648117A
公开(公告)日:2025-03-18
申请号:CN202510169101.X
申请日:2025-02-17
Applicant: 华侨大学
IPC: G06Q10/0875 , G06K17/00 , G06K7/10 , G06N3/0464 , G06T7/00 , G06T7/90
Abstract: 本发明公开了一种基于机器视觉的石材版面智能仓储管理方法及系统,涉及图像处理技术领域,方法包括:通过机器视觉检测石材版面的瑕疵并计算异常得分,进行异常排序与评级,获得每个石材版面的瑕疵评级;将RGB图像归一化为正则RGB,并进行伽玛矫正线性化转换至CIELAB颜色空间,计算石材版面的均色LAB;基于瑕疵评级和均色LAB信息录入RFID标签,并据此分类入库;接收用户对石材版面数量、瑕疵评级和均色的要求,筛选出最相似的石材版面反馈给用户;用户可选择接受或拒绝,若拒绝则重新筛选。本申请通过机器视觉检测石材版面的瑕疵和色差,结合RFID标签实现自动化入库、分类管理和精准出库,提高了仓储效率和管理精度。
-
公开(公告)号:CN119316609B
公开(公告)日:2025-02-25
申请号:CN202411837846.0
申请日:2024-12-13
Applicant: 华侨大学
IPC: H04N19/53 , G06N3/0464 , H04N19/80
Abstract: 本发明公开了一种基于自注意力机制的端到端视频压缩方法及系统,涉及视频编码领域,方法包括:提取当前帧、运动参考帧和上一时刻的重构帧的浅层特征;提取当前帧和运动参考帧之间的运动信息特征;压缩运动信息特征,获得压缩后的运动信息特征;将压缩后的运动信息特征补偿在上一时刻的重构帧的浅层特征上,获得当前时刻的上下文信息特征;压缩获得压缩后的上下文信息特征;将压缩后的上下文信息特征和当前帧的浅层特征融合特征进行编码,获得当前时刻的重构帧;对当前时刻的重构帧进行上采样,获得压缩视点图像;对压缩视点图像中的运动信息累积误差进行修正,得到下一帧的运动参考帧。本发明能够在提高运动估计的准确性的同时提升了编码的效率。
-
公开(公告)号:CN119152215B
公开(公告)日:2025-02-25
申请号:CN202411667235.6
申请日:2024-11-21
Applicant: 华侨大学 , 厦门松霖科技股份有限公司
Abstract: 本发明公开了一种基于梯度显著性感知的皱纹分割方法、装置及可读介质,涉及图像处理领域,包括:构建人脸皱纹数据集和人脸皱纹分割网络;将人脸皱纹数据集中的原始人脸图像输入到人脸皱纹分割网络,得到对应的皱纹分割预测图,计算原始人脸图像中的每个像素点的显著性,进一步计算得到原始人脸图像中的每个像素点的权重,基于原始人脸图像中的每个像素点的像素值及其权重和原始人脸图像对应的皱纹标注掩码图中的相应像素点的像素值构建梯度显著性加权损失函数,基于梯度显著性加权损失函数对人脸皱纹分割网络进行训练,得到经训练的人脸皱纹分割网络。本发明解决现有技术的人脸图像中皱纹被过度分割或错误分割的问题。
-
公开(公告)号:CN119444804A
公开(公告)日:2025-02-14
申请号:CN202510037837.1
申请日:2025-01-10
Applicant: 华侨大学
Abstract: 本发明涉及图像处理技术领域,提出了一种基于动态自适应和强化特征的多目标跟踪分割方法及系统,方法包括前处理步骤、外观代价计算步骤、预匹配步骤、运动代价计算步骤、正式匹配步骤、后处理步骤、重复步骤和可视化步骤。该方法通过具有动态自适应的数据关联对目标特征进行细化整合,以及利用基于掩码的注意力机制和基于四三角形变的掩码预测分别强化目标外观特征和运动信息,以能够在保持高跟踪精度的同时,实现快速运算和低成本运行,适用于更广泛的应用场景。
-
公开(公告)号:CN119027845B
公开(公告)日:2025-02-14
申请号:CN202411514321.3
申请日:2024-10-29
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V20/17 , G06V10/25 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/80
Abstract: 本发明涉及图像处理与人工智能技术领域,公开了一种无人机森林火灾风险区块检测方法及系统,方法包括:构建基于区块分类的目标检测模型并进行训练,利用训练好的基于区块分类的目标检测模型实现无人机森林火灾风险区块检测;所述基于区块分类的目标检测模型利用区块映射器无人机图像中的不同区块映射为区块特征;利用多阶段采样网络对区块特征进行多种尺度的采样,并利用降维映射层进行尺度对齐,获得多尺度区块特征;通过哈达玛积融合多尺度区块特征,利用区块分类器将融合后的多尺度区块特征映射至区块类别概率。本发明以区域分类方式实现风险区块的定位,避免了现有技术因精确定位导致的庞大计算量,延长无人机可用时间。
-
公开(公告)号:CN119068266A
公开(公告)日:2024-12-03
申请号:CN202411551042.4
申请日:2024-11-01
Applicant: 华侨大学 , 泉州圣源警用侦察设备有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/774 , G06V10/82 , G06V20/52 , G06F17/16
Abstract: 本发明涉及图像处理与目标识别技术领域,公开了一种基于真伪标签一致性的跨模态行人再辨识方法及系统,方法包括:通过深度神经网络对可见光与红外光两种不同模态的行人图像提取特征向量;计算同模态、不同模态间的特征向量相似度,构建同模态、跨模态匹配矩阵,并进行归一化处理,生成同模态和跨模态归一化匹配矩阵;采用跨模态归一化匹配矩阵和同模态归一化匹配矩阵对真实标签进行投影,获得跨模态伪标签;优化真实标签与跨模态伪标签之间的Kullback‑Leibler(KL)散度,从而优化同模态和跨模态匹配矩阵,提升匹配矩阵对模态变化的鲁棒性,从而提升跨模态行人再辨识准确性。
-
公开(公告)号:CN118865075B
公开(公告)日:2024-12-03
申请号:CN202411319739.9
申请日:2024-09-23
Applicant: 华侨大学
IPC: G06V10/98 , G06N3/043 , G06N3/0464 , G06V10/776 , G06V10/82
Abstract: 本发明公开了一种基于分层时空感知的屏幕内容视频质量评价方法及装置,涉及视频评价领域,包括:提取屏幕内容视频中的若干个碎片化视频和若干个关键帧并输入经训练的屏幕内容视频质量评价模型,每个关键帧输入显著性计算模块筛选出若干个显著视频块,每个显著视频块输入双通道卷积神经网络,得到每个阶段的多层特征并输入块级质量评估模块,经过空间门特征增强模块,得到每个阶段的增强特征并输入块级质量聚合模块,得到每个视频块的块级质量分数;采用自适应加权策略计算得到空域感知质量分数;碎片化视频输入时域感知质量评估支路,得到时域感知质量分数,两者结合计算得到屏幕内容视频的质量分数,解决现有视频质量评价方法可靠性差的问题。
-
公开(公告)号:CN118379777B
公开(公告)日:2024-11-22
申请号:CN202410807403.0
申请日:2024-06-21
Applicant: 华侨大学
IPC: G06V40/16 , G06N3/0442 , G06N3/0475 , G06N3/094 , G06V10/774 , G06V10/82 , G06V20/40 , G06V40/20 , G10L21/10
Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统,涉及图像处理技术领域,方法包括:构建人脸视频生成模型,包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器,所述人脸视频生成模型接收人脸图像和语音音频,生成人脸说话视频;获取训练数据集并对人脸视频生成模型进行预训练;构建唇型同步判别器作为判别器,对预训练人脸视频生成模型进行生成对抗训练;利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模,并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度,同时兼顾视频的逼真度,使得其更加真实、自然,从而为各种应用场景提供了更多的灵活性。
-
-
-
-
-
-
-
-
-