-
公开(公告)号:CN114239730B
公开(公告)日:2024-08-20
申请号:CN202111564321.0
申请日:2021-12-20
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC: G06F16/901 , G06N5/025 , G06F40/30 , G06V10/44 , G06F16/33 , G06F16/56 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了一种基于近邻排序关系的跨模态检索方法,包括:构建用于图像模态数据以及文本模态数据的深度语义特征提取的深度神经网络模型;将图像数据与文本数据对分别输入到所述深度神经网络模型中进行训练;结合近邻样本排序损失函数和语义相似度度量损失函数,计算语义对齐的损失值,通过训练缩小损失值,得到训练好的深度神经网络模型;通过训练好的深度神经网络模型提取到图像数据和文本数据间的公共语义表达,并将图像的深度语义特征与文本的深度语义特征转化到公共语义空间中,实现语义相似度的度量和检索。本发明方法能够有效地实现图像和文本两种不同模态数据间的跨模态检索。
-
公开(公告)号:CN118196840B
公开(公告)日:2024-08-09
申请号:CN202410610290.5
申请日:2024-05-16
Applicant: 华侨大学
Abstract: 本发明公开了一种基于语义偏好挖掘的行人再辨识方法,涉及人工智能、机器视觉领域,包括:利用预训练的语义分割模型将行人图像处理为语义分割图,将语义分割图空间划分为若干部件语义块,计算不同语义在语义分割图与部件语义块中的比例,根据不同语义的比例对部件语义块分组进行语义对齐,获得各部件语义块分组对应的部件序号;基于部件序号对部件特征分组,利用自注意网络将各部件特征组投影到公共嵌入空间并进行偏好挖掘,继而利用偏好信息对各部件特征组进行自适应聚合,增强行人再辨识准确性。
-
公开(公告)号:CN118411583A
公开(公告)日:2024-07-30
申请号:CN202410836696.5
申请日:2024-06-26
Applicant: 华侨大学
IPC: G06V10/776 , G06N3/0464 , G06V10/54 , G06V10/74 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明公开了一种基于多特征融合的沉浸式视频质量评价方法及装置,涉及视频处理领域,包括:对参考纹理视频序列和失真纹理视频序列采用3D‑LOG滤波器进行特征提取,得到参考纹理特征和失真纹理特征,并计算得到纹理特征相似度,基于纹理特征相似度通过3D‑LOG池化策略得到纹理视频质量分数;根据参考深度视频序列和失真深度视频序列计算得到参考深度特征和失真深度特征;根据参考深度特征和失真深度特征计算得到深度特征相似度并确定梯度权重,根据深度特征相似度和梯度权重计算得到深度视频质量分数;根据纹理视频质量分数和深度视频质量分数计算得到待评价的沉浸式视频的质量分数,解决现有视频评价算法不符合人眼视觉特性和沉浸式视频的特点的问题。
-
公开(公告)号:CN118101938B
公开(公告)日:2024-06-25
申请号:CN202410497734.9
申请日:2024-04-24
Applicant: 华侨大学
IPC: H04N19/119 , H04N19/154
Abstract: 本发明公开了一种基于感兴趣区域的VVC码率控制方法及装置,涉及视频编码领域,方法包括:使用基于残差SSD网络训练的人脸检测模型检测图像中的人脸区域作为ROI;使用斯塔克尔伯格模型对ROI的失真进行建模,并采用二分法求解ROI的目标比特;计算编码图像的JND图作为空域视觉敏感度,对8x8互不重叠的子块进行运动估计,得到时域视觉敏感度;将有约束问题转化为无约束问题,并采用KKT条件进行最优化求解,得到最优拉格朗日乘子用于进行比特分配。本发明考虑视频会议、视频监控等应用对ROI的需求增长,人眼对ROI区域重点关注,提取空时域感知敏感度,对ROI和nROI的比特分配问题分别建模并进行最优化求解,合理进行比特分配。
-
公开(公告)号:CN113949872B
公开(公告)日:2024-06-25
申请号:CN202111320458.1
申请日:2021-11-09
Applicant: 华侨大学
IPC: H04N19/147 , H04N19/70
Abstract: 本发明涉及一种基于3D‑Gradient引导的屏幕内容视频编码码率控制方法,属于视频编码领域。本方法采用3D‑Gradient滤波器同时提取屏幕内容视频序列空域和时域的边缘结构特征以及运动信息,将屏幕内容中空域和时域特征进行融合,获取最终的像素级复杂度因子。通过像素级复杂度因子计算CTU级复杂度因子CF进行CTU级的目标比特分配。利用当前编码帧的参考帧以及重建帧的相似度结合目标比特进行率失真模型的构建,实现目标比特,引导码率控制模型的生成。本发明提出的屏幕内容视频编码码率控制方法能够提高码率控制精度,明显改善重建视频序列的率失真性能,在一定程度上降低视频编码时间复杂度。
-
公开(公告)号:CN117495680B
公开(公告)日:2024-05-24
申请号:CN202410001400.8
申请日:2024-01-02
Applicant: 华侨大学
IPC: G06T3/4053 , G06T3/4046 , G06N3/0455 , G06N3/0464 , G06V10/44 , G06V10/80
Abstract: 本发明公开了一种基于特征融合Transformer的多对比度核磁共振图像超分辨率方法,涉及图像处理技术领域,包括:构建浅层特征提取模块;构建双域特征提取模块和双融合特征提取模块并进行组合,生成残差全局特征融合模块,基于残差全局特征融合模块构建深层特征提取模块;构建图像重建模块;将浅层特征提取模块、深层特征提取模块和图像重建模块组合,构建基于特征融合Transformer的多对比度核磁共振图像超分辨率网络,并以待重建的低分辨率图像和核磁共振图像作为网络的输入,得到重建后高分辨率图像。本发明利用特征融合Transformer来提取多对比度MRI图像中所包含的全局与局部特征,使得重建的图像更加清晰。
-
公开(公告)号:CN117456560B
公开(公告)日:2024-03-29
申请号:CN202311775203.3
申请日:2023-12-22
Applicant: 华侨大学
IPC: G06V40/10 , G06V10/26 , G06V10/44 , G06V10/771 , G06V10/82
Abstract: 本发明公开了一种基于前景感知动态部件学习的行人再辨识方法,涉及人工智能、机器视觉领域,包括:将浅层特征映射解码为前景能量图,利用交叉熵优化前景能量图,使其趋于真实前景标签,再将前景能量图空间划分为若干部件能量块,用各个部件能量块代表相应的浅层特征映射块的当前重要性;结合当前重要性和历史重要性对各浅层特征映射块进行综合重要性计算并排序,根据综合重要性排序优先选择高综合重要性的浅层特征映射块参与行人再辨识模型训练,从而减少来自背景区域的低综合重要性的浅层特征映射块参与行人再辨识模型训练的机会,达到抑制背景区域对行人辨识的干扰,提升行人再辨识准确性,可广泛应用于智慧城市场景中的城市安防系统。
-
公开(公告)号:CN117196959B
公开(公告)日:2024-03-01
申请号:CN202311475294.9
申请日:2023-11-08
Applicant: 华侨大学
IPC: G06T3/4053 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于自注意力的红外图像超分辨率方法、装置及可读介质,涉及图像处理领域,包括:构建基于自注意力的轻量级红外图像超分辨率模型并训练,得到经训练的轻量级红外图像超分辨率模型;将待重建的低分辨率红外图像输入经训练的轻量级红外图像超分辨率模型,该模型包括3×3卷积层、轻量级Transformer与CNN骨干、高效细节自注意力模块和图像重建模块,待重建的低分辨率红外图像输入3×3卷积层,得到第一特征,再依次经过轻量级Transformer与CNN骨干和高效细节自注意力模块,且高效细节自注意力模块以共享参数的方式循环n次,得到第二特征,将第一特征和第二特征进行残差连接后输入图像重建模块,输出高分辨率红外图像,解决参数量冗余、性能差等问题。
-
公开(公告)号:CN117495714A
公开(公告)日:2024-02-02
申请号:CN202410004081.6
申请日:2024-01-03
Applicant: 华侨大学
IPC: G06T5/70 , G06N3/0455 , G06N3/0464 , G06T5/10 , G06T5/50
Abstract: 本发明公开了一种基于扩散生成先验的人脸图像复原方法、装置及可读介质,涉及图像处理模块,包括:构建基于预训练的扩散模型的人脸图像复原模型,将待复原的人脸图像输入前向加噪模块中逐步增加噪声,得到噪声图像;将噪声图像输入反向去噪模块中逐步去噪,生成最终复原的人脸图像;将第t步的噪声图像及第t步的时间戳输入噪声预测器,预测得到第t步的噪声;在前向加噪模块中,将第t步的噪声图像和第t步的噪声输入结合融合反演的前向扩散公式,得到第t+1步的噪声图像;在反向去噪模块中,对第t步的噪声图像进行零阈值分解,并与第t步的噪声输入反向扩散公式,得到第t‑1步的噪声图像,解决了现有技术生成的复原图像在真实性和一致性差问题。
-
公开(公告)号:CN117495680A
公开(公告)日:2024-02-02
申请号:CN202410001400.8
申请日:2024-01-02
Applicant: 华侨大学
IPC: G06T3/4053 , G06T3/4046 , G06N3/0455 , G06N3/0464 , G06V10/44 , G06V10/80
Abstract: 本发明公开了一种基于特征融合Transformer的多对比度核磁共振图像超分辨率方法,涉及图像处理技术领域,包括:构建浅层特征提取模块;构建双域特征提取模块和双融合特征提取模块并进行组合,生成残差全局特征融合模块,基于残差全局特征融合模块构建深层特征提取模块;构建图像重建模块;将浅层特征提取模块、深层特征提取模块和图像重建模块组合,构建基于特征融合Transformer的多对比度核磁共振图像超分辨率网络,并以待重建的低分辨率图像和核磁共振图像作为网络的输入,得到重建后高分辨率图像。本发明利用特征融合Transformer来提取多对比度MRI图像中所包含的全局与局部特征,使得重建的图像更加清晰。
-
-
-
-
-
-
-
-
-