-
公开(公告)号:CN118101938A
公开(公告)日:2024-05-28
申请号:CN202410497734.9
申请日:2024-04-24
Applicant: 华侨大学
IPC: H04N19/119 , H04N19/154
Abstract: 本发明公开了一种基于感兴趣区域的VVC码率控制方法及装置,涉及视频编码领域,方法包括:使用基于残差SSD网络训练的人脸检测模型检测图像中的人脸区域作为ROI;使用斯塔克尔伯格模型对ROI的失真进行建模,并采用二分法求解ROI的目标比特;计算编码图像的JND图作为空域视觉敏感度,对8x8互不重叠的子块进行运动估计,得到时域视觉敏感度;将有约束问题转化为无约束问题,并采用KKT条件进行最优化求解,得到最优拉格朗日乘子用于进行比特分配。本发明考虑视频会议、视频监控等应用对ROI的需求增长,人眼对ROI区域重点关注,提取空时域感知敏感度,对ROI和nROI的比特分配问题分别建模并进行最优化求解,合理进行比特分配。
-
公开(公告)号:CN112818135A
公开(公告)日:2021-05-18
申请号:CN202110208342.2
申请日:2021-02-24
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
Abstract: 本发明公开了一种基于公共语义空间学习构建图文知识图谱方法,包括如下步骤:构建深度神经网络用于图像与文本数据的深度特征提取;将图像与文本数据对oi=(xi,li,yi)分别输入到深度神经网络中训练;其中oi表示第i对图像‑文本对数据以及对应的标签,xi,yi与li分别表示第i个图像数据、文本数据以及对应的标签数据;通过损失函数学习两种图像和文本数据间的公共语义表达,并将图像与文本特征转化到公共语义空间中;根据相似度度量,依据CN‑DBpedia的构建方法构建知识图谱。本发明提供的方法能有效实现图像、文本两种不同的模态间的知识图谱构建。
-
公开(公告)号:CN118632027B
公开(公告)日:2024-10-29
申请号:CN202411083106.2
申请日:2024-08-08
Applicant: 华侨大学
IPC: H04N19/597 , H04N19/85 , H04N19/91 , G06V10/82 , G06N3/042 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/08 , G06V10/80
Abstract: 本发明公开了一种基于图卷积网络的点云压缩方法,涉及点云压缩技术领域,包括:编码器接收原始点云,利用最远点采样实现全局均匀采样,利用图卷积网络实现局部密度采样,按比例选择全局均匀采样后的点云和局部密度采样后的点云,获得下采样后的点云,再使用边缘卷积、点变压器和注意力机制分别进行动态特征学习和融合获得融合特征;熵瓶颈层对下采样后的点云和融合特征进行压缩‑解压缩获得重建点云和重建特征;解码器基于SGFN和DenseGCN对重建点云和重建特征进行特征提取,提取到的特征通过上采样和坐标重建获得重建后的点云。本发明能够在保证相同视觉质量的前提下显著降低比特率开销,提高压缩效率。
-
公开(公告)号:CN118632027A
公开(公告)日:2024-09-10
申请号:CN202411083106.2
申请日:2024-08-08
Applicant: 华侨大学
IPC: H04N19/597 , H04N19/85 , H04N19/91 , G06V10/82 , G06N3/042 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/08 , G06V10/80
Abstract: 本发明公开了一种基于图卷积网络的点云压缩方法,涉及点云压缩技术领域,包括:编码器接收原始点云,利用最远点采样实现全局均匀采样,利用图卷积网络实现局部密度采样,按比例选择全局均匀采样后的点云和局部密度采样后的点云,获得下采样后的点云,再使用边缘卷积、点变压器和注意力机制分别进行动态特征学习和融合获得融合特征;熵瓶颈层对下采样后的点云和融合特征进行压缩‑解压缩获得重建点云和重建特征;解码器基于SGFN和DenseGCN对重建点云和重建特征进行特征提取,提取到的特征通过上采样和坐标重建获得重建后的点云。本发明能够在保证相同视觉质量的前提下显著降低比特率开销,提高压缩效率。
-
公开(公告)号:CN116416645A
公开(公告)日:2023-07-11
申请号:CN202310199941.1
申请日:2023-03-03
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC: G06V40/10 , G06V10/82 , G06N3/08 , G06V10/74 , G06N3/0464
Abstract: 本发明公开了一种基于双分支Transformer网络的属性与图像跨模态行人再辨识方法及装置,获取行人属性和行人图像,行人图像来自行人注册图像集;构建双分支Transformer网络,并对双分支Transformer网络训练,得到属性与图像跨模态行人再辨识模型,双分支Transformer网络包括同型的属性Transformer分支和图像Transformer分支;将行人属性和行人图像输入属性与图像跨模态行人再辨识模型,分别通过属性Transformer分支和图像Transformer分支提取得到属性特征和图像特征;将属性特征与图像特征进行相似度比对,得到行人属性对应的再辨识结果。属性Transformer分支和图像Transformer分支都属于同型的Transformer结构,有利于控制文本属性和行人图像在特征空间中的模态异质性问题,从而提升属性‑图像跨模态行人再辨识准确性。
-
公开(公告)号:CN115620343A
公开(公告)日:2023-01-17
申请号:CN202211386276.9
申请日:2022-11-07
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
Abstract: 本发明提供一种基于多代理相似度聚合的跨模态行人再辨识方法,用于解决昼夜光照差异大而带来的白天可见光图像与夜晚红外图像匹配困难的问题。因此,本发明为每个类别分配多个可学习的代理,获得多代理相似度,并设计多代理相似度聚合机制,实现跨模态行人再辨识。一方面,本发明为每个类别学习多个代理,可以更好地刻画由于数据跨模态引起的剧烈类内差异;另一方面,本发明设计聚合机制,学习最佳的多代理相似度聚合方式,提升跨模态行人再辨识的准确性。因此,本发明可广泛应用于智慧城市、智慧交通以及智慧安防中的智能视频监控系统。
-
公开(公告)号:CN113014916B
公开(公告)日:2022-11-01
申请号:CN202110219595.X
申请日:2021-02-26
Applicant: 华侨大学
IPC: H04N17/00
Abstract: 本发明公开了一种基于局部视频活动度的屏幕视频质量识别方法,方法包括:分别对参考和失真屏幕视频序列采用3D‑LOG滤波器提取屏幕特征;计算屏幕区域相似度,基于3D‑LOG池化策略得到屏幕质量分数;分别对参考和失真屏幕视频序列采用3D‑NSS方法提取自然特征;计算自然区域相似度,基于池化策略得到自然质量分数;计算局部视频活动度;基于局部视频活动度结合屏幕和自然质量分数获得最终失真屏幕视频质量评价值。本发明充分考虑到人类视觉系统对于屏幕视频的屏幕和自然内容区域感知度不同且人眼对于边缘特征高度敏感,具有较好的失真屏幕视频质量评价性能。
-
公开(公告)号:CN114743128A
公开(公告)日:2022-07-12
申请号:CN202210225924.6
申请日:2022-03-09
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司
Abstract: 本发明公开了一种基于异种神经网络的多模态东北虎再辨识方法及装置,涉及机器视觉技术领域,可应用于跟踪东北虎的活动轨迹调查,对保护濒危的东北虎具有重大意义。本发明的异种神经网络包括用双分支残差神经网络和Transformer网络,其中,双分支残差卷积神经网络用于先对红外图像和可见光图像学习局部特征;Transformer网络对由双分支残差卷积神经网络学得的红外图像和可见光图像的局部特征,利用自注意力机制学习东北虎的全局特征。双分支残差卷积神经网络的各分支结构相同但参数独立,用于处理红外和可见光东北虎图像光谱、分辨率、对比度等特性;而Transformer网络从全局视角学习信息东北虎特征,减少图像模态差异带来的噪声影响,实现高准确率的东北虎再辨识。
-
公开(公告)号:CN112905822B
公开(公告)日:2022-07-01
申请号:CN202110144443.8
申请日:2021-02-02
Applicant: 华侨大学 , 厦门亿联网络技术股份有限公司 , 厦门云知芯智能科技有限公司 , 厦门华联电子股份有限公司
Abstract: 本发明涉及一种基于注意力机制的深度监督跨模态对抗学习方法,针对每个模态构建深度学习网络获取深度特征,引入生成对抗网络,利用模态间的交叉判别借助注意力机制不断提炼模态特征网络的生成特征,在公共子空间进行异质性数据的度量的同时,利用标签信息在标签空间对模态数据进行深度监督学习。如此构建的网络,使得训练得到的基于注意力机制的跨模态深度监督对抗模型具有良好的图文互相检索性能;在检索过程中利用训练得到的网络模型M对待查询图像(文本)和候选库中的文本(图像)进行特征提取以及余弦距离计算,从而获取待查询图像(文本)与候选库中的文本(图像)数据之间的相似度较高者,实现跨模态检索。
-
公开(公告)号:CN111985548A
公开(公告)日:2020-11-24
申请号:CN202010802092.0
申请日:2020-08-11
Applicant: 华侨大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06F40/30 , G06F16/906 , G06F16/901
Abstract: 本发明公开了一种标签引导的跨模态深度哈希方法,包括:构建图像、文本以及对应标签信息的特征提取网络,设计损失函数,对输入的文本和图像两个模态进行共同表征空间学习和标签空间的学习,进而消除不同模态间的语义鸿沟。本发明特别考虑了跨模态检索领域中的难点,不同模态的数据存在语义鸿沟,即表现为高层语义相关,底层特征异构,本发明能够有效提高跨模态检索精度。
-
-
-
-
-
-
-
-
-