-
公开(公告)号:CN118381924A
公开(公告)日:2024-07-23
申请号:CN202410480951.7
申请日:2024-04-22
申请人: 西安邮电大学
IPC分类号: H04N19/167 , G06V10/762 , G06V10/25 , G06V10/42 , G06V10/28 , G06V10/26 , H04N19/42
摘要: 本发明属于无人机图像压缩传输技术领域,公开了一种基于感兴趣区域提取的无人机图像压缩算法,具体技术方案为:通过超像素分割算法SLIC与区域聚类算法DBSCAN对输入图像进行预处理;经过分割后,对原图像的两个子图采用不同的压缩比进行压缩,对感兴趣区域采用无损压缩,对非感兴趣区域采用高压缩比进行压缩;将压缩数据信息与感兴趣区域的坐标位置信息组合并通过无线信道传送至地面接收站;接收到图像数据信息后,先进行解压操作,再根据感兴趣区域的坐标位置合成出感兴趣区域子图与非感兴趣区域子图,重构出原始图像,实现更高的压缩效率,优先保证感兴趣区域的传输质量,既满足紧急应用场景下及时反馈的需求,又能保证传输图像的感兴趣区域有效信息质量更好。
-
公开(公告)号:CN116912339A
公开(公告)日:2023-10-20
申请号:CN202310918048.X
申请日:2023-07-25
申请人: 西安邮电大学
IPC分类号: G06T9/00 , G06T3/40 , G06N3/0455 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种对于图像压缩的优化方法,涉及图像压缩技术领域,该方法包括获取图像数据集,通过以结构相似性为标准对图像数据进行拼接,得到原始输入矩阵,构建神经网络模型,引入扩展卡尔曼滤波器模块对神经网络进行训练,将原始输入矩阵输入训练后的神经网络模型的编码层中,得到输出矩阵;将输出矩阵输入至神经网络的解码层中,获得解压缩矩阵。
-
公开(公告)号:CN118918924A
公开(公告)日:2024-11-08
申请号:CN202411097705.X
申请日:2024-08-12
申请人: 西安邮电大学
IPC分类号: G10L25/54 , G10L25/03 , G10L25/18 , G10L25/30 , G06F18/22 , G06V40/16 , G06N3/045 , G06N3/0464 , G06N3/084
摘要: 本发明属于通信技术领域,公开了一种基于异构哈希网络的跨模态语音与人脸关联方法,具体技术方案为:提出了一种基于哈希学习的跨模态深度残差对齐网络,网络将输入特征映射为固定长度的哈希码,有效降低了特征维度以及内存的使用,同时哈希化使得计算效率大大提升,集成残差结构的深层网络使得特征表示能力更强,具有很好的泛化性,通过最小化损失函数能够使得相同身份的语音和人脸特征在哈希空间中汉明距离更近,不同身份的语音和人脸特征距离更远,以此达到语音和人脸的特征对齐,完成跨模态的匹配、验证和检索任务,本发明的模型在跨模态匹配、检索、验证任务中的准确率与现有方法相比有明显的提升。
-
公开(公告)号:CN116668711A
公开(公告)日:2023-08-29
申请号:CN202310581652.8
申请日:2023-05-23
申请人: 西安邮电大学
IPC分类号: H04N19/186 , G06T9/00 , G06F18/23213
摘要: 本发明提供一种高质量的图像压缩方法,将聚类压缩算法与深度神经网络压缩算法相结合;先将原始图像输入到聚类压缩算法中,确定聚类簇数K,对图像的像素值进行K类聚类,聚类后得到输出数据为X,此时图像压缩比为n:1,将数据X输入到深度神经网络压缩算法中,进行两层编码和两层解码,每一层都需要通过均方误差函数来调节本层的网络参数,使误差达到最小或变化很小;编码层的最终输出数据为H1;解码层最终输出数据为X1,X1也是整个图像压缩算法的输出;将X1与X输入到均方误差函数中得到整个图像压缩方法的误差L1;深度神经网络部分压缩比为m:1,通过此步压缩提升压缩图片的压缩质量;整个算法压缩比为nm:1。
-
-
-