基于多子带生成策略的语音合成系统、方法、介质及设备

    公开(公告)号:CN119360823A

    公开(公告)日:2025-01-24

    申请号:CN202411157142.9

    申请日:2024-08-22

    Abstract: 本发明实施例公开了一种基于多子带生成策略的语音合成系统、方法、介质及设备,系统包括:预处理模块,用于将文本转化为音素序列,将对应的语音通过短时傅里叶变换转化为线性频谱;后验编码器模块,用于将线性频谱转化为后验分布,根据后验分布中的均值和标准差进行采样得到潜在变量;转换层模块,用于将潜在变量转换为采样数据;先验编码器模块,用于将音素序列提取为深度特征,将深度特征映射为先验分布;发音时长推测模块,用于将先验分布与采样数据对齐,获取对齐矩阵,根据深度特征和对齐矩阵通过编码获取发音时长分布;解码器模块,用于将先验分布依据发音时长分布采样为多子带信号并合成为语音波形信号,实现了文本到语音的直接映射。

    红外小目标伪标签生成方法、系统、存储介质及设备

    公开(公告)号:CN118736290A

    公开(公告)日:2024-10-01

    申请号:CN202410789942.6

    申请日:2024-06-19

    Abstract: 本发明实施例公开了一种红外小目标伪标签生成方法,该方法包括:采集红外图像和与其对应的人工标签图像;从人工标签图像中提取目标形心标签图像和粗标签图像,并使用高斯模糊核处理二者,获取模糊形心标签图像和模糊粗标签图像;根据红外图像和模糊粗标签图像训练形心偏移校准网络直至收敛;预设该网络的权值,并使用形心偏移校准网络确定中心区域预测结果;获取该结果的形心,并根据高斯模糊核得到模糊形心;根据红外图像和模糊形心训练伪标签图像精细生成网络直至收敛;根据伪标签图像精细生成网络确定红外图像对应的最终伪标签图像。本发明通过形心偏移校准和伪标签图像精细生成,提高伪标签图像准确度和精细度,有利于红外图像分析。

    一种基于多级特征分解和频域判别的红外图像彩色化方法

    公开(公告)号:CN118351198A

    公开(公告)日:2024-07-16

    申请号:CN202410334343.5

    申请日:2024-03-22

    Abstract: 本发明公开了一种基于多级特征分解和频域判别的红外图像彩色化方法,包括:获取同一场景目标的原始红外图像和原始可见光图像;利用生成器生成原始红外图像的彩色可见光生成图像;得到原始红外图像和彩色可见光生成图像的浅层编码特征;将两图像的浅层编码特征分别输入多级特征分解网络得到各自的低频基础特征和高频细节特征;用两图的低频基础特征和高频细节特征分别对应建立全局对比损失和局部对比损失;对彩色可见光生成图像和原始可见光图像基于空域判别器、频域判别器、全局对比损失和局部对比损失进行判别;若判别通过输出彩色可见光生成图像,否则返回生成彩色可见光生成图像步骤。本发明能保证彩色化内容不失真,提高红外图像彩色化效果。

    基于多尺度引导滤波的高动态红外图像细节增强方法

    公开(公告)号:CN113096053B

    公开(公告)日:2024-02-09

    申请号:CN202110287389.2

    申请日:2021-03-17

    Abstract: 本发明公开了一种基于多尺度引导滤波的高动态红外图像细节增强方法,对输入的高动态红外图像进行多尺度引导滤波分解,获得不同尺度的图像细节层;对所述不同尺度的图像细节层进行加权融合,获得多尺度融合的细节层,并通过与原始图像作差,获得相应的基本层;对所述多尺度融合的细节层和相应的基本层分别进行非线性压缩映射,获得增强的细节层和低动态的基本层;最后,叠加所述增强的细节层和低动态的基本层并进行归一化,获得细节增强的低动态红外图像。本发明能够快速高效地提取更多细节信息,也避免出现梯度翻转问题,细节增强性能和整体视觉效果较优。

    一种基于跟踪置信度分析与自适应尺度处理的抗遮挡目标跟踪方法

    公开(公告)号:CN117495905A

    公开(公告)日:2024-02-02

    申请号:CN202311466190.1

    申请日:2023-11-06

    Abstract: 一种基于跟踪置信度分析与自适应尺度处理的抗遮挡目标跟踪方法,根据目标不同跟踪状态,采取不同的特征融合方式,得到目标融合特征;根据相关滤波响应,计算目标跟踪置信度,以反映目标处于正常跟踪、轻微遮挡或严重遮挡的状态;当目标被严重遮挡、出视野或发生大幅形变时,进行中心扩散搜索,以前一帧目标位置为中心生成一系列候选区域,计算相关响应,得到遮挡处理的最佳目标位置;在非正常跟踪情况下,采用动态学习率调整方法,以确保中心扩散搜索的有效性,并提高处理速度;应用边框相关滤波提取边界框,并采用自适应尺度处理方法得到最终目标框,实现目标跟踪。本发明可实现对视频图像中遮挡目标的跟踪,降低了计算成本且目标跟踪精度较高。

    一种利用频域特性的自适应低照度图像增强方法

    公开(公告)号:CN117196982A

    公开(公告)日:2023-12-08

    申请号:CN202311160895.0

    申请日:2023-09-08

    Abstract: 本发明公开了一种利用频域特性的自适应低照度图像增强方法,包括:将低照度图像分解为照度图和反射图;基于频域特性的自适应照度调整方法对照度图进行自适应的照度调整,得到调整后的照度图;基于噪声在图像上分布的独立性,对所述调整后的照度图进行噪声抑制,得到噪声抑制后的照度图;基于噪声在图像上分布的独立性,对所述反射图进行噪声抑制,得到噪声抑制后的反射图;对所述噪声抑制后的照度图和所述噪声抑制后的照度图进行融合,得到增强后的低照度图像。本发明的方法实现图像照度的自适应调整,同时对图像细节进行全局增强,从而提高增强后图像的整体质量,实现高效的图像增强效果。

Patent Agency Ranking