-
公开(公告)号:CN116189703B
公开(公告)日:2023-07-14
申请号:CN202310447342.7
申请日:2023-04-24
Applicant: 苏州大学
IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30
Abstract: 本发明公开了一种全局多头注意力语音增强方法,涉及生成对抗网络领域,包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱;将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱;将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱;将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加,然后输入至生成器解码器得到反卷积特征图谱;将反卷积特征图谱输入至全局多头注意力层,得到解码‑全局多头注意力特征图谱;将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。
-
公开(公告)号:CN114782285A
公开(公告)日:2022-07-22
申请号:CN202210688985.6
申请日:2022-06-17
Applicant: 苏州大学
Abstract: 本发明提供一种低分辨率模糊图像增强方法,先利用卷积层提取低分辨率模糊图像特征,接着经过若干残差块组成的残差网络提取残差特征,使用两个转置卷积进行上采样后再次送入卷积层提取特征,在卷积层后连接用密集残差块组成的密集残差网络,用于丰富和恢复图像的细节信息,最终输出得到高分辨率的清晰图像,通过在损失函数中添加感知损失,增强了图像的真实性,具有较好的图像增强复原效果,对于后续可能的目标检测任务来说,本文算法可以极大地提升检测准确率与效率,具有广阔的应用前景。
-
公开(公告)号:CN119479621A
公开(公告)日:2025-02-18
申请号:CN202510040343.9
申请日:2025-01-10
Applicant: 苏州大学
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/20 , G10L15/22 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/0985
Abstract: 本发明涉及语音增强技术领域,公开了一种用于语音增强的多自注意力域方法及系统,包括:采集含有噪音的语音信息;构建MSAF模型的网络架构;将所述语音信息并行输入到N个自注意力模块中;将每个自注意力模块的输出与一个可训练的从高斯分布中随机采样的系数#imgabs0#相乘,得到最终输出的增强后干净的语音。通过融合不同位置自注意力层的自注意力模块,能够从多个维度学习到含有噪声的语音中的干净语音特征,从而实现更优的语音增强效果。在提高语音质量方面具有可比性,并且在分段SNR和语音清晰度方面优异。
-
公开(公告)号:CN118914658B
公开(公告)日:2025-02-11
申请号:CN202411407635.3
申请日:2024-10-10
Applicant: 苏州大学
Abstract: 本发明公开了一种高精度频率测量方法,涉及频率测量技术领域,高精度频率测量方法包括对被测信号频率进行粗测估计,获得被测信号的粗测值;确定被测信号的倍周值;将所述被测信号的倍周值代入非线性倍周闸门函数获得非线性倍周闸门时间;在所述非线性倍周闸门时间下计算获得被测信号的频率;其中,所述被测信号的倍周值为所述非线性倍周闸门时间与所述被测信号周期的比值。本发明通过被测信号的倍周值和非线性倍周函数,使在进行频率测量的时候可以自适应选取适合被测频率频段的闸门时间,从而实现了高精度宽频信号频率测量。
-
公开(公告)号:CN114842001B
公开(公告)日:2022-09-20
申请号:CN202210764320.9
申请日:2022-07-01
Applicant: 苏州大学
Abstract: 本发明提供一种遥感图像检测系统及方法,由残差对抗网络的密集残差块提取每一层的图像特征,通过残差对抗的方式将图像的局部特征与全局特征进行融合,对特征空间层进行重构,完成对遥感图像分辨率的提升,提升分辨率后的遥感图像由Backbone主干网络模块提取图像语义特征、定位特征,然后Neck结构模块通过特征金字塔与路径聚合网络将不同尺度的特征进行融合,接着输出三个目标大小不同的输出网络,最终实现了遥感图像的目标检测,并采用损失函数提高目标预测定位精度,本发明能够有效识别低分辨率下的目标,提升了对小目标的检测精确度,满足遥感图像检测的需求。
-
公开(公告)号:CN118914658A
公开(公告)日:2024-11-08
申请号:CN202411407635.3
申请日:2024-10-10
Applicant: 苏州大学
Abstract: 本发明公开了一种高精度频率测量方法,涉及频率测量技术领域,高精度频率测量方法包括对被测信号频率进行粗测估计,获得被测信号的粗测值;确定被测信号的倍周值;将所述被测信号的倍周值代入非线性倍周闸门函数获得非线性倍周闸门时间;在所述非线性倍周闸门时间下计算获得被测信号的频率;其中,所述被测信号的倍周值为所述非线性倍周闸门时间与所述被测信号周期的比值。本发明通过被测信号的倍周值和非线性倍周函数,使在进行频率测量的时候可以自适应选取适合被测频率频段的闸门时间,从而实现了高精度宽频信号频率测量。
-
公开(公告)号:CN114820617B
公开(公告)日:2022-09-20
申请号:CN202210746133.8
申请日:2022-06-29
Applicant: 苏州大学
Abstract: 本说明书实施例提供一种基于四焦距相位相干机器视觉的晶体缺陷检测方法和系统,属于图像处理技术领域,该方法包括通过相位转换装置将待检测晶体的缺陷转化为相位信息;通过图像采集装置将相位信息转化为待检测晶体的晶体缺陷特征图像;对晶体缺陷特征图像进行预处理,获取预处理后的灰度图像;对预处理后的灰度图像进行灰度分析,确定灰度信息;基于灰度信息,确定缺陷厚度,具有快速且准确地确定晶体缺陷的优点。
-
公开(公告)号:CN114842001A
公开(公告)日:2022-08-02
申请号:CN202210764320.9
申请日:2022-07-01
Applicant: 苏州大学
Abstract: 本发明提供一种遥感图像检测系统及方法,由残差对抗网络的密集残差块提取每一层的图像特征,通过残差对抗的方式将图像的局部特征与全局特征进行融合,对特征空间层进行重构,完成对遥感图像分辨率的提升,提升分辨率后的遥感图像由Backbone主干网络模块提取图像语义特征、定位特征,然后Neck结构模块通过特征金字塔与路径聚合网络将不同尺度的特征进行融合,接着输出三个目标大小不同的输出网络,最终实现了遥感图像的目标检测,并采用损失函数提高目标预测定位精度,本发明能够有效识别低分辨率下的目标,提升了对小目标的检测精确度,满足遥感图像检测的需求。
-
公开(公告)号:CN114820617A
公开(公告)日:2022-07-29
申请号:CN202210746133.8
申请日:2022-06-29
Applicant: 苏州大学
Abstract: 本说明书实施例提供一种基于四焦距相位相干机器视觉的晶体缺陷检测方法和系统,属于图像处理技术领域,该方法包括通过相位转换装置将待检测晶体的缺陷转化为相位信息;通过图像采集装置将相位信息转化为待检测晶体的晶体缺陷特征图像;对晶体缺陷特征图像进行预处理,获取预处理后的灰度图像;对预处理后的灰度图像进行灰度分析,确定灰度信息;基于灰度信息,确定缺陷厚度,具有快速且准确地确定晶体缺陷的优点。
-
公开(公告)号:CN116189703A
公开(公告)日:2023-05-30
申请号:CN202310447342.7
申请日:2023-04-24
Applicant: 苏州大学
IPC: G10L21/0208 , G10L19/008 , G10L19/02 , G10L25/30
Abstract: 本发明公开了一种全局多头注意力语音增强方法,涉及生成对抗网络领域,包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱;将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱;将全局多头注意力特征图谱输入至生成器编码器得到卷积‑全局多头注意力‑卷积特征图谱;将卷积‑全局多头注意力‑卷积特征图谱与从高斯分布中采样的随机噪声z叠加,然后输入至生成器解码器得到反卷积特征图谱;将反卷积特征图谱输入至全局多头注意力层,得到解码‑全局多头注意力特征图谱;将解码‑全局多头注意力特征图谱输入至生成器解码器得到增强后的音频信号。本发明可以用于语音增强网络并能实现时间依赖性。
-
-
-
-
-
-
-
-
-