-
-
公开(公告)号:CN116847024B
公开(公告)日:2024-10-29
申请号:CN202310624299.7
申请日:2023-05-30
申请人: 深圳市长喜信息咨询有限公司
IPC分类号: H04M3/22 , G06F40/166 , G06F40/117 , G06F40/205 , G10L25/60
摘要: 本发明属于录音质检领域,涉及数据分析技术,用于解决现有技术中的通话录音质检系统,无法从多维度对通话质量进行检测分析的问题,具体是一种基于通话录音多维度抽样质检系统,包括录音检测模块、文本检测模块、回访分析模块以及综合评价模块,录音检测模块、文本检测模块、回访分析模块以及综合评价模块依次进行单向连接,回访分析模块还与优化分析模块通信连接,录音检测模块用于对通话录音进行抽样检测分析并对员工的录音检测结果是否满足要求进行判定;本发明是对通话录音进行抽样检测分析,通过对录音切片的各项参数进行综合分析与计算得到音质系数,并根据音质表现值与音质波动值对员工的录音质量进行反馈。
-
公开(公告)号:CN118841040A
公开(公告)日:2024-10-25
申请号:CN202410849435.7
申请日:2024-06-27
申请人: 中国移动通信集团北京有限公司 , 中国移动通信集团有限公司
IPC分类号: G10L25/60 , G06F18/213 , G06F18/25 , G06F18/24 , G06N3/0464 , G06N3/045 , G10L25/30 , G06F123/02
摘要: 本发明提供一种语音质量预测方法、装置、电子设备、存储介质及产品,包括:获取待预测的视频通话结果的音频信号和视频信号;将音频信号输入多尺度音频特征融合模块,得到多尺度音频特征;将视频信号输入多尺度视频特征融合模块,得到多尺度视频特征;通过多尺度视频特征融合模块中的多尺度残差网络对视频信号的各尺度的视频特征进行处理,得到多尺度视频特征;根据多尺度音频特征和多尺度视频特征,预测视频通话结果的语音质量。本发明通过多尺度残差网络,挖掘视频信号中与语音质量相关的尺度和深度特征信息,使得特征信息更加全面多样,并通过结合多尺度视频特征结合多尺度音频特征进行语音质量预测,可以强化特征信息,提高语音质量预测效果。
-
公开(公告)号:CN118646823B
公开(公告)日:2024-10-25
申请号:CN202411120766.3
申请日:2024-08-15
申请人: 杭州贵禾科技有限公司
摘要: 本申请涉及智能化检测领域,具体涉及一种通话质量智能检测方法、装置及存储介质。其采用基于深度学习的人工智能技术对音频通道中的语音信号进行细粒度的信号分析,以挖掘出局部时间尺度的信号波形特征,进而基于各个信号片段波形特征之间的时域关联和特征显著性来进行特征聚合,以获取语音信号的全局时域核心特征表示,并以此来进行通话质量的智能检测。这样,可以有效提高语音质量评估精度,提升检测效率,实现更准确、更适应性强的通话质量检测。
-
公开(公告)号:CN116524958B
公开(公告)日:2024-10-22
申请号:CN202310623577.7
申请日:2023-05-30
申请人: 南开大学
摘要: 本发明属于计算机处理技术领域,更具体地,涉及一种基于质量对比学习的合成音质量评测模型的训练方法。该方法包括以下步骤:步骤S101,引入在大规模数据集上训练的模型作为预训练模型;步骤S102,设置中间任务,并定义正负样本,进行数据集中的正负样本划分;步骤S103,定义带权重的损失函数,控制训练目标,调整正负样本对表征的距离;步骤S104,在预训练模型基础上增加中间任务头,并按照上述规则进行训练;步骤S105,保留步骤S104阶段训练得到的特征提取部分,增加下游任务头,以最小化预测分数和标签分数的均方误差为目标进行训练。
-
公开(公告)号:CN114220455B
公开(公告)日:2024-10-01
申请号:CN202111536959.3
申请日:2021-12-15
申请人: 东风汽车集团股份有限公司
摘要: 本申请涉及一种车辆关门声品质评价方法及系统,涉及汽车测试技术领域,该方法包括以下步骤:采集获得待评价车辆的车辆关门声信号,截取获得车门开始旋转至车门完全关好过程中的第一关门声信号;对预处理后的第一关门声信号进行频谱分析,获得第一关门声信号对应的能量谱数据;对能量谱数据进行Mel滤波,计算获得待评价车辆的MFCC数据;基于预设的关门声品质标定数据以及待评价车辆的MFCC数据,计算获得待评价车辆对应的关门声品质评分值。本申请对车辆关门声信号进行数据处理,获得对应的MFCC数据,并结合关门声品质标定数据进行关门声品质评价,在保障准确性和可靠性的前提下,满足当前关门声品质评价需求。
-
公开(公告)号:CN118711618A
公开(公告)日:2024-09-27
申请号:CN202310308381.9
申请日:2023-03-27
申请人: 哈曼国际工业有限公司
IPC分类号: G10L25/60 , G10L21/0216 , G10L21/0232
摘要: 本公开提供一种用于检测语音信号的失真并修复失真的语音信号的方法。该方法包括:检测来自气导麦克风的气导语音信号中是否存在由削波引起的第一失真;检测来自入耳麦克风的入耳语音信号中是否存在由非语音伪信号而引起的第二失真;响应于检测到所述第一失真,使用所述入耳语音信号执行对具有第一失真的气导语音信号的修复;以及响应于检测到所述第二失真,使用所述气导语音信号执行对具有第二失真的入耳语音信号的修复。
-
公开(公告)号:CN118692499A
公开(公告)日:2024-09-24
申请号:CN202410717679.X
申请日:2024-06-04
申请人: 福建师范大学
摘要: 本发明提出分数阶语谱图深度学习的声乐发声练习质量等级评定方法,包括以下步骤;步骤S1、采集歌唱者声乐母音发声练习的音频信号,并根据发声指标标注相应的质量等级,构建样本数据集,用于模型的训练、测试和验证;步骤S2、将音频信号转换为一系列的分数阶语谱图;步骤S3、构建模型中的基于DenseNet和通道注意力机制的分数阶语谱图深度特征提取网络,将提取的分数阶语谱图深度特征输入到BiLSTM网络,抽取发声练习信号的时间序列特征;步骤S4、采用量子烟花算法优化模型的核极限学习机的超参数,将抽取的时间序列特征映射到高维空间进行质量等级决策,形成评定结果;步骤S5、对模型进行训练;本发明能够更好地适应非平稳信号的特性,提供更准确的频谱分析。
-
公开(公告)号:CN112967735B
公开(公告)日:2024-09-20
申请号:CN202110202612.9
申请日:2021-02-23
申请人: 北京达佳互联信息技术有限公司
IPC分类号: G10L25/60
摘要: 本公开关于一种语音质量检测模型的训练方法及语音质量的检测方法,所述训练方法包括:获取语音信号样本和所述语音信号样本通过网络传输时的网络服务质量QoS数据样本;将所述语音信号样本的音频特征和所述网络QoS数据样本输入到所述语音质量检测模型,得到估计的语音质量分数;基于所述语音信号样本的真实语音质量分数和所述估计的语音质量分数,确定所述语音质量检测模型的损失函数;基于确定的损失函数,对所述语音质量检测模型进行训练。
-
公开(公告)号:CN118658462A
公开(公告)日:2024-09-17
申请号:CN202410672272.X
申请日:2024-05-28
申请人: 马上消费金融股份有限公司
发明人: 熊雪军
摘要: 本申请实施例提供了一种语音活性检测方法、装置、设备及介质,用于准确有效地进行语音帧的活性检测。由于在本申请实施例中,在确定待检测语音信号中的第一语音帧是否为活性语音帧时,除了考虑该第一语音帧自身,还考虑了待检测语音信号中与第一语音帧接收时间比较接近且比较相似的至少一个第二语音帧,由于接收时间接近且比较相似的多个语音帧之间通常属性相同,即通常均为活性语音帧,或者均为非活性语音帧,因此在确定该第一语音帧是否为活性语音帧时,还考虑至少一个第二语音帧,可以进一步提高语音活性检测的准确性。
-
-
-
-
-
-
-
-
-