-
公开(公告)号:CN117935813B
公开(公告)日:2024-06-14
申请号:CN202410328675.2
申请日:2024-03-21
Applicant: 武汉理工大学 , 武汉大晟极科技有限公司
IPC: G10L17/02 , G10L17/20 , G10L17/04 , G10L17/18 , G10L21/0208 , G10L25/24 , G06N3/045 , G06N3/049 , G06N3/048 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种声纹识别方法及系统,其方法包括:获取包括环境声音的待识别语音,并基于最小均方自适应滤波器对待识别语音进行降噪处理,获得降噪语音;基于小波倒谱熵算法对降噪语音进行特征提取,获得特征向量;将特征向量输入至训练完备的声纹识别模型中进行识别,获得识别结果。本发明通过基于最小均方自适应滤波器对待识别语音进行降噪处理,可滤除环境中的大部分噪音,实现对待识别语音进行准确识别的技术效果。并且,通过设置声纹识别模型的结构,可增强提取的特征的表现力和准确性,从而进一步提高了声纹识别模型对带有环境声音的待识别语音的识别准确性。
-
公开(公告)号:CN117877482A
公开(公告)日:2024-04-12
申请号:CN202311827401.X
申请日:2023-12-26
Applicant: 武汉大晟极科技有限公司
Abstract: 本发明涉及一种基于人脸唇动语音分离的声纹识别方法及装置,该方法包括:构造语音分离网络,所述语音分离网络包括面部属性分析网络、唇动分析网络和音频处理网络;基于所述语音分离网络从待检测视频中提取目标语音;基于声纹识别模型对所述目标语音进行声纹识别;其中,所述面部属性分析网络提取面部属性特征,所述唇动分析网络用于提取嘴唇运动特征,所述音频处理网络用于进行语音分离,所述声纹识别模型是基于注册语音训练得到的。本发明实现了多人说话场景下的单通道语音分离,提高了语音分离的灵活性。
-
公开(公告)号:CN113409796B
公开(公告)日:2022-09-27
申请号:CN202110510987.1
申请日:2021-05-11
Applicant: 武汉大晟极科技有限公司
Abstract: 本发明提供一种基于长时共振峰测量的语音同一性验证方法,已知一份来自同一说话人的语音文件,计算已知的语音文件中,任意两段语音的长时共振峰数据之间的距离,获得上限距离和下限距离,当采集到一份检材语音时,计算检材语音与已知语音文件的长时共振峰距离,若小于下限距离,则判断该检材语音与已知语音文件具有同一性;若大于上限距离,判断该检材语音与已知语音文件不具有同一性;若在上下限距离之间,则采用假设检验法来对同一性进行验证。本发明通过获取语音文件的长时共振峰,根据长时共振峰的距离,结合假设检验法,来进行语音同一性验证,能够提高验证的精度。
-
公开(公告)号:CN110322887B
公开(公告)日:2021-10-15
申请号:CN201910351459.9
申请日:2019-04-28
Applicant: 武汉大晟极科技有限公司
IPC: G10L17/02
Abstract: 本发明提供一种多类型音频信号能量特征提取方法,选取采样频率,采集说话人的音频信号值;对采集的说话人的音频信号值进行滤波和切片处理,得到若干个一定长度的音频信号帧;建立数组;将每一组音频信号帧与数组相乘,得到局部被放大或者缩小的音频信号切片;对音频信号切片进行幅频分析,计算每一种频率信号的能量;生成一维数组;将所有的音频信号帧的特征形成一个二维数组,作为采集的音频信号的能量特征矩阵;依据该能量特征矩阵得到音频信号每一帧之间能量的变化特征矩阵和不同频率信号之间能量的变化特征矩阵。本发明能获得更加丰富的音频信号能量特征。
-
公开(公告)号:CN117935813A
公开(公告)日:2024-04-26
申请号:CN202410328675.2
申请日:2024-03-21
Applicant: 武汉理工大学 , 武汉大晟极科技有限公司
IPC: G10L17/02 , G10L17/20 , G10L17/04 , G10L17/18 , G10L21/0208 , G10L25/24 , G06N3/045 , G06N3/049 , G06N3/048 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种声纹识别方法及系统,其方法包括:获取包括环境声音的待识别语音,并基于最小均方自适应滤波器对待识别语音进行降噪处理,获得降噪语音;基于小波倒谱熵算法对降噪语音进行特征提取,获得特征向量;将特征向量输入至训练完备的声纹识别模型中进行识别,获得识别结果。本发明通过基于最小均方自适应滤波器对待识别语音进行降噪处理,可滤除环境中的大部分噪音,实现对待识别语音进行准确识别的技术效果。并且,通过设置声纹识别模型的结构,可增强提取的特征的表现力和准确性,从而进一步提高了声纹识别模型对带有环境声音的待识别语音的识别准确性。
-
公开(公告)号:CN117877492A
公开(公告)日:2024-04-12
申请号:CN202311696764.4
申请日:2023-12-11
Applicant: 武汉大晟极科技有限公司
Abstract: 本发明涉及一种基于相关人群声纹库的声纹识别方法、装置及设备,该方法包括:从采集的普通人声纹数据中确认与目标人员预设指标相同的声纹数据并建立相关人员声纹库;根据目标人员语音样本库、检材语音、相关人员声纹库和声纹识别背景模型进行声纹对比确定类间测试分布曲线、类内测试分布曲线和声纹对比平均分数;根据类间测试分布曲线、类内测试分布曲线和声纹对比平均分数计算似然率;基于似然率确定是否存在与检材语音为同一人的声纹。本发明将与目标人员预设指标相同的声纹数据建立的相关人员声纹库、检材语音、目标人员语音样本库进行了多方面对比,然后计算对比结果的似然率以确定与检材语音为同一人的声纹,从而提高了声纹识别的准确性。
-
公开(公告)号:CN117852007A
公开(公告)日:2024-04-09
申请号:CN202311814587.5
申请日:2023-12-26
Applicant: 武汉大晟极科技有限公司
Abstract: 本发明提供了一种融合人脸与声纹的身份认证方法、装置、设备及存储介质,其方法包括:获取待认证人员的待认证人脸图像和待认证声纹;确定所述待认证人脸图像的人脸认证评分,并确定所述待认证声纹的声纹认证评分;将所述人脸认证评分和所述声纹认证评分输入至训练完备的分数融合深度学习模型中,获得融合得分,并基于所述融合得分确定所述待认证人员是否认证通过。本发明分别确定人脸认证评分以及声纹认证评分,消除了在认证过程中人脸和声纹这两个生物特征的依赖性,提高了身份认证的精度和准确性,并且,基于分数融合深度学习模型对人脸认证评分和声纹认证评分进行融合,获得融合得分,充分发挥不同生物特征的优点,进一步提高了身份认证的精度和准确性。
-
公开(公告)号:CN113436649B
公开(公告)日:2023-03-21
申请号:CN202110710910.9
申请日:2021-06-25
Applicant: 武汉大晟极科技有限公司
Abstract: 本发明提供一种语音情感标定辅助方法及系统,该方法包括以下步骤:利用语音情感识别算法对语音信号进行情感识别;基于已标注的语音数据,学习不同情感的韵律规律,即不同情感对应的各个情感特征的变化范围和趋势,进而建立韵律规则;接着借助韵律规则对语音信号进行情感识别;最后,综合这两种情感识别的结果,给出最终的标注结果。本发明一方面使用了语音情感识别算法结果进行智能标定,能大大减少标注人员工作量,提高工作效率;另一方面,结合情感分类任务中不同情感对应不同特征变化的规律,为不同的情感统一了标定标准和规则,提高了人工标定时情感标定的准确性,为标注人员提供专业的情感标注辅助。
-
公开(公告)号:CN110189765B
公开(公告)日:2021-08-20
申请号:CN201910341806.X
申请日:2019-04-25
Applicant: 武汉大晟极科技有限公司
Abstract: 本发明提供一种基于频谱形状的语音特征估计方法,对获取的未过滤的语音信号,将时序上连续的N个采样点集合成一个帧,将每一帧乘以帧窗口,语音信号被分为以帧窗口为单位的语音段;每个语音段的短期幅度谱表示为帧窗口的傅里叶变换按比例变换和平移变换的总和;利用每个语音段的短期幅度谱,计算语音距离;将滤波器组信道内的频率分量相关联的语音距离进行求和,并把每个语音距离根据频率分量按照整个滤波器组能量的贡献来加权,得到滤波后的语音距离;将所有语音段滤波后的语音距离,作为语音特征的表达。利用本方法估计的浊音特征和对噪声的先验知识,可以获得更高的识别精度。
-
公开(公告)号:CN111796677A
公开(公告)日:2020-10-20
申请号:CN202010540491.4
申请日:2020-06-15
Applicant: 武汉大晟极科技有限公司
IPC: G06F3/01
Abstract: 本发明属于增强现实设备维修领域,尤其是一种增强现实诱导维修系统的实现设备与方法,针对现有增强现实诱导维修系统的实现设备功能较为单一,不能适用于不同人群使用,使用尺寸固定,通用性较差,且判定位置关系的效率较低的问题,现提出如下方案,其包括第一镜框和第二镜框,所述第一镜框和第二镜框的一侧均转动安装有镜架,两个镜架的一侧均固定安装有处理器,第一镜框和第二镜框的一侧均固定安装有镜头盒。本发明结构合理,增强现实诱导维修系统的实现设备功能较为丰富,使用尺寸灵活,便于调节,能适用于不同人群使用,通用性较好,根据维修物体与瞳孔中心坐标和普尔钦斑点的相对坐标关系判定位置关系的效率较高。
-
-
-
-
-
-
-
-
-