-
公开(公告)号:CN113409820A
公开(公告)日:2021-09-17
申请号:CN202110642169.7
申请日:2021-06-09
申请人: 合肥群音信息服务有限公司
摘要: 本发明公开了一种基于语音数据的质量评价方法,涉及语音数据质量评价技术领域,解决了现有技术中能够对测试语音进行预处理导致工作强度增加的技术问题,获取一段20秒的语音,随后获取到一段质量评价合格的语音并将其标记为标准语音,将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较,将监测语音进行帧划分,将监测语音划分为若干个语音帧,获取到语音帧的音频波长和频率,随后通过公式获取到语音帧的参数分析系数Xi,将测试语音内语音帧构建参数分析系数集合,对测试语音进行预处理,提高了测试语音的合格率,防止对不合格语音进行质量评价,导致工作强度增加,降低了语音质量评价的工作效率。
-
公开(公告)号:CN115310459A
公开(公告)日:2022-11-08
申请号:CN202210803158.7
申请日:2022-07-07
申请人: 合肥群音信息服务有限公司
摘要: 本发明公开了一种机器翻译语料质量评估处理方法,涉及机器翻译技术领域,解决了现有技术在进行语料评价过程中,侧重于如何从给定语料中选择高质量语料,而无法对给定语料进行高效准确地评估的技术问题;本发明对根据语料特征获取原始翻译语料中子语料的语料质量评分,进而获取质量分析标签;结合目标翻译语料的冗余率和质量分析标签获取原始语料评分,根据原始语料评分实现对原始翻译语料质量的评估,当质量和噪声均在要求范围内时,判定该原始翻译语料是符合高质量要求的;本发明在获取目标翻译语料之后,通过专业人员对目标翻译语料进行抽样分析,通过合理调节设定比例可以满足不同规模目标翻译语料的需求,能够提高质量分析精度。
-
公开(公告)号:CN113409815A
公开(公告)日:2021-09-17
申请号:CN202110591658.4
申请日:2021-05-28
申请人: 合肥群音信息服务有限公司
摘要: 本发明公开了一种基于多源语音数据的语音对齐方法,属于语音处理领域,涉及语音对齐技术,用于通过语音对齐方法将起始点拉齐,实现各语音数据的对齐,避免人工对齐的方式花费大量的时间和处理效率、对齐准确率较低的问题;步骤一:通过语音采集模块对同一声源进行不同位置的语音数据采集,并将采集获取的声源的语音数据发送至语音处理模块;通过语音处理模块对多个语音采集模块发送的语音数据进行处理;并将处理完成的语音数据发送至语音分析模块;通过语音分析模块对处理完成后的语音数据进行语音对齐;并将对齐的语音数据发送至语音组合模块;通过语音组合模块将对齐后的语音数据进行语音组合。
-
公开(公告)号:CN113409820B
公开(公告)日:2022-03-15
申请号:CN202110642169.7
申请日:2021-06-09
申请人: 合肥群音信息服务有限公司
摘要: 本发明公开了一种基于语音数据的质量评价方法,涉及语音数据质量评价技术领域,解决了现有技术中能够对测试语音进行预处理导致工作强度增加的技术问题,获取一段20秒的语音,随后获取到一段质量评价合格的语音并将其标记为标准语音,将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较,将监测语音进行帧划分,将监测语音划分为若干个语音帧,获取到语音帧的音频波长和频率,随后通过公式获取到语音帧的参数分析系数Xi,将测试语音内语音帧构建参数分析系数集合,对测试语音进行预处理,提高了测试语音的合格率,防止对不合格语音进行质量评价,导致工作强度增加,降低了语音质量评价的工作效率。
-
公开(公告)号:CN113409815B
公开(公告)日:2022-02-11
申请号:CN202110591658.4
申请日:2021-05-28
申请人: 合肥群音信息服务有限公司
摘要: 本发明公开了一种基于多源语音数据的语音对齐方法,属于语音处理领域,涉及语音对齐技术,用于通过语音对齐方法将起始点拉齐,实现各语音数据的对齐,避免人工对齐的方式花费大量的时间和处理效率、对齐准确率较低的问题;步骤一:通过语音采集模块对同一声源进行不同位置的语音数据采集,并将采集获取的声源的语音数据发送至语音处理模块;通过语音处理模块对多个语音采集模块发送的语音数据进行处理;并将处理完成的语音数据发送至语音分析模块;通过语音分析模块对处理完成后的语音数据进行语音对齐;并将对齐的语音数据发送至语音组合模块;通过语音组合模块将对齐后的语音数据进行语音组合。
-
公开(公告)号:CN113448514A
公开(公告)日:2021-09-28
申请号:CN202110614847.9
申请日:2021-06-02
申请人: 合肥群音信息服务有限公司
IPC分类号: G06F3/06 , G10L21/0208 , G10L25/60
摘要: 本发明公开了一种多源语音数据的自动处理系统,涉及多源语音数据处理技术领域,包括质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块;质量检测模块接收到质量检测指令后对多源语音数据进行质量检测,能够有效保证采集的语音数据的清晰和准确,提高语音通信质量;存储分析模块用于采集存储区块的剩余内存并进行存储预测,生成清理信号,以及时对存储的语音数据进行清理,减轻存储区块的存储压力;云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台,同时能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储,提高数据处理效率。
-
公开(公告)号:CN115100411A
公开(公告)日:2022-09-23
申请号:CN202210806180.7
申请日:2022-07-08
申请人: 合肥群音信息服务有限公司
IPC分类号: G06V10/26 , G06V10/764 , G06V10/82 , G06V10/22
摘要: 本发明公开了一种区域自划分的图像识别系统及方法,涉及图像识别技术领域,解决了现有技术中的区域划分,操作费时又不准确的技术问题;本发明通过摄像装置获取目标区域的原始图像,并将原始图像发送至图像处理模块,图像处理模块原始图像进行区域划分,获取S个子区域图像;实现了对原始图像进行区域划分,提高了区域划分的准确率;根据子区域图像和图像识别模型获取子区域图像标签;并将子区域图像和子区域图像标签发送至区域划分模块;区域划分模块根据子区域图像和子区域图像标签对原始图像进行区域划分;可对每个子区域获取标签,便于用户了解子区域特征。
-
公开(公告)号:CN113448514B
公开(公告)日:2022-03-15
申请号:CN202110614847.9
申请日:2021-06-02
申请人: 合肥群音信息服务有限公司
IPC分类号: G06F3/06 , G10L21/0208 , G10L25/60
摘要: 本发明公开了一种多源语音数据的自动处理系统,涉及多源语音数据处理技术领域,包括质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块;质量检测模块接收到质量检测指令后对多源语音数据进行质量检测,能够有效保证采集的语音数据的清晰和准确,提高语音通信质量;存储分析模块用于采集存储区块的剩余内存并进行存储预测,生成清理信号,以及时对存储的语音数据进行清理,减轻存储区块的存储压力;云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台,同时能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储,提高数据处理效率。
-
-
-
-
-
-
-