一种机器翻译语料质量评估处理方法

    公开(公告)号:CN115310459A

    公开(公告)日:2022-11-08

    申请号:CN202210803158.7

    申请日:2022-07-07

    IPC分类号: G06F40/51 G06F40/58

    摘要: 本发明公开了一种机器翻译语料质量评估处理方法,涉及机器翻译技术领域,解决了现有技术在进行语料评价过程中,侧重于如何从给定语料中选择高质量语料,而无法对给定语料进行高效准确地评估的技术问题;本发明对根据语料特征获取原始翻译语料中子语料的语料质量评分,进而获取质量分析标签;结合目标翻译语料的冗余率和质量分析标签获取原始语料评分,根据原始语料评分实现对原始翻译语料质量的评估,当质量和噪声均在要求范围内时,判定该原始翻译语料是符合高质量要求的;本发明在获取目标翻译语料之后,通过专业人员对目标翻译语料进行抽样分析,通过合理调节设定比例可以满足不同规模目标翻译语料的需求,能够提高质量分析精度。

    一种基于语音数据的质量评价方法

    公开(公告)号:CN113409820A

    公开(公告)日:2021-09-17

    申请号:CN202110642169.7

    申请日:2021-06-09

    IPC分类号: G10L25/60 G10L25/27

    摘要: 本发明公开了一种基于语音数据的质量评价方法,涉及语音数据质量评价技术领域,解决了现有技术中能够对测试语音进行预处理导致工作强度增加的技术问题,获取一段20秒的语音,随后获取到一段质量评价合格的语音并将其标记为标准语音,将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较,将监测语音进行帧划分,将监测语音划分为若干个语音帧,获取到语音帧的音频波长和频率,随后通过公式获取到语音帧的参数分析系数Xi,将测试语音内语音帧构建参数分析系数集合,对测试语音进行预处理,提高了测试语音的合格率,防止对不合格语音进行质量评价,导致工作强度增加,降低了语音质量评价的工作效率。

    一种自适应场景的图像识别方法
    3.
    发明公开

    公开(公告)号:CN115100496A

    公开(公告)日:2022-09-23

    申请号:CN202210806651.4

    申请日:2022-07-08

    摘要: 本发明公开了一种自适应场景的图像识别方法,涉及图像识别技术领域,解决了现有技术在图像识别过程中,考虑了场景环境对图像识别的影响,而没有考虑各图像特征之间的提取差异,导致图像识别不够高效准确的技术问题;本发明根据图像特征以及各图像特征之间的关联关系建立特征知识图谱,结合各图像特征之间的关联关系来建立若干特征识别模型,利用对应的特征识别模型对子图像中的图像特征进行分析识别,获取对应特征信息,降低了特征识别模型的训练量,能够提高特征信息的准确性;本发明引入知识图谱技术建立特征知识图谱,能够快速调用目标特征对应的特征知识图谱,且结合无监督图像识别算法能够实现对少见的目标特征的准确识别,扩宽了应用场景。

    一种区域自划分的图像识别系统及方法

    公开(公告)号:CN115100411A

    公开(公告)日:2022-09-23

    申请号:CN202210806180.7

    申请日:2022-07-08

    摘要: 本发明公开了一种区域自划分的图像识别系统及方法,涉及图像识别技术领域,解决了现有技术中的区域划分,操作费时又不准确的技术问题;本发明通过摄像装置获取目标区域的原始图像,并将原始图像发送至图像处理模块,图像处理模块原始图像进行区域划分,获取S个子区域图像;实现了对原始图像进行区域划分,提高了区域划分的准确率;根据子区域图像和图像识别模型获取子区域图像标签;并将子区域图像和子区域图像标签发送至区域划分模块;区域划分模块根据子区域图像和子区域图像标签对原始图像进行区域划分;可对每个子区域获取标签,便于用户了解子区域特征。

    一种多源语音数据的自动处理系统

    公开(公告)号:CN113448514B

    公开(公告)日:2022-03-15

    申请号:CN202110614847.9

    申请日:2021-06-02

    摘要: 本发明公开了一种多源语音数据的自动处理系统,涉及多源语音数据处理技术领域,包括质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块;质量检测模块接收到质量检测指令后对多源语音数据进行质量检测,能够有效保证采集的语音数据的清晰和准确,提高语音通信质量;存储分析模块用于采集存储区块的剩余内存并进行存储预测,生成清理信号,以及时对存储的语音数据进行清理,减轻存储区块的存储压力;云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台,同时能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储,提高数据处理效率。

    一种基于语音数据的质量评价方法

    公开(公告)号:CN113409820B

    公开(公告)日:2022-03-15

    申请号:CN202110642169.7

    申请日:2021-06-09

    IPC分类号: G10L25/60 G10L25/27

    摘要: 本发明公开了一种基于语音数据的质量评价方法,涉及语音数据质量评价技术领域,解决了现有技术中能够对测试语音进行预处理导致工作强度增加的技术问题,获取一段20秒的语音,随后获取到一段质量评价合格的语音并将其标记为标准语音,将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较,将监测语音进行帧划分,将监测语音划分为若干个语音帧,获取到语音帧的音频波长和频率,随后通过公式获取到语音帧的参数分析系数Xi,将测试语音内语音帧构建参数分析系数集合,对测试语音进行预处理,提高了测试语音的合格率,防止对不合格语音进行质量评价,导致工作强度增加,降低了语音质量评价的工作效率。

    一种基于多源语音数据的语音对齐方法

    公开(公告)号:CN113409815B

    公开(公告)日:2022-02-11

    申请号:CN202110591658.4

    申请日:2021-05-28

    IPC分类号: G10L25/48 G10L25/27

    摘要: 本发明公开了一种基于多源语音数据的语音对齐方法,属于语音处理领域,涉及语音对齐技术,用于通过语音对齐方法将起始点拉齐,实现各语音数据的对齐,避免人工对齐的方式花费大量的时间和处理效率、对齐准确率较低的问题;步骤一:通过语音采集模块对同一声源进行不同位置的语音数据采集,并将采集获取的声源的语音数据发送至语音处理模块;通过语音处理模块对多个语音采集模块发送的语音数据进行处理;并将处理完成的语音数据发送至语音分析模块;通过语音分析模块对处理完成后的语音数据进行语音对齐;并将对齐的语音数据发送至语音组合模块;通过语音组合模块将对齐后的语音数据进行语音组合。

    一种多源语音数据的自动处理系统

    公开(公告)号:CN113448514A

    公开(公告)日:2021-09-28

    申请号:CN202110614847.9

    申请日:2021-06-02

    摘要: 本发明公开了一种多源语音数据的自动处理系统,涉及多源语音数据处理技术领域,包括质量检测模块、云存储模块、大数据平台、数据库、存储模块、存储分析模块、内存管理模块以及评估模块;质量检测模块接收到质量检测指令后对多源语音数据进行质量检测,能够有效保证采集的语音数据的清晰和准确,提高语音通信质量;存储分析模块用于采集存储区块的剩余内存并进行存储预测,生成清理信号,以及时对存储的语音数据进行清理,减轻存储区块的存储压力;云存储模块用于储存经过质量检测模块检测合格的多源语音数据并将其公布至大数据平台,同时能够根据存储区块的存储情况和清理情况合理选择对应的存储区块进行数据存储,提高数据处理效率。

    一种机器翻译语料领域识别方法
    9.
    发明公开

    公开(公告)号:CN115331659A

    公开(公告)日:2022-11-11

    申请号:CN202210803861.8

    申请日:2022-07-07

    摘要: 本发明公开了一种机器翻译语料领域识别方法,涉及语音识别技术领域,包括:通过爬虫技术获取互联网语料数据,并通过特定的分类算法对语料元数据进行预处理,构建语料知识库;对采集的语音数据进行降噪增强处理,消除干扰信号,剔除误差;对降噪处理后的语音数据进行清晰度偏离检测;若清晰度偏离值QX大于偏离阈值,则判定对应语音数据无效,提示用户重新采集语音数据;通过语音识别模块对判定有效的语音数据进行语音识别;在机器翻译过程中,根据降噪处理信息对当前环境的噪声干扰情况进行评估;若语音干扰系数YR大于干扰阈值,则生成预警信号;以提醒用户更换场所后继续翻译,从而提高识别精度,提高用户体验感。

    一种基于多源语音数据的语音对齐方法

    公开(公告)号:CN113409815A

    公开(公告)日:2021-09-17

    申请号:CN202110591658.4

    申请日:2021-05-28

    IPC分类号: G10L25/48 G10L25/27

    摘要: 本发明公开了一种基于多源语音数据的语音对齐方法,属于语音处理领域,涉及语音对齐技术,用于通过语音对齐方法将起始点拉齐,实现各语音数据的对齐,避免人工对齐的方式花费大量的时间和处理效率、对齐准确率较低的问题;步骤一:通过语音采集模块对同一声源进行不同位置的语音数据采集,并将采集获取的声源的语音数据发送至语音处理模块;通过语音处理模块对多个语音采集模块发送的语音数据进行处理;并将处理完成的语音数据发送至语音分析模块;通过语音分析模块对处理完成后的语音数据进行语音对齐;并将对齐的语音数据发送至语音组合模块;通过语音组合模块将对齐后的语音数据进行语音组合。