-
公开(公告)号:CN103456295B
公开(公告)日:2016-05-18
申请号:CN201310336896.6
申请日:2013-08-05
Applicant: 科大讯飞股份有限公司
IPC: G10L13/02
Abstract: 本发明涉及语音合成处理技术领域,公开了一种歌唱合成中基频参数生成方法及系统,所述方法包括:接收待合成简谱信息,所述简谱信息包括:歌词标注、音高标注、时长标注和节奏信息;根据所述音高标注确定各基本合成单元的理论基频参数;根据所述歌词标注确定各基本合成单元的基频参考模型;根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化。利用本发明,不仅可以保证基频参数的稳定性,而且还可以保证基频参数符合发音人的发声特点及基频范围,有效地改善了合成语音的听感。
-
公开(公告)号:CN112687291B
公开(公告)日:2023-12-01
申请号:CN202011519662.1
申请日:2020-12-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种发音缺陷识别模型训练方法以及发音缺陷识别方法,该发音缺陷识别模型训练方法包括:在获取到语音样本和该语音样本的缺陷标签之后,先根据该语音样本,生成该语音样本的语音特征,以使该语音特征包括声学特征、音素特征和发音属性特征;再根据该语音样本的语音特征和该语音样本的缺陷标签,训练发音缺陷识别模型。其中,因语音特征包括声学特征、音素特征和发音属性特征,使得该语音特征能够准确全面地表征出该语音样本携带的发音信息,从而使得基于该语音特征以及该缺陷标签训练好的发音缺陷识别模型具有较好的发音缺陷识别性能,如此使得后续能够利用训练好的发音缺陷识别模型准确地识别出发音缺陷。
-
-
公开(公告)号:CN109409329B
公开(公告)日:2022-04-22
申请号:CN201811352610.2
申请日:2018-11-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种图形题目的判别方法、评估方法、装置、设备及存储介质,图形题目的判别方法包括:获取目标对象针对指定图形题目绘制图形的轨迹点数据;对轨迹点数据进行预处理,预处理后的数据作为目标轨迹点数据;基于目标轨迹点数据,判别目标对象针对指定图形题目绘制的图形是否正确。本申请可基于目标对象针对指定图形题目绘制图形的轨迹点数据自动判别出目标对象针对指定图形题目绘制的图形是否正确,并可基于判别结果自动确定认知评估结果,由于判别和评估不需要人工参与,因此避免了主观因素对判别结果和评估结果的影响,同时,节省了人力,降低了人工成本,并且,提高了图形题目的判别效率和认知评估效率,用户体验较好。
-
公开(公告)号:CN112086108A
公开(公告)日:2020-12-15
申请号:CN202010774495.9
申请日:2020-08-04
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种认知障碍预测方法及电子设备、存储装置,其中,认知障碍预测方法包括:获取测试对象回答预设问题的语音数据;利用初始识别模型识别语音数据,得到初始文本;利用语音数据和初始文本进行初始预测,得到测试对象是否存在认知障碍的初始预测结果;基于初始预测结果,选择第一识别模型、第二识别模型中至少一者识别语音数据,得到最终文本;利用语音数据和最终文本进行最终预测,得到测试对象是否存在认知障碍的最终预测结果。上述方案,能够提高认知障碍预测的精度。
-
公开(公告)号:CN110495854A
公开(公告)日:2019-11-26
申请号:CN201910694886.7
申请日:2019-07-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种特征提取方法、装置、电子设备及存储介质,所述方法包括:采集被测试者在注视目标图像时的语音数据和眼动数据;根据所述语音数据和眼动数据确定预设特征,所述预设特征用于反映所述被测试者针对所述目标图像的认知能力。能够通过被测试者的语音数据和眼动数据确定基于视觉和语音的特征数据,拓展了特征数据形式的种类,提高了看图说话测试的准确性。
-
公开(公告)号:CN103915093B
公开(公告)日:2019-07-30
申请号:CN201210591777.0
申请日:2012-12-31
Applicant: 科大讯飞股份有限公司
CPC classification number: G10L21/013 , G10H2250/455 , G10L2021/0135
Abstract: 本发明实施例公开了一种实现语音歌唱化的方法和装置,所述方法包括:接收用户输入的语音信号;将所述语音信号切分获得各基本考察单元的语音片断;根据预置的简谱,确定简谱中的各音符与所述各基本考察单元的对应关系;根据简谱中各音符的音高,和所述对应关系,分别确定其所对应的基本考察单元的目标基频值;根据简谱中各音符的节拍数,和所述对应关系,分别确定其所对应的基本考察单元的目标时长;根据所述目标基频值和目标时长调整各基本考察单元的语音片断,使得调整后的语音片段的基频为所述目标基频值,调整后的语音片段的时长为所述目标时长。该方法避免了多次信号转换的损失,实现了对任意长度及任意内容的语音向任意歌曲的唱歌语音转换。
-
公开(公告)号:CN109493968A
公开(公告)日:2019-03-19
申请号:CN201811427058.9
申请日:2018-11-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种认知评估方法及装置,该方法包括:在记录了待检测者在目标时间段内的声音数据后,可以从这些声音数据中提取出待检测者在声学方面和/或语言学方面的特征数据,作为待检测者对应的第一特征数据,然后,可以根据待检测者对应的第一特征数据,评估待检测者的认知状况。可见,本申请是根据从待检测者的声音数据中提取出的声学方面和/或语言学方面的特征数据,来对待检测者的认知状况进行评估,无需通过现有的认知评估量表进行评估,也不需要用医学影像和验血的方法排除其他疾病的影响,从而能够更方便、快捷、低成本的对待检测者的认知状况进行评估。
-
公开(公告)号:CN102779508B
公开(公告)日:2016-11-09
申请号:CN201210091240.8
申请日:2012-03-31
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音库生成设备及其方法,所述语音库生成设备包括:语音提取装置,用于从收集的数据中提取预定发音人的语音数据;语音识别装置,用于将所述预定发音人的语音数据识别为文本;文本标注装置,用于对所述文本进行标注。以及本发明提供一种语音合成系统及其方法。由于本发明通过自动收集数据并自动处理,生成语音库,节约了大量的人力成本。此外,缩短语音合成系统的构建周期以及方便对其进行更新,并实现个性化定制。
-
公开(公告)号:CN103559876B
公开(公告)日:2016-04-20
申请号:CN201310554007.3
申请日:2013-11-07
Applicant: 科大讯飞股份有限公司
IPC: G10H1/36 , G10L21/003
Abstract: 本发明公开了一种音效处理方法及系统,该方法包括:采集用户输入的原始声音信号;确定音效优化目标;确定所述音效优化目标所属的音效类型;根据所述音效类型对所述原始声音信号进行优化处理,得到优化声音信号;对所述优化声音信号进行信号规整,得到规整后声音信号。根据本发明,能够针对不同的环境音效需求调整不同的音效处理方案,结合规整处理和混音处理,能够得到美化的歌曲,实现卡拉OK的娱乐功能,从而能够满足用户实际需求,提供给用户最佳的听觉效果。
-
-
-
-
-
-
-
-
-