-
公开(公告)号:CN116521120A
公开(公告)日:2023-08-01
申请号:CN202310291164.3
申请日:2023-03-23
Applicant: 科大讯飞股份有限公司
IPC: G06F3/16
Abstract: 本申请提供了一种音效调整方法、装置、存储介质及电子设备,涉及计算机软件领域。该音效补偿方法包括:获取目标空间内的噪声数据和音频数据;分别对噪声数据和音频数据进行频段分析,得到噪声数据对应的多个噪声频段、以及音频数据对应的多个音频频段;确定多个噪声频段各自的声压等级以及多个音频频段各自的声压等级;利用多个噪声频段各自的声压等级,确定多个音频频段各自的声压等级的补偿结果。本申请根据不同频段的噪声数据对不同频段的音频数据的影响,自适应地对各个音频频段的声压等级进行补偿,提高了用户在噪声环境下的音效体验。
-
公开(公告)号:CN116386639A
公开(公告)日:2023-07-04
申请号:CN202310091983.3
申请日:2023-01-17
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音交互方法及相关装置、设备、系统和存储介质,其中,语音交互方法包括:获取语音交互场景的拍摄图像和采集语音;基于拍摄图像进行检测,得到拍摄图像中目标对象的视线注视情况和唇部运动情况;基于唇部运动情况,从采集语音中提取目标对象的目标语音,并获取语音交互场景中交互设备的控制指令与目标语音的语义匹配情况;响应于视线注视情况包括目标对象的视线注视交互设备且存在语义匹配情况满足预设要求的控制指令,控制交互设备执行语义匹配情况满足预设要求的控制指令。上述方案,能够在语音交互之前免于语音唤醒,提升语音交互的便利性,同时提升语音交互的准确性。
-
公开(公告)号:CN116320886A
公开(公告)日:2023-06-23
申请号:CN202211567164.3
申请日:2022-12-07
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种接待过程记录方法及相关装置、服务器、系统、存储介质,其中,接待过程记录方法包括:获取接待场所中网状分布的各个麦克风分别采集的音频信号;响应于向相同网格区域定向拾音的音频信号之间的特征相似度满足第一条件,确定网格区域为存在接待活动的目标区域,并选择向目标区域定向拾音的音频信号作为目标信号;基于目标信号进行声纹匹配,确定目标信号所属的说话对象;基于属于相同说话对象的各个目标信号的采集时间进行声源定位,得到说话对象在接待场所的活动位置;基于相同说话对象在接待过程中各个时刻的活动位置和音频信号,得到说话对象的接待记录。上述方案,能够提升记录接待过程的便利性,并提升接待记录的分析价值。
-
公开(公告)号:CN116092492A
公开(公告)日:2023-05-09
申请号:CN202310085223.1
申请日:2023-01-17
Applicant: 科大讯飞股份有限公司 , 合肥智能语音创新发展有限公司
Abstract: 本发明公开了一种混合多语种导航语音指令处理方法、装置以及电子设备,预先确定用户当前所在国家或地区,将用户输入语音指令切割为地名段及非地名段,调用与所在国家或地区匹配的语音处理策略对地名段所对应的语音指令进行识别,最后结合地名段及非地名段二者的识别结果进行导航意图理解。通过对当前所在国家或地区的判定替代常规的定位,从而可以预先确定匹配当地语种的语音处理策略,并通过对输入语音的切割,可以对混合多语种的语音指令进行针对性的识别处理,从而提供更为可靠且精准的导航意图理解结果。本发明无需耗费成本构建词典,也无需对已有模型进行大量参数调整,能够更为经济、高效地处理导航场景中出现混合语种的情况。
-
公开(公告)号:CN115985320A
公开(公告)日:2023-04-18
申请号:CN202211659553.9
申请日:2022-12-22
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种智能设备控制方法、装置、电子设备及存储介质,该方法包括:获取待识别语音;待识别语音包括用于控制智能设备的语音;根据待识别语音,确定输入信息,将输入信息输入至拼音序列预测模型中,得到拼音序列预测模型输出的待识别语音的拼音序列;根据拼音序列,获取待识别语音在目标语言类型下的目标文字序列;根据目标文字序列,对智能设备进行控制;其中,拼音序列预测模型是基于样本语音和样本语音的样本标签,对多任务模型进行训练得到的;样本标签包括拼音序列标签、音调序列标签、合音标签和词汇标签。本发明实现通过语音交互实现智能设备控制,避免直接接触智能设备按钮,能够有效抑制细菌的传播,保障用户健康。
-
公开(公告)号:CN115829547A
公开(公告)日:2023-03-21
申请号:CN202211567101.8
申请日:2022-12-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及汽车技术领域,提供一种车辆维保提醒方法、装置、电子设备及存储介质,该方法考虑了驾驶用户的驾驶行为数据,能够根据驾驶用户的驾驶习惯,分析出车辆的相关零配件的使用情况,提醒驾驶用户对各个零配件及时进行保养。而且,该方法通过目标零配件的同类型零配件的剩余效力数据与损耗影响因子数据之间的映射关系,可以快速确定目标零配件的目标剩余效力数据,大大提高对零配件剩余效力的判断效率,降低判断难度,进而节约维保提醒成本。该方法通过向驾驶用户发出提示,可以实现减少因零部件效力不足而驾驶用户不自知,影响行车安全的风险的目的。
-
公开(公告)号:CN115662399A
公开(公告)日:2023-01-31
申请号:CN202211321530.7
申请日:2022-10-26
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种日语语音模型的训练方法以及交互方法、存储介质、设备,该模型的训练方法包括:获取第一训练集,利用其中多个日语语音信息训练初始语音识别模型,得到目标语音识别模型,语音识别模型用于识别日语语音信息对应的文本;获取第二训练集,利用其中多组表记信息训练初始语义识别模型,得到目标语义识别模型,表记信息包括文本音素序列和由汉字文本表记、假名文本表记中至少一者组成的表记方式,语义识别模型用于识别文本中字或词在文本中的语义含义;将目标语音识别模型与目标语义识别模型拼接,得到日语语音交互模型。由此,能够从多种表记方式的文本中正确提取语义信息,提高语义识别正确率,并使其更符合人们日常阅读和书写习惯。
-
公开(公告)号:CN115573821A
公开(公告)日:2023-01-06
申请号:CN202211379107.2
申请日:2022-11-04
Applicant: 科大讯飞股份有限公司
IPC: F02D11/10
Abstract: 本发明公开了一种油门调节方法、装置、设备、系统和存储介质,油门调节方法包括:获取车辆在至少一个历史行程过程中的油门状态数据,油门状态数据包括至少一个油门状态因子分别在各历史行程过程中的第一实际值;对油门状态数据进行分析,得到目标行程的油门调节系数;其中,目标行程为历史行程之后的行程,目标行程的油门调节系数用于对目标行程过程中的油门进行调节。通过上述方式,能够在车辆的目标行程中根据驾驶员的油门习惯对油门进行智能调节,提高了油门调节效果。
-
公开(公告)号:CN115170219A
公开(公告)日:2022-10-11
申请号:CN202210400147.4
申请日:2022-04-15
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种驾乘推荐方法及相关装置、电子设备、存储介质,其中,驾乘推荐方法包括:获取试乘/试驾过程中客户的交互数据;其中,交互数据包括客户的操控记录、客户与销售的对话语音中至少一者;基于交互数据进行分析,得到客户的车辆推荐报告。上述方案,能够从尽可能多的维度进行分析并进行驾乘推荐,故能够辅助销售精准地进行驾乘推荐。
-
公开(公告)号:CN112677977B
公开(公告)日:2022-08-05
申请号:CN202011583603.0
申请日:2020-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种行车状态识别方法、装置、电子设备和转向灯控制方法,所述行车状态识别方法包括:基于驾驶员的人脸图像,确定驾驶员的转头信息;基于行车图像,确定车辆的车道信息;基于车辆的工作参数,确定车辆的转角幅度信息;基于车辆的位置信息,确定车辆与路口的关系信息;基于所述转头信息、所述车道信息、所述转角幅度信息和所述车辆与路口的关系信息,确定行车状态,所述行车状态包括转向、直行和其他。根据本发明的行车状态识别方法,通过采集车辆自身参数信息、车辆外部环境信息和驾驶员的头部动作,实现了对各种有效信息的综合利用,可以准确识别驾驶员的驾驶意图,确定行车状态,有效弥补了驾驶员对车辆控制的不足。
-
-
-
-
-
-
-
-
-