-
公开(公告)号:CN119397342A
公开(公告)日:2025-02-07
申请号:CN202411202546.5
申请日:2024-08-29
Applicant: 科大讯飞股份有限公司
IPC: G06F18/241 , G06F18/2433 , G06N3/0464
Abstract: 本申请公开了一种故障预测方法及相关装置、设备和存储介质,其中,故障预测方法包括:获取待测设备在运行过程中关于若干种模态的采集数据;基于若干种模态采集数据各自的跳变检测结果,调整若干种模态各自的注意力参数;基于若干种模态各自的注意力参数,得到待测设备的目标数据特征;基于目标数据特征进行预测,得到待测设备的故障预测结果;其中,故障预测结果至少包括待测设备分别存在若干种预设故障类型的可能性。上述方案,能够提高设备故障预测的实时性和精确性。
-
公开(公告)号:CN117116292A
公开(公告)日:2023-11-24
申请号:CN202311058371.0
申请日:2023-08-21
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种音频检测方法、装置、电子设备及存储介质。音频检测方法包括:提取待检测音频数据的第一声学特征数据;基于第一声学特征数据,检测待检测音频数据的篡改类别;在篡改类别为目标篡改类别的情况下,利用与目标篡改类别对应的篡改定位方式检测待检测音频数据的篡改位置。本发明适用于检测不同篡改类别的音频数据,提高音频检测的效果。
-
公开(公告)号:CN115881110A
公开(公告)日:2023-03-31
申请号:CN202211304682.6
申请日:2022-10-24
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音唤醒方法、装置、电子设备及存储介质,语音唤醒方法包括:获取第一语音数据;对所述第一语音数据进行语音识别,得到所述第一语音数据所表示的第一唤醒词;按照所述第一唤醒词进行第一唤醒操作;以及在所述第一唤醒操作后的预设时间内对所述第一唤醒词进行预设惩罚操作,所述预设惩罚操作用于降低将所述预设时间内获取的第二语音数据识别为所述第一唤醒词的概率。上述方案,能够有效降低多唤醒词之间的串扰。
-
公开(公告)号:CN115718433A
公开(公告)日:2023-02-28
申请号:CN202211437928.7
申请日:2022-11-15
Applicant: 科大讯飞股份有限公司
IPC: G05B15/02 , G05B19/418
Abstract: 本申请提出一种智能设备的控制方法、装置、智能系统和存储介质,能够根据目标用户的状态信息,分析目标用户对智能设备的潜在控制行为,目标用户的状态信息包括目标用户的行为动作信息和/或生理参数信息,从活跃智能设备中确定出与潜在控制行为对应的目标智能设备,其中,活跃智能设备包括能够被目标用户控制的智能设备,以便于根据潜在控制行为,对目标智能设备进行控制,进而实现了根据用户的状态信息主动对智能设备进行控制,不需要用户主动提出的需求,不仅使用方便,还能够提升用户体验。
-
公开(公告)号:CN115660629A
公开(公告)日:2023-01-31
申请号:CN202211310689.9
申请日:2022-10-25
Applicant: 科大讯飞股份有限公司
IPC: G06Q10/1093
Abstract: 本申请提供了一种信息生成方法、装置、设备及存储介质,具体实现方案为:获取待办事项信息;根据所述待办事项信息确定对应的关联信息;利用所述关联信息和所述待办事项信息生成目标待办事项信息,根据本申请的技术方案,能够实现智能化的生成待办事项。
-
公开(公告)号:CN114495940A
公开(公告)日:2022-05-13
申请号:CN202111630256.7
申请日:2021-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种训练样本的获取方法和装置、计算机设备、存储介质,解决了现有技术中训练样本的获取过程人工成本高和周期长的问题。其中,获取方法包括:基于n元语法模型确定用户确认文本中的第一文本句子,n元语法模型是基于预设文本训练得到的,n元语法模型包括多个n元数据单元,第一文本句子包括至少一个n元数据单元;基于第一文本句子确定目标文本句子;对目标文本句子对应的语音片段进行语音识别,得到识别文本;当识别文本和目标文本句子的匹配度满足第一预设条件时,确定标注有识别文本的语音片段为训练样本。
-
公开(公告)号:CN109003600A
公开(公告)日:2018-12-14
申请号:CN201810872873.X
申请日:2018-08-02
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种消息处理方法及装置,属于计算机应用技术领域。该方法包括:获取源消息及目标消息,源消息中包含指定语音口令,目标消息包含有领取语音口令;若指定语音口令与领取语音口令之间的匹配概率大于预设阈值,则将源消息的关联账户中的电子资源转移至目标消息的关联账户,指定语音口令对应的语言类型可任意设置。由于指定语音口令对应的语言类型可任意设置,消息处理过程中使用的语言除了普通话之外,还可以使用不同国家地区的语言,从而消息处理过程可适用于不同的语言场景,消息的传播力度较强且传播范围较广。
-
公开(公告)号:CN120015036A
公开(公告)日:2025-05-16
申请号:CN202510312047.X
申请日:2025-03-17
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音意图识别方法及相关装置,涉及语音处理技术领域,本方案中,利用多通道语音识别模型可以提升多通道语音信号的识别效果。另外,一方面基于预设高频交互文本库对各个通道的语音识别文本进行意图识别能保证高频意图被快速识别出来,另一方面基于训练后的意图识别模型对各个通道的语音识别文本进行意图识别又能保证非高频意图的识别效率和准确率。因此,本方案能够准确地、快速地实现对多通道语音信号的意图识别。
-
公开(公告)号:CN119832896A
公开(公告)日:2025-04-15
申请号:CN202411938659.1
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
IPC: G10L15/02 , G10L15/06 , G10L25/30 , G10L25/03 , G06F18/213 , G06F18/214 , G06F18/25
Abstract: 本申请公开了一种语音识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标语音并提取其目标声学特征;然后将该目标声学特征输入至预先构建的语音识别模型,识别得到目标语音的语音热词识别结果;其中,语音识别模型包括音频编码器、热词编码器和解码器;解码器包括热词混合专家适配器和注意力机制网络。由于本申请是先基于适配器,利用样本语音数据及其对应的文本标注结果和样本热词文本,对端到端语音识别大模型进行训练生成了语音识别模型,不仅提高了模型训练效率并降低了训练成本,而且也有效提高了模型的识别准确度,这样,利用该语音识别模型对目标语音进行语音热词识别时,可以有效提高识别结果的效率和准确率。
-
公开(公告)号:CN119107978A
公开(公告)日:2024-12-10
申请号:CN202411361900.9
申请日:2024-09-27
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种发动机故障诊断方法、装置、电子设备和存储介质,其中方法包括:获取待诊断车辆上发动机的音频数据,以及驾驶员的语音数据;对语音数据对应的转写文本进行信息抽取,得到关键词和语义信息;以关键词和语义信息为参考,指导音频数据进行特征提取,使得特征提取过程更关注与故障有关的音频片段,减少无关的信息,得到准确有效的音频特征;基于音频特征进行故障诊断,得到发动机的故障诊断结果,实现了全面、准确的发动机故障诊断,提升了诊断效率,拓宽了诊断范围,降低了对专业设备和人员的依赖,使得车辆能更方便地进行自我诊断,从而降低诊断成本,提高行车安全。
-
-
-
-
-
-
-
-
-