-
公开(公告)号:CN109003600B
公开(公告)日:2021-06-08
申请号:CN201810872873.X
申请日:2018-08-02
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种消息处理方法及装置,属于计算机应用技术领域。该方法包括:获取源消息及目标消息,源消息中包含指定语音口令,目标消息包含有领取语音口令;若指定语音口令与领取语音口令之间的匹配概率大于预设阈值,则将源消息的关联账户中的电子资源转移至目标消息的关联账户,指定语音口令对应的语言类型可任意设置。由于指定语音口令对应的语言类型可任意设置,消息处理过程中使用的语言除了普通话之外,还可以使用不同国家地区的语言,从而消息处理过程可适用于不同的语言场景,消息的传播力度较强且传播范围较广。
-
公开(公告)号:CN119865752A
公开(公告)日:2025-04-22
申请号:CN202411981891.3
申请日:2024-12-31
Applicant: 科大讯飞股份有限公司
IPC: H04R25/00 , G06N3/0464 , G06N3/0455
Abstract: 本发明提供一种设备参数调整模型的训练方法、设备参数调整方法及装置,其中方法包括:获取初始模型,基于初始模型的状态表示,确定初始设备参数;将初始设备参数发送至便携式辅助设备,得到环境声学特征和用户的行为特征;将环境声学特征和行为特征输入至初始模型,得到用户的动作概率分布;基于动作概率分布,对初始模型进行训练,得到设备参数调整模型。该方法中行为特征用于反映用户个性化习惯和偏好,环境声学特征用于反映便携式辅助设备的聆听环境信息,基于环境声学特征和行为特征进行后续初始模型训练,使得训练得到的设备参数调整模型可以个性化地调整便携式辅助设备的设备参数,提高用户的聆听效果,进而提高用户的满意度和使用体验。
-
公开(公告)号:CN119851664A
公开(公告)日:2025-04-18
申请号:CN202411938662.3
申请日:2024-12-26
Applicant: 科大讯飞股份有限公司
IPC: G10L15/22 , G10L15/20 , G10L25/30 , G06F18/213 , G06F18/214 , G06F18/25
Abstract: 本申请公开了一种语音识别方法、装置、存储介质及设备,该方法包括:首先获取目标车辆的行驶数据,并从中提取出目标特征向量;其中,行驶数据包括目标车辆的自身状态信息和其所处的环境数据信息,再获取目标车辆上车载用户发出的目标语音,并对其进行初次识别,得到N个候选文本识别结果;然后将目标特征向量和N个候选文本识别结果输入语义置信度预测模型,预测得到N个候选文本识别结果各自对应的文本置信度预测结果,接着利用N个候选文本识别结果各自对应的文本置信度预测结果,对目标语音进行二次识别,以便从这N个候选文本识别结果中筛选出目标语音对应的最终识别结果,从而提高了识别准确率,也增强了车载用户的乘车体验及行车安全性。
-
公开(公告)号:CN119763570A
公开(公告)日:2025-04-04
申请号:CN202411900452.5
申请日:2024-12-23
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音唤醒识别方法及装置,所述方法包括:对唤醒语音数据进行唤醒词识别;在唤醒语音数据中存在唤醒词的情况下,确定唤醒语音数据中唤醒词所属目标语种,以及从唤醒语音数据中剪除唤醒词;基于目标语音识别模型,对剪除唤醒词后的唤醒语音数据进行语音识别,得到语音唤醒识别结果,目标语音识别模型用于识别目标语种下的语音数据。本发明提供的语音唤醒识别方法及装置,先对简短、明确且易于识别的唤醒语音数据进行唤醒词识别,确定唤醒意图的起始点,不仅可以减少计算量,也可以准确识别多个不同唤醒词,接着剪除唤醒语音数据中的唤醒词,从而可以避免唤醒词对后续识别用户唤醒意图的干扰,进一步提高语音唤醒识别精度。
-
公开(公告)号:CN115762500A
公开(公告)日:2023-03-07
申请号:CN202211421770.4
申请日:2022-11-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种语音处理方法、装置、设备及存储介质,先判断语音数据是否属于噪声,在语音数据不属于噪声的情况下,再对语音数据进行语音识别,除了得到语音识别结果外,还得到语音识别结果的置信度,判断语音识别结果是否属于目标场景对应的指令集,只有在语音识别结果属于目标场景对应的指令集,且置信度大于第一置信度阈值的情况下,才输出语音识别结果,通过多级判断,实现最大限度的噪声拒识。
-
公开(公告)号:CN115665602A
公开(公告)日:2023-01-31
申请号:CN202211248585.X
申请日:2022-10-12
Applicant: 科大讯飞股份有限公司
IPC: H04R1/08
Abstract: 本发明提供一种回声消除方法、装置、会议系统、电子设备和存储介质,其中方法包括:获取各终端的参考信号,以及各终端中任一终端的麦克信号;对各终端的参考信号和该终端的麦克信号分别进行特征提取,并基于特征提取所得的各终端的参考信号特征和该终端的麦克信号特征,确定回声信号特征;基于回声信号特征,对该终端的麦克信号进行回声消除,得到该终端的回声消除信号,克服了传统的回声消除方法无法针对于多人会议场景进行回声消除的缺陷,同时,实现了终端音频信号采集和播放的自动管理,规避了手动控制不便的问题,提升了会议过程的稳定性。
-
公开(公告)号:CN115588426A
公开(公告)日:2023-01-10
申请号:CN202211193243.2
申请日:2022-09-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别模型的训练方法、语音识别方法及相关产品。该语音识别模型的训练方法包括:根据通用语音识别模型的基础结构裁剪得到子模型;通过第一语音数据和子模型构建待训练的语音识别模型;第一语音数据包括多种领域分别对应的领域语音数据;通过第一语音数据对待训练的语音识别模型进行训练,训练结束得到用于识别多种领域的领域语音数据的目标模型。以参数量较小的子模型构建并训练同样小参数量的模型,而无需对参数量较大的通用语音识别模型进行处理,即可通过精简的过程实现模型训练,减小训练代价。由于第一语音数据包括多种领域分别对应的领域语音数据,因此,训练出的目标模型可以实现对多种领域的领域语音数据的识别。
-
公开(公告)号:CN108733650B
公开(公告)日:2022-06-07
申请号:CN201810456332.9
申请日:2018-05-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/279 , G06F40/289 , G10L15/26
Abstract: 本发明实施例提供一种个性化词获取方法及装置,属于计算机应用技术领域。该方法包括:获取识别文本及识别文本对应的用户确认文本;若识别文本与用户确认文本之间在内容上存在差异,且识别文本与用户确认文本之间满足第一预设规则,则根据识别文本与用户确认文本之间在内容上的差异,获取个性化词。由于用户在对识别文本进行确认的过程中可将自身用词习惯融入用户确认文本,并基于识别文本和用户之间的差异来获取个性化词,从而获取到的个性化词能够涵盖用户的用词习惯。
-
公开(公告)号:CN114171002A
公开(公告)日:2022-03-11
申请号:CN202111550980.9
申请日:2021-12-17
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质,其中方法包括:对待识别语音进行语种识别,得到所述待识别语音的语种特征;基于所述语种特征,对所述待识别语音的编码特征进行语音解码,得到所述待识别语音分别在语音语种和预设语种下的识别文本,所述语音语种为所述语种特征所指示的语种。本发明提供的方法、装置、电子设备和存储介质,语音语种和预设语种的语音解码并行,无需在语音语种识别文本的基础上进行翻译,有效提高了预设语种识别文本的准确性,并且缩短了语音识别的响应时长。语音语种和预设语音的语音解码共用待识别语音的编码特征,即具备统一的建模方式,使得部署更加灵活,从而能够有效降低部署维护成本。
-
公开(公告)号:CN112650399A
公开(公告)日:2021-04-13
申请号:CN202011534539.7
申请日:2020-12-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请涉及电子技术领域,尤其涉及一种表情推荐方法及装置,该方法包括:获取输入数据,该输入数据包括用户的第一语音数据和第一语音数据对应的第一图像数据,将第一图像数据和第一语音数据输入表情生成模型,得到输出结果,该输出结果包括至少一个表情,进而向所述用户推荐该至少一个表情,本申请提供的技术方案同时利用用户的语音数据和图像数据生成表情,使得生成的表情更多样且具有个性化,从而可以向用户推荐多样且具有个性化的表情。
-
-
-
-
-
-
-
-
-