-
公开(公告)号:CN112650399B
公开(公告)日:2023-12-01
申请号:CN202011534539.7
申请日:2020-12-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请涉及电子技术领域,尤其涉及一种表情推荐方法及装置,该方法包括:获取输入数据,该输入数据包括用户的第一语音数据和第一语音数据对应的第一图像数据,将第一图像数据和第一语音数据输入表情生成模型,得到输出结果,该输出结果包括至少一个表情,进而向所述用户推荐该至少一个表情,本申请提供的技术方案同时利用用户的语音数据和图像数据生成表情,使得生成的表情更多样且具有个性化,从而可以向用户推荐多样且具有个性化的表情。
-
公开(公告)号:CN116959430A
公开(公告)日:2023-10-27
申请号:CN202310798449.6
申请日:2023-06-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种语音识别方法、装置、电子设备及存储介质,涉及语音识别技术领域。该语音识别方法可以包括:获取目标语音的第一类特征和第二类特征;其中,所述第一类特征为表征语音内容的声学特征,所述第二类特征为表征情绪的声学特征;根据所述第一类特征和所述第二类特征,确定对所述目标语音的语音识别结果,其中,所述语音识别结果中包括添加有标点符号的文本内容。本申请提供的技术方案能够提高语音识别中标点符号标记的准确性。
-
公开(公告)号:CN116629213A
公开(公告)日:2023-08-22
申请号:CN202310445263.2
申请日:2023-04-21
Applicant: 科大讯飞股份有限公司
IPC: G06F40/166 , G06N3/0455 , G06N3/0985 , G10L15/26
Abstract: 本发明提供一种标点添加方法、服务器和客户端设备,涉及自然语言处理技术领域,该方法包括:接收客户端设备发送的待添加标点的初始文本,并提取初始文本的文本特征;基于用户行为特征、文本特征和标点预测模型确定初始文本的标点预测结果;基于标点预测结果为初始文本添加标点,得到目标文本,并将目标文本发送给客户端设备;其中,用户行为特征用于表征用户的标点添加习惯;标点预测模型是基于不同用户的带标点样本文本和带标点样本文本对应的用户行为样本特征,对初始标点预测模型进行训练得到的。本发明提供的技术方案能够实现个性化的文本标点预测,得到与用户标点使用习惯相匹配的带标点文本,个性化程度高。
-
公开(公告)号:CN115933871A
公开(公告)日:2023-04-07
申请号:CN202211437927.2
申请日:2022-11-15
Applicant: 科大讯飞股份有限公司
IPC: G06F3/01 , G06F9/4401
Abstract: 本申请提出一种智能设备的控制方法、装置、智能系统和存储介质,能够根据目标对象所处环境空间中的传感器对目标对象的探测信号,在当前的环境空间中确定目标对象所在的目标空间。其中,目标对象所处环境空间中预先分布设置有一种或多种类型的对象探测传感器。将位于目标空间内的智能设备配置为活跃状态,将未位于目标空间内的智能设备配置为休眠状态。如此设置,目标对象在离开当前空间时不需要主动与智能设备进行交互以关闭当前空间中的智能设备,而是在检测到目标对象离开当前空间后会自动控制当前空间中的智能设备进入休眠状态,智能化程度高。
-
公开(公告)号:CN114242064A
公开(公告)日:2022-03-25
申请号:CN202111674064.6
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种语音识别方法及装置、语音识别模型的训练方法及装置,该方法应用于语音识别模型,包括:获取语音数据,语音数据包括待识别词语的信息;从语音数据中依次提取每个音频帧对应的语音特征:响应于语音特征累积到预设时长,确定预设时长内的每个音频帧对应的语音状态,其中语音状态用于表示音频帧在文字中的所在位置;根据语音状态确定识别结果,识别结果包括待识别词语中的单个文字。本申请的技术方案能够以极低的延迟识别出单个文字。
-
公开(公告)号:CN110517664A
公开(公告)日:2019-11-29
申请号:CN201910852557.0
申请日:2019-09-10
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种多方言识别方法、装置、设备及可读存储介质,通过预先构建的方言识别模型进行方言的识别,其中,该方言识别模型通过包括多种方言的训练语料训练得到,而且该方言识别模型的训练过程中不仅局限于语料的语音内容,还引入了方言所属的方言种类,结合方言所属的方言种类对方言识别模型进行优化,使得方言识别模型能够准确识别多种方言,使得用户不必再进行语音识别模式的切换,简化了用户操作,提高了多方言识别的准确率和效率。
-
公开(公告)号:CN109818737A
公开(公告)日:2019-05-28
申请号:CN201811583879.1
申请日:2018-12-24
Applicant: 科大讯飞股份有限公司
Abstract: 一种个性化口令生成方法及系统,其中方法包括:接收由第一用户发送的口令;确定接收所述口令的第二用户,并获取第二用户信息;根据所述口令的信息和所述第二用户信息,生成针对第二用户的个性化口令。本发明使得口令信息与接收口令的第二用户息息相关,不再是千篇一律的统一形式,更由于附带了特定的接收方的属性信息,使口令本身相比现有的口令形式,能够发挥出成倍的优势并可以因此拓展到多个应用场景中,以满足接收方甚至发送方对于多样性、娱乐性、安全性、专属性等方面的需求,从而能够获得更佳的用户之间的交互效果,以此大大提升用户体验。
-
公开(公告)号:CN108899035A
公开(公告)日:2018-11-27
申请号:CN201810872692.7
申请日:2018-08-02
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种消息处理方法及装置,属于计算机应用技术领域。该方法包括:获取源消息及目标消息,源消息中包含指定语音口令,目标消息包含有领取语音口令;若领取语音口令使用的语言类型与指定语音口令对应的语言类型相同,且指定语音口令与领取语音口令之间满足预设条件,则将源消息的关联账户中的电子资源转移至目标消息的关联账户,指定语音口令对应的语言类型可任意设置。由于指定语音口令对应的语言类型可任意设置,除了普通话外,消息处理过程还可以使用不同国家地区的语言,从而消息处理过程可适用于不同的语言场景,消息的传播力度较强且传播范围较广。
-
公开(公告)号:CN108733650A
公开(公告)日:2018-11-02
申请号:CN201810456332.9
申请日:2018-05-14
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种个性化词获取方法及装置,属于计算机应用技术领域。该方法包括:获取识别文本及识别文本对应的用户确认文本;若识别文本与用户确认文本之间在内容上存在差异,且识别文本与用户确认文本之间满足第一预设规则,则根据识别文本与用户确认文本之间在内容上的差异,获取个性化词。由于用户在对识别文本进行确认的过程中可将自身用词习惯融入用户确认文本,并基于识别文本和用户之间的差异来获取个性化词,从而获取到的个性化词能够涵盖用户的用词习惯。
-
公开(公告)号:CN119724187A
公开(公告)日:2025-03-28
申请号:CN202411981844.9
申请日:2024-12-31
Applicant: 合肥智能语音创新发展有限公司 , 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及相关装置,涉及语音处理技术领域,包括:在确定待识别语音数据的通用解码文本序列之后,先将通用解码文本序列转换为元素粒度更低的可泛化文本序列,再利用与可泛化文本序列中各元素对应的相似元素对可泛化文本序列进行扩充,得到相应粒度的扩充文本序列;并基于预设的长尾词汇语言模型对可泛化文本序列和扩充文本序列进行重贴分操作,得到长尾解码文本序列;最后,基于通用解码文本序列以及长尾解码文本序列,确定最终的语音识别结果。由于该方案能够得到长尾解码文本序列,因此能够提升最终的语音识别结果是长尾解码文本序列的可能性,因此,能够有效提升端到端语音识别模型的长尾词汇识别效果。
-
-
-
-
-
-
-
-
-