-
公开(公告)号:CN117409770A
公开(公告)日:2024-01-16
申请号:CN202310934276.6
申请日:2023-07-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请涉及语音识别技术领域,提供一种命令词识别方法、装置、设备及存储介质。所述方法包括获取待识别的语音信息,并提取所述语音信息的音频特征;对所述音频特征进行压缩处理,并将压缩后的音频特征输入到经过预训练的命令词识别模型中,对所述语音信息中的命令词进行识别。本申请实施例提供的命令词识别方法,通过对音频特征进行压缩,可以剔除音频特征中的静音片段等无效信息,将压缩后的音频特征输入到经过预训练的命令词识别模型,对语音信息中的命令词进行识别时,可以避免或减少数据填充,从而减少计算资源的浪费。
-
公开(公告)号:CN113838468A
公开(公告)日:2021-12-24
申请号:CN202111119338.5
申请日:2021-09-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明公开了一种流式语音识别方法,终端设备及计算机可读存储介质。所述方法包括:获取词嵌入特征序列以及音频流对应音频特征序列;通过音频编码器对所述音频特征序列进行编码,得到音频上下文序列,以及根据标签编码器对所述词嵌入序列进行编码,得到文本上下文序列,其中,所述音频编码器和所述标签编码器为基于相对位置编码的自注意力编码器;将所述音频上下文序列和所述文本上下文序列输入联合解码器,得到标签的概率分布结果,并根据所述概率分布结果确定识别结果。本发明旨在达成减少语音识别的计算量的效果。
-
公开(公告)号:CN111806100B
公开(公告)日:2021-07-27
申请号:CN202010731277.7
申请日:2020-07-27
Applicant: 中移(杭州)信息技术有限公司 , 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明属于集中发卡技术领域,公开了一种集中发卡系统和方法。本发明,通过将发卡机、打印装置、卡片滑道、预包装装置组合得到一个集中发卡系统,在实现集中发卡流程时基于该集中发卡系统实现了从写卡到包装发卡的一体化操作,从而大大提高了发卡效率,同时由于整个流程无需人为操作,也大大降低了人工作业量,减少了人力成本的投入;此外,由于卡片对应的信息是打印在打印纸而并非卡片上,因而不会受卡片大小的影响,并且由于预包装袋的尺寸可以灵活调整,因而打印在预包装袋上的卡片信息还可以包括订单信息、物流信息等,方便人工识别,直接进行物流分发。
-
公开(公告)号:CN115866012A
公开(公告)日:2023-03-28
申请号:CN202111124054.5
申请日:2021-09-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04L67/141 , H04L67/143 , H04L9/32
Abstract: 本申请公开了一种机顶盒控制方法及装置、电子设备及存储介质。所述机顶盒控制方法可包括:获取所述终端设备与服务平台之间建立传输控制协议TCP长连接的令牌;在确定有待上报的语音流时,基于所述令牌与所述服务平台之间建立所述TCP长连接;基于建立的所述TCP长连接向所述服务平台上报所述语音流;其中,所述语音流,至少用于触发所述服务平台生成控制指令,所述控制指令用于控制所述机顶盒的工作;在所述语音流上报完毕后,断开所述TCP长连接。如此,仅在有语音流上报时才建立TCP长连接且在完成语音流上报之后及时断开TCP长连接,减少了TCP长连接长时间维护导致的开销。
-
公开(公告)号:CN111806100A
公开(公告)日:2020-10-23
申请号:CN202010731277.7
申请日:2020-07-27
Applicant: 中移(杭州)信息技术有限公司 , 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明属于集中发卡技术领域,公开了一种集中发卡系统和方法。本发明,通过将发卡机、打印装置、卡片滑道、预包装装置组合得到一个集中发卡系统,在实现集中发卡流程时基于该集中发卡系统实现了从写卡到包装发卡的一体化操作,从而大大提高了发卡效率,同时由于整个流程无需人为操作,也大大降低了人工作业量,减少了人力成本的投入;此外,由于卡片对应的信息是打印在打印纸而并非卡片上,因而不会受卡片大小的影响,并且由于预包装袋的尺寸可以灵活调整,因而打印在预包装袋上的卡片信息还可以包括订单信息、物流信息等,方便人工识别,直接进行物流分发。
-
公开(公告)号:CN118797550A
公开(公告)日:2024-10-18
申请号:CN202410484339.7
申请日:2024-04-22
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司 , 科大讯飞股份有限公司
Abstract: 本申请提供了一种多模态个性化遥控方法、装置、电子设备和存储介质,涉及人工智能技术领域,其中方法包括:接收用户的语音指令,并采集所述用户的图像信息;基于所述语音指令,确定所述用户的声音信息和指令信息;将所述图像信息和所述声音信息输入多模态特征识别模型,得到所述多模态特征识别模型输出的所述用户的个性化识别特征;基于所述用户的个性化识别特征和指令信息,确定所述用户对应的多模态操作界面和/或个性化推荐内容。本申请提供的方法和装置,使得人机交互方式和推荐内容能够更好地满足用户的个性化需求,提高了用户对于智能显示产品的个性化使用体验。
-
公开(公告)号:CN116962820A
公开(公告)日:2023-10-27
申请号:CN202211204283.2
申请日:2022-09-29
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N21/442 , H04N21/466
Abstract: 本申请提供了点播方法及信息处理方法、装置、设备、存储介质;其中,所述方法包括:确定点播实体对应的用户标识;根据所述用户标识,获得所述点播实体对应的音频内容形式的权重参数;其中,所述权重参数至少是根据至少两个终端中与所述用户标识关联的音频播放日志确定的;至少根据所述音频内容形式的权重参数和所述点播实体,确定目标内容形式;根据所述目标内容形式,确定待播放的目标内容;如此,使得确定的目标内容更加符合用户喜好,从而提升了用户体验。
-
公开(公告)号:CN116170646A
公开(公告)日:2023-05-26
申请号:CN202111412433.4
申请日:2021-11-25
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N21/472 , H04N21/458 , H04N21/432 , H04N21/2387 , H04N21/2187 , H04N21/23 , H04N21/258 , G10L15/22 , G10L15/26
Abstract: 本申请实施例公开了一种机顶盒的控制方法和系统,及存储介质,机顶盒的控制方法应用于控制系统,控制系统包括业务平台、机顶盒、第三方应用平台以及终端设备;机顶盒通过第一接口与业务平台进行通信;机顶盒通过第二接口与第三方应用平台进行通信;机顶盒通过第三接口与终端设备进行通信;机顶盒从第三方应用平台获取第三方应用;在运行第三方应用时,机顶盒检测语音信息,并将语音信息发送至业务平台;业务平台根据第三方应用对应的当前界面的显示内容和语音信息生成控制指令,并将控制指令发送至机顶盒;若机顶盒基于控制指令与牌照方适配成功,则机顶盒调用终端设备实现语音信息对应的业务功能。能够提升机顶盒的智能性和功能可扩展性。
-
公开(公告)号:CN112037771A
公开(公告)日:2020-12-04
申请号:CN202010886561.1
申请日:2020-08-28
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G10L15/06 , G10L15/02 , G10L21/003 , G10L21/0208
Abstract: 本发明实施例涉及语音识别领域,公开了一种音量调节的方法、装置、电子设备和存储介质。上述音量调节的方法包括:获取用于训练语音识别模型的训练集中的各音频样本;其中,所述语音识别模型用于语音识别;确定所述训练集中的各音频样本的音量值;根据所述各音频样本的音量值,确定所述训练集的音量基准值;根据所述音量基准值,对所述各音频样本的音量值进行调节;其中,调节后的所述各音频样本的音量值与所述音量基准值的差值在预设的差值范围内。本发明实施例提供的音量调节的方法可以基于整个训练集对每条音频数据进行音量调节,合适地调整训练集中音频样本的音量值,从而提升语音识别模型的识别效果。
-
公开(公告)号:CN119094827A
公开(公告)日:2024-12-06
申请号:CN202411213436.9
申请日:2024-08-30
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N21/422 , H04N21/462
Abstract: 本发明提供一种控制信源选择的方法、装置、设备、存储介质和程序产品,涉及遥控技术领域。其中方法包括:在检测到第一按键的一次按键操作或接收到语音指令之后,发送控制指令,以使电视机按照信源选择的步骤依次显示画面,并最终显示与第一信源相关联的内容;其中,控制指令与配置信息相关联;配置信息是所述遥控器从外部获取的。本发明只需一次按键操作或语音操作就可以发送将电视的信源切换至第一信源的控制指令,无需用户进行多次操作,从而提高信源切换的操作便捷性;同时,控制指令与配置信息相关联,且配置信息是遥控器从外部获取的,从而无需用户学习信源切换路径,进而降低信源切换的操作难度,最终提高用户的使用体验感。
-
-
-
-
-
-
-
-
-