一种语音交互方法、装置、终端及服务器

    公开(公告)号:CN109741753B

    公开(公告)日:2020-07-28

    申请号:CN201910026638.5

    申请日:2019-01-11

    Abstract: 本发明提供一种语音交互方法、装置、终端及服务器,该语音交互方法包括:进行串行的多轮端点检测;针对每轮端点检测得到的每个音频数据,向服务器发送识别会话请求信息,由所述服务器对所述多轮端点检测得到的多个音频数据进行识别;接收所述服务器发送的识别结果以及与所述识别结果对应的目标播报内容。本发明的实施例,可以实现持续的多次语音识别过程,从而减少环境音和/或说话人停顿间隔等对识别准确性的影响,不仅支持犹豫发问,还提高识别准确率,增强终端的响应自然度。

    用于识别语音的方法和装置

    公开(公告)号:CN107731229A

    公开(公告)日:2018-02-23

    申请号:CN201710909504.9

    申请日:2017-09-29

    Inventor: 杜念冬 谢延

    CPC classification number: G10L15/30 G10L15/22 G10L15/26 G10L2015/227

    Abstract: 本申请实施例公开了用于识别语音的方法和装置。该方法的一具体实施方式包括:接收用户通过终端发送的语音信息,同时获取所述用户的用户标识;对所述语音信息进行识别,得到第一识别文本;根据所述用户的用户标识确定与所述用户的用户标识关联存储的词语信息集合;根据确定的词语信息集合中的词语信息对所述第一识别文本进行处理,得到第二识别文本,并将所述第二识别文本发送到所述终端。该实施方式提高了语音识别的准确性,满足了用户的个性化需求。

    用于搜索信息的方法和装置

    公开(公告)号:CN107644095A

    公开(公告)日:2018-01-30

    申请号:CN201710899016.4

    申请日:2017-09-28

    Abstract: 本申请实施例公开了用于搜索信息的方法和装置。该方法的一具体实施方式包括:响应于确定终端停止发送语音搜索信息,将从所述终端接收到的最终语音搜索信息进行语音识别,得到最终语音识别结果;根据所述最终语音识别结果从缓存中预先存储的待展示信息中选取最终待展示信息,其中,所述缓存中存储有至少一条基于中间语音识别结果获取的待展示信息,其中,所述中间语音识别结果是对所述终端发送的语音搜索信息进行实时语音识别得到的;将所述最终待展示信息发送到所述终端,以供所述终端进行展示。该实施方式通过从缓存中直接选取最终待展示信息,从而节省了根据最终语音识别结果获取待展示信息的时间,提高了语音搜索的速度。

    用于搜索信息的方法和装置

    公开(公告)号:CN107622766A

    公开(公告)日:2018-01-23

    申请号:CN201710900370.4

    申请日:2017-09-28

    Abstract: 本申请实施例公开了用于搜索信息的方法和装置。该方法的一具体实施方式包括:响应于确定终端停止发送语音搜索信息,将从所述终端接收到的最终语音搜索信息进行语音识别,得到最终语音识别结果;将所述最终语音识别结果与基于中间语音识别结果得到的至少一条中间搜索用信息进行匹配;响应于所述最终识别结果与所述至少一条中间搜索用信息中的中间搜索用信息匹配成功,将匹配成功的中间搜索用信息对应的搜索结果信息的指示符作为目标指示符发送到所述终端,以供所述终端根据所述目标指示符获取搜索结果信息进行展示。该实施方式节省了根据最终语音识别结果获取搜索结果信息的时间,提高了语音搜索的速度。

    基于声纹特征的会议记录方法、装置及计算机设备

    公开(公告)号:CN107564531A

    公开(公告)日:2018-01-09

    申请号:CN201710743944.1

    申请日:2017-08-25

    Inventor: 杜念冬 谢延

    Abstract: 本发明提出一种基于声纹特征的会议记录方法、装置及计算机设备,其中,该方法包括:确定当前获取的语音数据对应的第一声纹特征;判断所述第一声纹特征与已确定的第二声纹特征是否匹配;若不匹配,则确定与所述第一声纹特征对应的第一标识;以所述第一标识对所述语音数据进行标注记录。由此,实现了根据声纹特征自动将语音数据进行区分,并生成会议记录,节省了时间和成本,提高了会议记录的准确性和可靠性,改善了用户体验。

    智能设备控制方法、装置及计算机设备

    公开(公告)号:CN107564518A

    公开(公告)日:2018-01-09

    申请号:CN201710718772.2

    申请日:2017-08-21

    Abstract: 本发明提出一种智能设备控制方法、装置及计算机设备,其中,该方法包括:对智能设备获取的语音信号进行语音识别,判断所述语音信号对应的控制指令是否与所述智能设备当前的工作场景匹配;若匹配,则根据所述控制指令对所述智能设备的工作状态进行调整。由此,无需唤醒词即可实现根据与当前工作场景匹配的控制指令对智能设备的控制,控制方式简单,提高了控制的灵活性,改善了用户体验。

    一种语音唤醒方法、装置、终端和存储介质

    公开(公告)号:CN107134279A

    公开(公告)日:2017-09-05

    申请号:CN201710525422.4

    申请日:2017-06-30

    Abstract: 本发明公开了一种语音唤醒方法、装置、终端和存储介质,属于语音识别技术领域。该方法包括:获取用于唤醒智能终端的唤醒语音;利用所述智能终端的预设声学模型和预设唤醒词识别网络,对所述唤醒语音的声学特征进行分析,获得所述唤醒语音相对预设唤醒词的声学特征的置信度;若所述置信度位于预设的中等置信度范围内,则将所述唤醒语音上传到远程服务器;若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征,与所述预设唤醒词的语言特征匹配一致,则接收所述远程服务器生成的智能终端唤醒指令。本发明实施例提供的一种语音唤醒方法、装置、终端和存储介质,实现了用户对唤醒词的自定义。

    基于人工智能的语音识别服务的网络接入方法以及装置

    公开(公告)号:CN106998359A

    公开(公告)日:2017-08-01

    申请号:CN201710186533.7

    申请日:2017-03-24

    Inventor: 杜念冬 谢延

    CPC classification number: H04L67/2842 G10L15/30 H04L63/0876

    Abstract: 本发明公开了一种基于人工智能的语音识别服务的网络接入方法以及装置。其中方法包括:在接收到语音识别请求时,判断IP缓存模块中是否有可用的IP地址信息,其中,IP缓存模块用于缓存上一次成功完成语音识别时所使用的IP地址信息;如果IP缓存模块中有可用的IP地址信息,则对可用的IP地址信息进行身份验证;在可用的IP地址信息通过身份验证时,通过可用的IP地址信息接入至对应的语音识别服务,其中,对应的语音识别服务对语音识别请求中的语音进行识别。由此,通过从IP缓存模块中获取可用的IP地址信息,保障了语音识别服务能够快速地进行网络接入,从而保证了语音识别服务的可用性,提高了语音识别服务的成功率。

    智能设备唤醒方法、装置、服务器及智能设备

    公开(公告)号:CN107704275B

    公开(公告)日:2021-07-23

    申请号:CN201710786739.3

    申请日:2017-09-04

    Abstract: 本发明提出一种智能设备唤醒方法、装置、服务器及智能设备,其中,该方法包括:获取智能设备发送的语音信号;对所述语音信号进行识别,确定所述语音信号对应的识别结果;在确定所述识别结果中与所述智能设备对应的任一唤醒词模型的匹配度大于阈值时,向所述智能设备下发唤醒指令。由此,通过利用服务器对语音信号进行识别及对智能设备进行唤醒控制,降低了唤醒过程中硬件性能的消耗,且使得用户可以利用自定义的唤醒词唤醒智能设备,丰富了唤醒词,提高了唤醒的灵活性,可以更好的满足用户的个性化需求,改善用户体验。

    用于识别语音的方法和装置

    公开(公告)号:CN107731229B

    公开(公告)日:2021-06-08

    申请号:CN201710909504.9

    申请日:2017-09-29

    Inventor: 杜念冬 谢延

    Abstract: 本申请实施例公开了用于识别语音的方法和装置。该方法的一具体实施方式包括:接收用户通过终端发送的语音信息,同时获取所述用户的用户标识;对所述语音信息进行识别,得到第一识别文本;根据所述用户的用户标识确定与所述用户的用户标识关联存储的词语信息集合;根据确定的词语信息集合中的词语信息对所述第一识别文本进行处理,得到第二识别文本,并将所述第二识别文本发送到所述终端。该实施方式提高了语音识别的准确性,满足了用户的个性化需求。

Patent Agency Ranking