Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"王莎莎" Page 1

1.

发明授权
语音识别控制方法、装置、电子设备和可读存储介质有权转让

公开(公告)号：CN112530419B

公开(公告)日：2024-05-24

申请号：CN201910888231.3

申请日：2019-09-19

Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司

Inventor： 罗咏曦 , 王莎莎

IPC: G10L15/22

Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质，涉及人工智能和语音识别领域。具体实现方案为：在第一工作状态下，探测具有设定控制意图的目标操作；其中，第一工作状态下，根据唤醒词采集音频片段，以进行语音识别；若探测到目标操作，执行目标操作对应的控制指令，并将第一工作状态切换为第二工作状态；在第二工作状态下，连续采集音频得到音频流，以进行语音识别。该方案中，用户只需触发具有设定控制意图的目标操作，即可实现与电子设备进行连续交互，而无需连续输入唤醒词，可以简化用户操作，改善用户的使用体验。

2.

发明授权
语音交互设备的状态呈现方法、装置、设备及存储介质有权转让

公开(公告)号：CN109657091B

公开(公告)日：2021-06-22

申请号：CN201910002528.5

申请日：2019-01-02

Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司

Inventor： 王莎莎 , 张刚 , 刁雅文 , 王天雨 , 陈虹宇 , 杨宇宁 , 温宗亮 , 鞠强

IPC: G06F16/583 , G06F16/51 , G06F16/683 , G06F16/635 , G06F16/638 , G06F16/78 , G06F16/738 , G10L15/22 , G10L15/26

Abstract: 本发明实施例提出一种语音交互设备的状态呈现方法和装置，其中方法包括：获取语音交互设备的当前状态；根据所述当前状态查找预先存储的状态与呈现方式的对应关系，得到所述当前状态对应的当前呈现方式；采用所述当前呈现方式进行呈现。本发明实施例能够为用户呈现语音交互设备所处的状态，从而为用户提供必要的推荐及提示，提高用户体验。

3.

发明公开
语音识别控制方法、装置、电子设备和可读存储介质有权转让

公开(公告)号：CN112669831A

公开(公告)日：2021-04-16

申请号：CN201910933124.8

申请日：2019-09-29

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 罗咏曦 , 王莎莎

IPC: G10L15/22 , G10L15/28

Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质，涉及人工智能和语音识别领域。具体实现方案为：探测到调用目标场景相关的应用程序接口，则查询第一工作状态的配置信息，以确定目标场景是否适用第一工作状态；若目标场景适用第一工作状态，将执行的第二工作状态切换为第一工作状态；其中，在第二工作状态下，根据唤醒词采集音频片段，对音频片段语音识别；在第一工作状态下，连续采集音频得到音频流，以对音频流语音识别。该方案中，用户可以根据自身需求，设置触发第一工作状态的场景，以满足不同用户的个性化需求，且只有在目标场景适用第一工作状态时，才控制设备进入第一工作状态，可以降低对用户的打扰，改善用户的使用体验。

4.

发明公开
语音控制方法、装置、电子设备和可读存储介质有权转让

公开(公告)号：CN112581946A

公开(公告)日：2021-03-30

申请号：CN201910933815.8

申请日：2019-09-29

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 罗咏曦 , 王莎莎

IPC: G10L15/22

Abstract: 本申请公开了语音控制方法、装置、电子设备和可读存储介质，涉及语音识别领域。具体实现方案为：根据展示页面可响应的语音指令，确定第一引导词，获取展示页面所属前台程序可响应的语音指令，根据前台程序可响应的语音指令，以及根据后台程序可响应的语音指令，确定第二引导词，在目标工作状态下，提示第一引导词和第二引导词；其中，目标工作状态，用于连续采集音频得到音频流，并获取音频流语音识别得到的信息流，以根据信息流进行语音控制。由此，通过在目标状态下提示第一引导词和第二引导词，用户根据第一引导词和第二引导词与电子设备进行语音交互时，无需重复输入唤醒词，可以简化用户操作，改善用户的使用体验。

5.

发明公开
语音控制方法、装置、电子设备和可读存储介质无效转让

公开(公告)号：CN112581945A

公开(公告)日：2021-03-30

申请号：CN201910933788.4

申请日：2019-09-29

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 罗咏曦 , 王莎莎

IPC: G10L15/22 , G10L15/26

Abstract: 本申请公开了语音控制方法、装置、电子设备和可读存储介质，涉及语音识别领域。具体实现方案为：在目标场景下，执行第一工作状态，以根据唤醒词采集音频片段，获取对音频片段语音识别得到的第一控制意图，执行与第一控制意图匹配的控制指令，并将第一工作状态切换为第二工作状态；在第二工作状态下，连续采集音频得到音频流，以对音频流语音识别；若语音识别得到符合目标场景的第二控制意图，执行与第二控制意图匹配的控制指令。由此，对用户连续输入的音频流进行语音识别，仅在得到符合目标场景的第二控制意图时，执行相应的控制指令，不仅无需连续输入唤醒词，简化用户操作，还避免了场景切换导致用户使用体验差的技术问题。

6.

发明公开
语音识别控制方法、装置、电子设备和可读存储介质有权转让

公开(公告)号：CN112530419A

公开(公告)日：2021-03-19

申请号：CN201910888231.3

申请日：2019-09-19

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 罗咏曦 , 王莎莎

IPC: G10L15/22

Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质，涉及人工智能和语音识别领域。具体实现方案为：在第一工作状态下，探测具有设定控制意图的目标操作；其中，第一工作状态下，根据唤醒词采集音频片段，以进行语音识别；若探测到目标操作，执行目标操作对应的控制指令，并将第一工作状态切换为第二工作状态；在第二工作状态下，连续采集音频得到音频流，以进行语音识别。该方案中，用户只需触发具有设定控制意图的目标操作，即可实现与电子设备进行连续交互，而无需连续输入唤醒词，可以简化用户操作，改善用户的使用体验。

7.

发明授权
电子设备的语音控制方法、装置、计算机设备和存储介质有权转让

公开(公告)号：CN112017651B

公开(公告)日：2024-06-04

申请号：CN201910468935.5

申请日：2019-05-31

Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司

Inventor： 罗咏曦 , 王莎莎 , 张刚

IPC: G10L15/22 , G10L15/26

Abstract: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质，其中，方法包括：通过接收用户的第一语音指令，根据第一语音指令进入非聊天模式，启动电子设备的全双工聆听状态，在全双工聆听状态之下，获取第一类型用户指令，并识别第一类型用户指令；当第一类型用户指令为预设指令时，则执行所述第一类型用户指令；当第一类型用户指令不为预设指令时，则不执行第一类型用户指令。由此，进入非聊天模式之后启动电子设备的全双工聆听状态，直接对不具有唤醒词的第一类型用户指令进行识别，并且第一类型用户指令为预设指令才执行，节约用户语音发起指令成本，保证电子设备正常播放语音，提升用户使用体验。

8.

发明授权
用于唤醒设备的方法、装置、电子设备和计算机存储介质有权

公开(公告)号：CN113626778B

公开(公告)日：2024-04-02

申请号：CN202010383104.0

申请日：2020-05-08

Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司

Inventor： 钱露 , 陈轶博 , 王峰磊 , 王莎莎

IPC: G06F21/31 , G06F21/32 , G06F9/4401

Abstract: 本公开的实施例涉及用于唤醒设备的方法、装置、电子设备和计算机存储介质，涉及人机交互领域。根据该方法，获取与电子设备周围的环境有关的图像，确定所获取的图像中的眼部特征是否满足注视条件，以及如果确定眼部特征满足注视条件，则基于当前时刻和电子设备的唤醒历史，唤醒电子设备。由此，能够基于注视检测和唤醒历史来唤醒设备，避免了单纯注视检测造成的设备误唤醒，提高设备唤醒准确率。

9.

发明授权
语音识别控制方法、装置、电子设备和可读存储介质有权转让

公开(公告)号：CN112669831B

公开(公告)日：2022-10-21

申请号：CN201910933124.8

申请日：2019-09-29

Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司

Inventor： 罗咏曦 , 王莎莎

IPC: G10L15/22 , G10L15/28

Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质，涉及人工智能和语音识别领域。具体实现方案为：探测到调用目标场景相关的应用程序接口，则查询第一工作状态的配置信息，以确定目标场景是否适用第一工作状态；若目标场景适用第一工作状态，将执行的第二工作状态切换为第一工作状态；其中，在第二工作状态下，根据唤醒词采集音频片段，对音频片段语音识别；在第一工作状态下，连续采集音频得到音频流，以对音频流语音识别。该方案中，用户可以根据自身需求，设置触发第一工作状态的场景，以满足不同用户的个性化需求，且只有在目标场景适用第一工作状态时，才控制设备进入第一工作状态，可以降低对用户的打扰，改善用户的使用体验。

10.

发明公开
用于唤醒设备的方法、装置、电子设备和计算机存储介质有权

公开(公告)号：CN113626778A

公开(公告)日：2021-11-09

申请号：CN202010383104.0

申请日：2020-05-08

Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司

Inventor： 钱露 , 陈轶博 , 王峰磊 , 王莎莎

IPC: G06F21/31 , G06F21/32 , G06F9/4401

Abstract: 本公开的实施例涉及用于唤醒设备的方法、装置、电子设备和计算机存储介质，涉及人机交互领域。根据该方法，获取与电子设备周围的环境有关的图像，确定所获取的图像中的眼部特征是否满足注视条件，以及如果确定眼部特征满足注视条件，则基于当前时刻和电子设备的唤醒历史，唤醒电子设备。由此，能够基于注视检测和唤醒历史来唤醒设备，避免了单纯注视检测造成的设备误唤醒，提高设备唤醒准确率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification