-
公开(公告)号:CN110288981B
公开(公告)日:2020-11-06
申请号:CN201910593846.3
申请日:2019-07-03
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 田超
Abstract: 本申请实施例公开了用于处理音频数据的方法和装置。该方法的一具体实施方式包括:获取第一音频数据,该第一音频数据的采样率为第一目标采样率;基于预先生成的抗混叠滤波器,对第一音频数据进行处理,生成第二音频数据,该第二音频数据的采样率为第二目标采样率,该第二目标采用率小于该第一目标采样率;该抗混叠滤波器通过以下方式生成:将训练样本中的训练用语音数据输入初始抗混叠滤波器;将初始抗混叠滤波器的输出输入训练用语音识别模型,并生成训练用语音识别结果;基于训练用语音识别结果和训练样本中针对训练用语音数据的目标语音识别结果,调整该初始抗混叠滤波器,生成该抗混叠滤波器。该实施方式提供了新的音频数据处理方式。
-
公开(公告)号:CN111325332A
公开(公告)日:2020-06-23
申请号:CN202010098799.8
申请日:2020-02-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种卷积神经网络的处理方法和装置,涉及计算机技术领域。具体实现方案为:通过获取输入矩阵、权重矩阵、激活标识、激活函数和权重矩阵组数;当权重矩阵组数小于或等于累加器的个数时,分别将输入矩阵和权重矩阵输入至多个加速器寄存器;控制多个运算单元从多个加速器寄存器之中读取输入矩阵和权重矩阵,并生成多个运算结果;以及将多个运算结果输入多个累加器进行累加以生成累加结果,并根据激活标识和激活函数对累加结果进行激活。该方法中对多个累加器生成的累加结果进行激活,与卷积计算的过程均是并行处理的,提高了卷积神经网络的计算效率,进而对因卷积计算效率引起的延迟问题有显著的改善。
-
公开(公告)号:CN111292716A
公开(公告)日:2020-06-16
申请号:CN202010090986.1
申请日:2020-02-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种语音芯片和电子设备,涉及数据处理技术领域,尤其涉及语音技术。具体该芯片包括:第一处理模块、第二处理模块和第三处理模块;其中,所述第一处理模块用于运行操作系统,以及对芯片中除所述第一处理模块之外的其他模块进行数据调度;所述第二处理模块用于基于语音模型进行语音和文本的相互转换;所述第三处理模块用于对输入语音进行数字信号处理。本申请实施例提供一种语音芯片和电子设备,以使得智能语音产品支持离线场景的应用。
-
公开(公告)号:CN110288981A
公开(公告)日:2019-09-27
申请号:CN201910593846.3
申请日:2019-07-03
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 田超
Abstract: 本申请实施例公开了用于处理音频数据的方法和装置。该方法的一具体实施方式包括:获取第一音频数据,该第一音频数据的采样率为第一目标采样率;基于预先生成的抗混叠滤波器,对第一音频数据进行处理,生成第二音频数据,该第二音频数据的采样率为第二目标采样率,该第二目标采用率小于该第一目标采样率;该抗混叠滤波器通过以下方式生成:将训练样本中的训练用语音数据输入初始抗混叠滤波器;将初始抗混叠滤波器的输出输入训练用语音识别模型,并生成训练用语音识别结果;基于训练用语音识别结果和训练样本中针对训练用语音数据的目标语音识别结果,调整该初始抗混叠滤波器,生成该抗混叠滤波器。该实施方式提供了新的音频数据处理方式。
-
公开(公告)号:CN108962240A
公开(公告)日:2018-12-07
申请号:CN201810613450.6
申请日:2018-06-14
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/22 , G10L15/26 , G10L2015/223
Abstract: 本发明公开了一种基于耳机的语音控制方法及系统,其中方法包括耳机采集并缓存音频数据,进行第一次唤醒检测;第一次唤醒成功后,将缓存的音频数据发送给终端进行第二次唤醒检测;接收终端发送的第二次唤醒检测响应消息;若所述第二次唤醒检测响应消息指示唤醒成功,将用户语音数据发送给终端进行语音识别,以便所述终端执行所识别到的指令。应用本发明所述方案,解放了用户的双手,无需手动操作即可通过语音实现对耳机及终端的控制;可以减少耳机上的物理按键数量,减小体积;提高了唤醒率,降低了误唤醒率;提高了用户的操作便捷性,提升了用户体验。
-
公开(公告)号:CN110278205A
公开(公告)日:2019-09-24
申请号:CN201910532552.X
申请日:2019-06-19
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种蓝牙音箱底座及其控制方法和系统,其中,方法包括:当蓝牙音箱底座上放置有蓝牙音箱时,采集语音数据并判断语音数据中是否包含唤醒词;若包含唤醒词,则控制蓝牙音箱底座进入唤醒识别状态,并按照预先协商的压缩倍数对语音数据进行压缩;将压缩后的语音信号通过预先建立的第一协议发送至移动终端,以使得移动终,通过预先建立的第二协议将音频数据发送至蓝牙音箱播放。由此,采用蓝牙双向高速传输协议来实现移动终端与蓝牙音箱及其底座之间的语音数据双向高速传输功能,在不改变蓝牙音箱的构造的基础上,可以大幅提升蓝牙音箱的远场语音交互体验。
-
公开(公告)号:CN110265029A
公开(公告)日:2019-09-20
申请号:CN201910544209.7
申请日:2019-06-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/26 , G10L21/0208
Abstract: 本申请提出一种语音芯片和电子设备,其中,语音芯片包括:外设接口,外设接口与语音接收器相连,用于接收语音信号;与外设接口相连的总线矩阵;与总线矩阵相连的第一处理器,用于根据语音信号判断语音信号之中是否具有唤醒词;与总线矩阵相连的第二处理器,用于对语音信号进行信号降噪和语音识别;与总线矩阵相连的存储器阵列。由此,可以降低语音芯片的成本和功耗。
-
公开(公告)号:CN110177363A
公开(公告)日:2019-08-27
申请号:CN201910449959.6
申请日:2019-05-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种蓝牙数据传输方法、装置、蓝牙芯片和存储介质。其中,所述方法应用于蓝牙设备,所述蓝牙设备包括蓝牙芯片,所述方法包括:建立终端设备与蓝牙芯片的第一协议连接和第二协议连接;在确定蓝牙设备进入唤醒识别状态时,获取待识别语音数据,并按照预先协商的压缩倍数对待识别语音数据进行压缩;基于第一协议连接将压缩后的待识别语音数据发送给终端设备;其中,待识别语音数据用于指示终端设备获取识别后的语音数据;基于第二协议连接接收终端设备返回的识别后的语音数据。该方法可以大幅提升蓝牙双向传输率,使蓝牙设备在语音交互音频信号传输方面的应用更加丰富、灵活,可以大幅提升蓝牙语音交互方面的用户体验。
-
-
公开(公告)号:CN304005602S
公开(公告)日:2017-01-11
申请号:CN201630369868.9
申请日:2016-08-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 1.本外观设计产品的名称:带图形用户界面的手机。
2.本外观设计产品的用途:本外观设计产品用于运行程序及通讯。
3.本外观设计产品的设计要点:在于屏幕中的图形用户界面的界面内容。
4.最能表明本外观设计设计要点的图片或照片:主视图。
5.界面用途:主视图为手机助手游戏频道首页界面。将游戏首页的主题设置为主推游
戏的风格,将主推游戏的主题色应用于游戏分发首页的卡片色、背景色、字体颜色中;将主
推游戏内的元素应用于各入口图标(字母A、B1、B2、C、D、E、F、G、H、I、J所示)、榜单标题(字母
K所示);各入口图标有翻转动效,即图片B1自动翻转为图片B2,提前外露入口内游戏信息,
如界面变化状态图所示;榜单之间设立各种特型的视觉接力卡片,主要内容为游戏榜单和
游戏周边信息。其中,界面所示灰色部分仅用于覆盖和设计要素无关的内容画面。
-
-
-
-
-
-
-
-
-