-
公开(公告)号:CN108038546B
公开(公告)日:2021-02-09
申请号:CN201711473963.3
申请日:2017-12-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
IPC: G06N3/08
Abstract: 本申请实施例公开了用于压缩神经网络的方法和装置。该方法的一具体实施方式包括:获取待压缩的经训练后的神经网络;从该神经网络的各层中选取至少一层作为待压缩层;按照待压缩层在该神经网络中所处的层级的层级数由大到小的顺序,依次对每个待压缩层执行以下处理步骤:基于该待压缩层所包括的参数的数量确定裁减比率,基于裁剪比率和参数值阈值,从该待压缩层所包括的参数中选取参数进行裁剪,并利用机器学习方法,基于预置的训练样本对经裁剪后的神经网络进行训练;将对选取出的各个待压缩层进行该处理步骤后所得的神经网络确定为经压缩后的神经网络,并存储经压缩后的神经网络。该实施方式实现了对神经网络的有效压缩。
-
公开(公告)号:CN112017650A
公开(公告)日:2020-12-01
申请号:CN201910468915.8
申请日:2019-05-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质,其中,方法包括:通过接收用户的第一语音指令进入音乐模式;进入音乐模式之后预定时间段内启动电子设备的全双工聆听状态,在全双工聆听状态之下获取第一类型用户指令并识别;第一类型用户指令与音乐模式相关执行第一类型用户指令;第一类型用户指令与音乐模式不相关不执行第一类型用户指令;在预定时间段之后,退出全双工聆听状态。由此,进入音乐模式之后预定时间段内,启动电子设备的全双工聆听状态,直接对不具有唤醒词的第一类型用户指令进行识别,并且第一类型用户指令与音乐模式相关才执行,节约用户语音发起指令成本,保证电子设备正常播放语音,提升用户使用体验。
-
公开(公告)号:CN109785845A
公开(公告)日:2019-05-21
申请号:CN201910082469.7
申请日:2019-01-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种语音处理方法、装置及设备,该方法包括:终端设备获取第一语音信息;所述终端设备获取所述第一语音信息对应的响应信息,并根据所述响应信息的类型执行所述响应信息对应的操作,所述响应信息的类型为语音类型、文本类型、图像类型、视频类型、程序操作类型中的至少一种。提高了语音处理的灵活性。
-
公开(公告)号:CN109697981A
公开(公告)日:2019-04-30
申请号:CN201910002548.2
申请日:2019-01-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提出一种语音交互方法、装置、设备及存储介质,其中方法包括:判断收音时长是否超时;如果未超时,则对待检测语音信号进行语音识别,得到待检测文本;对所述待检测文本进行初次检测;当所述初次检测结果为未通过时,返回执行所述判断的步骤。本发明实施例能够降低语音交互过程中对语音信号的误识别率,提高用户体验。
-
公开(公告)号:CN109658924A
公开(公告)日:2019-04-19
申请号:CN201811265443.8
申请日:2018-10-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种会话消息处理方法、装置及智能设备,该方法包括:智能设备在第一状态下,在未接收到用户语音输入的预设的唤醒指令时,识别用户语音输入的会话消息;根据所述会话消息,输出会话响应。该方法使得用户在不说出固定的唤醒语音时也可以直接向智能设备发出语音指令,并获取到智能设备对于该语音指令的处理结果,从而避免用户频繁说出唤醒语音所产生的反感情绪,极大提升用户的体验。
-
公开(公告)号:CN108491812A
公开(公告)日:2018-09-04
申请号:CN201810268892.1
申请日:2018-03-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
Abstract: 本申请实施例公开了人脸识别模型的生成方法和装置。该方法的一具体实施方式包括:获取训练样本集合,然后将训练样本集合中的各训练样本输入到初始人脸识别模型中对初始人脸识别模型进行训练,得到训练后的人脸识别模型,人脸识别模型用于识别输入到其中的人脸图像对所对应的对象之间是否满足预定血缘关系。在不增加目标对象的人脸图像和关系对象的人脸图像的同时,扩充了训练用的特征图,减少了获取训练用人脸图像的人力物力成本和时间成本。提高了训练人脸识别模型的效率。
-
公开(公告)号:CN108446658A
公开(公告)日:2018-08-24
申请号:CN201810264669.X
申请日:2018-03-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
IPC: G06K9/00
Abstract: 本申请公开了一种用于识别人脸图像的方法和装置。方法包括:获取采用预定尺寸的矩形框标注关键部位的人脸图像;将人脸图像输入卷积神经网络的卷积层,得到卷积层所提取的各关键部位的特征向量;将各关键部位的特征向量依次连接,得到面部特征向量;获取各关键部位的位置信息以及每两个关键部位之间的距离信息;将位置信息、距离信息及面部特征向量输入至神经网络的全连接层,得到输出的人脸图像特征。该方法能够提高输出的人脸图像特征的准确度。
-
公开(公告)号:CN108280513A
公开(公告)日:2018-07-13
申请号:CN201810059263.8
申请日:2018-01-22
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
Abstract: 本申请实施例公开了模型生成方法和装置。该方法的一具体实施方式包括:创建与用于生成原始模型的原始神经网络的结构相同的神经网络,去除创建的神经网络的多个待去除的中间层,得到用于生成原始模型对应的目标模型的目标神经网络;通过训练操作对目标神经网络进行训练,得到目标模型。通过去除创建的与用于生成原始模型的原始神经网络结构相同的神经网络的部分层,得到占用的存储空间较小的目标神经网络,利用原始模型的输出层和中间层的输出对目标神经网络进行训练,得到精度达到精度阈值的目标模型。减少了构建占用的存储空间较小的目标神经网络的开销以及减少了为使得最后得到的占用的存储空间较小的目标模型达到精度阈值所需的训练开销。
-
公开(公告)号:CN113495621B
公开(公告)日:2025-01-21
申请号:CN202010261062.3
申请日:2020-04-03
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F3/01 , G06F3/04847 , G06F3/0485 , G10L15/22 , G10L15/26
Abstract: 本申请公开了一种交互模式的切换方法、装置、电子设备及存储介质,涉及智能交互技术领域。切换方法的具体实现方案为:在带屏语音交互设备处于触控交互模式的情况下,根据第一切换指令,切换至多项交互模式;多项交互模式为支持显示语音交互信息和触控交互模式;在多项交互模式的情况下,带屏语音交互设备的第一屏幕区域为显示语音交互信息的区域,第二屏幕区域为响应触控指令的区域;在触控交互模式的情况下,带屏语音交互设备的第一、第二屏幕区域为响应触控指令的区域。通过上述方案,采用了多项交互模式的机制,可以满足用户的交互需求,提升交互体验。
-
公开(公告)号:CN112037786B
公开(公告)日:2024-09-24
申请号:CN202010896268.3
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括第一预设词语;响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语;响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别;根据意图识别结果,对设备进行控制,以响应用户。本实现方式使得设备的交互过程变得适应性更强,用户感受更加友好。
-
-
-
-
-
-
-
-
-