-
公开(公告)号:CN113495621A
公开(公告)日:2021-10-12
申请号:CN202010261062.3
申请日:2020-04-03
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F3/01 , G06F3/0484 , G06F3/0485 , G10L15/22 , G10L15/26
Abstract: 本申请公开了一种交互模式的切换方法、装置、电子设备及存储介质,涉及智能交互技术领域。切换方法的具体实现方案为:在带屏语音交互设备处于触控交互模式的情况下,根据第一切换指令,切换至多项交互模式;多项交互模式为支持显示语音交互信息和触控交互模式;在多项交互模式的情况下,带屏语音交互设备的第一屏幕区域为显示语音交互信息的区域,第二屏幕区域为响应触控指令的区域;在触控交互模式的情况下,带屏语音交互设备的第一、第二屏幕区域为响应触控指令的区域。通过上述方案,采用了多项交互模式的机制,可以满足用户的交互需求,提升交互体验。
-
公开(公告)号:CN109697981B
公开(公告)日:2021-03-09
申请号:CN201910002548.2
申请日:2019-01-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提出一种语音交互方法、装置、设备及存储介质,其中方法包括:判断收音时长是否超时;如果未超时,则对待检测语音信号进行语音识别,得到待检测文本;对所述待检测文本进行初次检测;当所述初次检测结果为未通过时,返回执行所述判断的步骤。本发明实施例能够降低语音交互过程中对语音信号的误识别率,提高用户体验。
-
公开(公告)号:CN112037794A
公开(公告)日:2020-12-04
申请号:CN202010897825.3
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/26 , G10L15/22 , G10L15/183 , G06F40/30
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括预设词语;响应于确定语音包括预设词语,确定语音是否包括预设词语的上文信息;响应于确定语音不包括预设词语的上文信息,对预设词语的下文信息进行意图识别;根据意图识别结果,控制设备响应用户。本实现方式简化了用户与设备的交互步骤,优化了用户体验。
-
公开(公告)号:CN112017651A
公开(公告)日:2020-12-01
申请号:CN201910468935.5
申请日:2019-05-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质,其中,方法包括:通过接收用户的第一语音指令,根据第一语音指令进入非聊天模式,启动电子设备的全双工聆听状态,在全双工聆听状态之下,获取第一类型用户指令,并识别第一类型用户指令;当第一类型用户指令为预设指令时,则执行所述第一类型用户指令;当第一类型用户指令不为预设指令时,则不执行第一类型用户指令。由此,进入非聊天模式之后启动电子设备的全双工聆听状态,直接对不具有唤醒词的第一类型用户指令进行识别,并且第一类型用户指令为预设指令才执行,节约用户语音发起指令成本,保证电子设备正常播放语音,提升用户使用体验。
-
公开(公告)号:CN107609481B
公开(公告)日:2020-11-20
申请号:CN201710691048.5
申请日:2017-08-14
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供了一种为人脸识别生成训练数据的方法、装置和计算机存储介质,其中方法包括:将未戴配件的人脸图像输入生成式网络,得到戴配件的人脸图像;将所述戴配件的人脸图像用于建立人脸识别模型的第二训练数据;其中所述生成式网络为利用第一训练数据预先训练得到的对抗生成式网络中的生成式网络,所述第一训练数据包括同一用户标识对应的未戴配件人脸图像和戴配件人脸图像。本发明通过数据增广方式得到的戴配件的人脸图像大大扩充了建立人脸识别模型的训练数据数量,从而提高了戴配件的人脸图像的识别准确性。
-
公开(公告)号:CN107609506B
公开(公告)日:2020-04-21
申请号:CN201710806650.9
申请日:2017-09-08
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了用于生成图像的方法和装置。该方法的一具体实施方式包括:获取至少两张人脸图像;将上述至少两张人脸图像输入预先训练的生成模型生成单张人脸图像,其中,生成模型在训练过程中利用损失函数更新模型参数,而该损失函数是基于单张人脸生成图像为真实人脸图像的概率和该单张人脸生成图像与得到该单张人脸生成图像的至少两张人脸样本图像之间的相似度确定的。该实施方式提高了所生成人脸图像的真实性。
-
公开(公告)号:CN109993298A
公开(公告)日:2019-07-09
申请号:CN201711478743.X
申请日:2017-12-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
IPC: G06N3/08
Abstract: 本申请实施例公开了用于压缩神经网络的方法和装置。该方法的一具体实施方式包括:获取待压缩的经训练后的神经网络;从该神经网络的各层中选取至少一层作为待压缩层;按照待压缩层在该神经网络中所处的层级的层级数由大到小的顺序,依次对每个待压缩层执行以下处理步骤:基于指定数目,对该待压缩层中的参数进行量化,并利用机器学习方法,基于预置的训练样本对经量化后的神经网络进行训练;将对选取出的各个待压缩层进行该处理步骤后所得的神经网络确定为经压缩后的神经网络,并存储经压缩后的神经网络。该实施方式实现了对神经网络的有效压缩。
-
公开(公告)号:CN109785838A
公开(公告)日:2019-05-21
申请号:CN201910081862.4
申请日:2019-01-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提供一种语音识别方法、装置、设备及存储介质,包括:服务器接收智能语音设备发送的第一语音,服务器提取第一语音的语音特征,服务器根据语音特征确定第一语音的置信度,服务器向智能语音设备发送第一语音的置信度,智能语音设备根据第一语音的置信度确定第一语音是否为语音查询请求。即通过该语音识别方法可以从本质上区分获取到的语音是语音查询请求还是噪声,从而可以提高智能语音设备的语音识别的准确率。
-
公开(公告)号:CN109698858A
公开(公告)日:2019-04-30
申请号:CN201811294676.0
申请日:2018-11-01
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张萌萌 , 叶静宇 , 张茜 , 祖华龙 , 张欣娅 , 徐凌锦 , 贾啸宸 , 董孙竑路 , 范中吉 , 万立 , 张博 , 张刘辉 , 王文明 , 卢家广 , 王帅 , 张刚 , 鞠强 , 何晓楠 , 贺文嵩 , 苗亚飞
IPC: H04L29/08 , G06F16/9535
Abstract: 本申请提供一种用于智能设备的资源推送方法、设备和存储介质,该资方法包括:根据预设规则,获取第一推送资源,第一推送资源用于智能设备与用户交互,将所述第一推送资源推送给用户。根据用户的行为信息,触发以及热点等主动的获取相关的资源并推送给用户,节省用户查询资源的成本,同时提高平台资源的曝光度。
-
公开(公告)号:CN108510556A
公开(公告)日:2018-09-07
申请号:CN201810293153.8
申请日:2018-03-30
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
Abstract: 本申请实施例公开了用于处理图像的方法和装置。该方法的一具体实施方式包括:获取待处理图像,其中,待处理图像为在正面单点光源下拍摄的图像;将待处理图像输入至预先训练的光照强度估计模型,得到待处理图像对应的光照强度值,其中,光照强度估计模型用于表征图像和光照强度值之间的对应关系;基于光照强度值,对待处理图像进行处理,得到处理后的图像。该实施方式实现了对图像的光照强度的一个量化,而且可以得到该图像的处理后的图像。
-
-
-
-
-
-
-
-
-