-
公开(公告)号:CN109993298B
公开(公告)日:2023-08-08
申请号:CN201711478743.X
申请日:2017-12-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
IPC: G06N3/0495 , G06N3/082
Abstract: 本申请实施例公开了用于压缩神经网络的方法和装置。该方法的一具体实施方式包括:获取待压缩的经训练后的神经网络;从该神经网络的各层中选取至少一层作为待压缩层;按照待压缩层在该神经网络中所处的层级的层级数由大到小的顺序,依次对每个待压缩层执行以下处理步骤:基于指定数目,对该待压缩层中的参数进行量化,并利用机器学习方法,基于预置的训练样本对经量化后的神经网络进行训练;将对选取出的各个待压缩层进行该处理步骤后所得的神经网络确定为经压缩后的神经网络,并存储经压缩后的神经网络。该实施方式实现了对神经网络的有效压缩。
-
公开(公告)号:CN108280513B
公开(公告)日:2022-08-19
申请号:CN201810059263.8
申请日:2018-01-22
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
Abstract: 本申请实施例公开了模型生成方法和装置。该方法的一具体实施方式包括:创建与用于生成原始模型的原始神经网络的结构相同的神经网络,去除创建的神经网络的多个待去除的中间层,得到用于生成原始模型对应的目标模型的目标神经网络;通过训练操作对目标神经网络进行训练,得到目标模型。通过去除创建的与用于生成原始模型的原始神经网络结构相同的神经网络的部分层,得到占用的存储空间较小的目标神经网络,利用原始模型的输出层和中间层的输出对目标神经网络进行训练,得到精度达到精度阈值的目标模型。减少了构建占用的存储空间较小的目标神经网络的开销以及减少了为使得最后得到的占用的存储空间较小的目标模型达到精度阈值所需的训练开销。
-
公开(公告)号:CN108491890B
公开(公告)日:2022-05-27
申请号:CN201810299833.0
申请日:2018-04-04
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
IPC: G06V10/764 , G06K9/62
Abstract: 本申请实施例公开了图像处理方法和装置。该方法的一具体实施方式包括:从第一处理器接收待处理图像;将待处理图像作为目标图像输入基于神经网络的机器学习模型进行处理,得到处理结果;响应于确定得到目标图像的处理结果,向第一处理器发送图像获取请求,其中第一处理器响应于接收到图像获取请求且已获取新的待处理图像,发送所获取的新的待处理图像;响应于接收到第一处理器发送的处理结果获取请求,向第一处理器发送目标图像的处理结果,其中,第一处理器响应于接收到目标图像的处理结果,对目标图像的处理结果进行融合处理,输出融合后的处理结果并向第一处理器发送处理结果获取请求,该实施方式提升了图像处理效率。
-
公开(公告)号:CN109785838B
公开(公告)日:2021-08-31
申请号:CN201910081862.4
申请日:2019-01-28
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Abstract: 本申请提供一种语音识别方法、装置、设备及存储介质,包括:服务器接收智能语音设备发送的第一语音,服务器提取第一语音的语音特征,服务器根据语音特征确定第一语音的置信度,服务器向智能语音设备发送第一语音的置信度,智能语音设备根据第一语音的置信度确定第一语音是否为语音查询请求。即通过该语音识别方法可以从本质上区分获取到的语音是语音查询请求还是噪声,从而可以提高智能语音设备的语音识别的准确率。
-
公开(公告)号:CN109657091B
公开(公告)日:2021-06-22
申请号:CN201910002528.5
申请日:2019-01-02
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/583 , G06F16/51 , G06F16/683 , G06F16/635 , G06F16/638 , G06F16/78 , G06F16/738 , G10L15/22 , G10L15/26
Abstract: 本发明实施例提出一种语音交互设备的状态呈现方法和装置,其中方法包括:获取语音交互设备的当前状态;根据所述当前状态查找预先存储的状态与呈现方式的对应关系,得到所述当前状态对应的当前呈现方式;采用所述当前呈现方式进行呈现。本发明实施例能够为用户呈现语音交互设备所处的状态,从而为用户提供必要的推荐及提示,提高用户体验。
-
公开(公告)号:CN107563360B
公开(公告)日:2021-05-07
申请号:CN201710915703.0
申请日:2017-09-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了信息获取方法和装置。该方法的一具体实施方式包括:获取多个未注册用户的图像,未注册用户为人脸识别系统中不存在属于未注册用户的注册图像的用户;计算每一个未注册用户的图像对应的最大相似度,最大相似度为所述未注册用户的图像中的人脸对象与多个注册图像中的人脸对象的相似度中的最大的相似度;基于计算出的每一个未注册用户的图像对应的最大相似度,确定出对应于预设条件的相似度阈值,预设条件包括:对应的最大相似度大于相似度阈值的未注册用户的图像的数量与未注册用户的图像的数量的比例小于比例阈值。实现了确定出可以人脸识别系统被入侵的风险可控的相似度阈值,提升人脸识别系统的安全性。
-
公开(公告)号:CN107967308B
公开(公告)日:2021-04-23
申请号:CN201711138632.4
申请日:2017-11-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F16/9535
Abstract: 本发明提供了一种智能交互的处理方法、装置、设备和计算机存储介质。其中方法包括:对已向用户返回的前序反馈项进行意图识别;基于所述前序反馈项的意图,继续向用户返回后序反馈项。本发明能够基于前序反馈项猜测用户的后续意图,无需用户操作即可继续向用户返回其需要的后序反馈项,更加智能化和丰富,简化用户操作。
-
公开(公告)号:CN112133307A
公开(公告)日:2020-12-25
申请号:CN202010900822.0
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了人机交互方法、装置、电子设备及存储介质,涉及人工智能、语音技术及深度学习领域,其中的方法可包括:当检测到用户语音中的唤醒词时,执行唤醒操作;根据用户语音中的需求词确定出用户意图,用户语音中同时包括唤醒词和需求词;获取用户语音为人机交互需求表达的声学置信度;若根据声学置信度及用户意图确定出本次唤醒为一次真实的人机交互需求表达,则对用户语音进行响应。应用本申请所述方案,可提升交互效率等。
-
公开(公告)号:CN112037786A
公开(公告)日:2020-12-04
申请号:CN202010896268.3
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括第一预设词语;响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语;响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别;根据意图识别结果,对设备进行控制,以响应用户。本实现方式使得设备的交互过程变得适应性更强,用户感受更加友好。
-
公开(公告)号:CN109545206A
公开(公告)日:2019-03-29
申请号:CN201811268757.3
申请日:2018-10-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种智能设备的语音交互处理方法、装置和智能设备,其中,方法包括:在智能设备被唤醒后,接收用户输入的第一语音指令;若根据第一语音指令确定用户与智能设备之间需要继续进行语音交互,则控制智能设备启动免唤醒功能,以实现用户与智能设备之间的连续语音交互。在用户与智能设备之间需要连续语音交互的场景中,通过开启免唤醒功能,避免了用户每次唤醒智能设备的重复操作,提升了用户体验。
-
-
-
-
-
-
-
-
-