-
公开(公告)号:CN103744876A
公开(公告)日:2014-04-23
申请号:CN201310706161.8
申请日:2013-12-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明的目的是提供一种用于提供搜索结果的方法与设备。具体地,获取与目标查询序列相对应的初始搜索结果;检测是否满足提供初始搜索结果所对应的原创结果信息的触发条件;当满足触发条件时,根据初始搜索结果及原创结果信息,确定与目标查询序列相对应的目标搜索结果;将目标搜索结果提供给目标查询序列所对应的用户。与现有技术相比,本发明通过检测是否满足提供与目标查询序列相对应的初始搜索结果所对应的原创结果信息的触发条件,当满足时,根据初始搜索结果及原创结果信息,确定对应的目标搜索结果,以将其提供给用户,在保证用户获取较高可信任度、准确度的信息的同时,还提高了用户获取信息的效率,提升了用户的搜索浏览体验。
-
公开(公告)号:CN119806649A
公开(公告)日:2025-04-11
申请号:CN202411886929.9
申请日:2024-12-19
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了基于大模型的推测解码方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域。具体实现方案为:将第一词元序列输入第一大模型,得到第二词元序列;其中,该第一大模型是根据第二大模型量化得到的,该第一词元序列基于多模态数据得到;将该第一词元序列和该第二词元序列输入该第二大模型,得到第三词元序列;根据该第二词元序列和该第三词元序列进行验证,得到推测解码结果。
-
公开(公告)号:CN112584280B
公开(公告)日:2022-11-29
申请号:CN201910927956.9
申请日:2019-09-27
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: H04R3/12
Abstract: 本申请实施例公开了一种智能设备的控制方法、装置、设备和介质,涉及数据处理领域,尤其涉及人工智能技术。具体实现方案为:确定目标功能的所处状态;检测用户对本地屏幕的注视操作;根据注视操作信息和目标功能状态信息,控制所述目标功能的状态切换。本申请实施例提供了一种智能设备的控制方法、装置、设备和介质,实现了对目标功能状态的自动灵活控制,满足不同用户的个性化需求。
-
公开(公告)号:CN113495622A
公开(公告)日:2021-10-12
申请号:CN202010261346.2
申请日:2020-04-03
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F3/01 , G06F3/0484 , G06F3/0485 , G10L15/22 , G10L15/26
Abstract: 本申请公开了一种交互模式的切换方法、装置、电子设备及存储介质,涉及智能交互技术领域。切换方法的具体实现方案为:在带屏语音交互设备处于多项交互模式的情况下,启动计时;其中,所述多项交互模式为支持显示语音交互信息和触控交互的模式;在到达预定时间的情况下,将所述带屏语音交互设备切换至触控交互模式。通过上述方案,可以自动进行交互模式的切换。尤其针对视频场景,可以避免持续显示语音交互信息带给用户不良的体验。从而可以从整体上提升用户的交互满意度。
-
公开(公告)号:CN113495620A
公开(公告)日:2021-10-12
申请号:CN202010260824.8
申请日:2020-04-03
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F3/01 , G06F3/0484 , G06F3/0485 , G10L15/22 , G10L15/26
Abstract: 本申请公开了一种交互模式的切换方法、装置、电子设备及存储介质,涉及智能交互技术领域。切换方法的具体实现方案为:在带屏语音交互设备处于多项交互模式的情况下,根据第一切换指令,将带屏语音交互设备切换至触控交互模式;多项交互模式为支持显示语音交互信息和触控交互的模式;在触控交互模式,根据触控指令的接收时间,确定有效的第二切换指令;第二切换指令为将带屏语音交互设备切换至多项交互模式的指令。本申请利用多项交互模式可以支持在显示语音交互信息的同时,执行用户的动作指令。根据切换指令的接收时间确定有效的切换指令,可以避免无效切换指令导致的频繁切换,从而可以准确的识别用户的切换意图,提高交互感受。
-
公开(公告)号:CN111986682A
公开(公告)日:2020-11-24
申请号:CN202010896937.7
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括预设唤醒词的至少两个字;响应于确定语音包括预设唤醒词的至少两个字,对至少两个字的下文信息进行意图识别;根据意图识别结果,控制设备响应用户。本实现方式简化了设备的唤醒方法,提高了设备的唤醒成功率。
-
公开(公告)号:CN109658924B
公开(公告)日:2020-09-01
申请号:CN201811265443.8
申请日:2018-10-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种会话消息处理方法、装置及智能设备,该方法包括:智能设备在第一状态下,在未接收到用户语音输入的预设的唤醒指令时,识别用户语音输入的会话消息;根据所述会话消息,输出会话响应。该方法使得用户在不说出固定的唤醒语音时也可以直接向智能设备发出语音指令,并获取到智能设备对于该语音指令的处理结果,从而避免用户频繁说出唤醒语音所产生的反感情绪,极大提升用户的体验。
-
公开(公告)号:CN110083695A
公开(公告)日:2019-08-02
申请号:CN201910388404.5
申请日:2019-05-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F9/48
Abstract: 本发明实施例提出一种技能服务调用方法、装置及计算机可读存储介质。其中技能服务调用方法包括:在使用第一技能服务的过程中,识别用户意图是否需要触发第二技能服务;若识别到所述用户意图需要触发所述第二技能服务,则调用所述第二技能服务;在所述第二技能服务使用结束后,返回使用所述第一技能服务。本发明实施例中,一方面用户可以在一次对话的过程中无缝使用多个技能服务,而无需显式的技能唤醒话术,极大地提升了垂直领域技能的用户满足度,用户体验良好。另一方面,由于实现了技能服务的调用,开发者可以从单个小型技能的开发开始,由多个小型技能组合形成大型的技能,且通过技能复用可提升技能的使用率,因而提升了技能开发的效率。
-
公开(公告)号:CN108509915A
公开(公告)日:2018-09-07
申请号:CN201810289806.5
申请日:2018-04-03
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
Abstract: 本申请实施例公开了人脸识别模型的生成方法和装置。该方法的一具体实施方式包括:获取训练样本集合;将训练样本集合中的训练样本输入到初始人脸识别模型对初始人脸识别模型进行训练,得到训练后的人脸识别模型,训练后的人脸识别模型用于识别人脸图像所对应的人物身份。该实施方式通过在原始人脸图像中截取至少一个特征区域,并对各特征区域进行图像变换,将图像变换后的至少一个特征区域替换原始人脸图像中相对应的特征区域所生成的图像作为扩充人脸图像,并使用包括扩充人脸图像的训练样本集合对人脸识别模型进行训练,从而扩充了训练样本的数量,减少了获取训练用人脸图像的人力物力成本和时间成本。
-
公开(公告)号:CN108470328A
公开(公告)日:2018-08-31
申请号:CN201810265515.2
申请日:2018-03-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张刚
Abstract: 本申请实施例公开了用于处理图像的方法和装置。该方法的一具体实施方式包括:获取目标人脸的二维人脸图像;将二维人脸图像输入至预先训练的矫正模型,得到二维人脸图像对应的姿态矫正信息,其中,矫正模型用于表征二维人脸图像和姿态矫正信息的对应关系,姿态矫正信息用于表示目标人脸相对于二维人脸图像的拍摄设备偏转的角度;基于姿态矫正信息,对二维人脸图像进行处理,得到姿态矫正后的二维人脸图像。该实施方式有助于得到目标人脸图像包含的目标人脸的其它姿态的图像。
-
-
-
-
-
-
-
-
-