-
公开(公告)号:CN118708682A
公开(公告)日:2024-09-27
申请号:CN202410693410.2
申请日:2024-05-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F40/211 , G06F16/33 , G06F40/20
Abstract: 本公开提供了多轮对话方法、装置、设备以及存储介质,本公开涉及人工智能技术领域,尤其涉及计算机视觉、多轮对话生成等技术领域。具体实现方案为:确定目标图像的追问信息原始内容;基于追问信息原始内容确定追问上下文;基于追问上下文对追问信息原始内容进行改写,得到追问信息优化内容;基于追问信息优化内容生成追问信息原始内容的会话内容。本公开实施例中,通过对用户输入的目标图像的追问信息进行优化,能够使系统更好地理解用户的意图,使多轮对话的生成内容更加自然合理。
-
公开(公告)号:CN112861007B
公开(公告)日:2024-09-27
申请号:CN202110217072.1
申请日:2021-02-26
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F3/04883 , G06F3/04842 , G06F3/04847 , G06Q30/0251
Abstract: 本申请公开了一种屏保的显示方法、装置、设备、介质及程序产品,涉及智能家居和智能语音技术领域。该方法的一具体实施方式包括:响应于检测到音箱进入待机状态,根据获取的用户消费信息生成目标屏保请求,其中,用户消费信息为用户操作预设的屏保所产生的信息;向云端发送目标屏保请求,以使云端根据目标屏保请求中的用户消费信息,从预设的屏保内容池中确定与用户消费信息对应的目标屏保;接收云端发送的目标屏保;在音箱的显示屏上显示目标屏保。
-
公开(公告)号:CN118673883A
公开(公告)日:2024-09-20
申请号:CN202410078310.9
申请日:2024-01-18
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张魏斌
IPC: G06F40/166 , G06F40/205
Abstract: 本申请公开了书籍段落评论的生成方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及深度学习、自然语言处理等人工智能领域。具体实现方案为:获取目标书籍中待评论段落的第一段落内容及第一提示信息;其中,第一提示信息用于提示第一大模型执行评论生成任务;采用第一大模型,基于第一提示信息对第一段落内容进行处理,生成待评论段落的第一评论。
-
公开(公告)号:CN112151025B
公开(公告)日:2024-09-20
申请号:CN201910578929.5
申请日:2019-06-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , H04M1/60 , H04M1/72454 , H04R3/00
Abstract: 本发明实施例提供一种音量调节方法、装置、设备和存储介质,该方法包括:获取智能设备所处环境的环境噪音,获取到用户输入的语音指令时,根据所述环境噪音和所述语音指令,获取第一音量,将所述智能设备的输出语音的音量调节至所述第一音量。在该技术方案中,根据用户的语音指令和环境噪音,来控制智能设备的输出音量,使得智能设备的输出音量与当前情境相匹配,提高了用户体验。
-
公开(公告)号:CN114390336B
公开(公告)日:2024-09-17
申请号:CN202111519289.4
申请日:2021-12-13
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 高远飞
IPC: H04N21/434 , H04N19/166 , H04N19/85
Abstract: 本公开提供了视频的解码方法、装置、电子设备及可读存储介质,涉及计算机技术领域,尤其涉及图像处理技术领域。具体实现方案为:在终端设备播放目标视频的过程中,确定终端设备对目标视频的硬解码能力值;基于硬解码能力值确定目标解码方式,以基于目标解码方式对目标视频进行解码。本方案中,通过在终端设备播放目标视频时自动确定终端设备对目标视频的硬解码能力值,从而能够基于硬解码能力值确定出采用硬解码或是软解码的方式对目标视频进行解码,能够保证目标视频的解码效果,提升用户的使用体验。
-
公开(公告)号:CN113763956B
公开(公告)日:2024-08-30
申请号:CN202111119722.5
申请日:2019-03-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , B60R16/037 , G10L25/21
Abstract: 本申请实施例公开了应用于车辆的交互方法和装置。该方法的一具体实施方式包括:若接收到用户唤醒语音,基于该至少两个拾音器接收到的用户唤醒语音的语音信号幅值,从该至少两个拾音器和该至少两个多媒体播放装置中确定出用户唤醒语音所对应的目标拾音器和目标播放装置;通过该目标拾音器接收第一用户语音,响应于确定该第一用户语音包括用于指示多媒体文件的标识的信息,发送指示播放该多媒体文件的播放指令至该目标播放装置进行播放。本申请实施例提供的方法不仅能接收到司机位置的语音,还能够接收到后排等的其他位置的语音,这样后排位置的乘客可以独立地与车辆进行语音交互,收看到多媒体内容并可以较好地实现不影响到车内的其他人。
-
公开(公告)号:CN118550998A
公开(公告)日:2024-08-27
申请号:CN202410390439.3
申请日:2024-04-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G10L15/22 , G10L13/02 , G06F16/33 , G06N5/04
Abstract: 本公开涉及计算机技术领域,尤其涉及人工智能、大语言模型、智能交互等技术领域,具体涉及一种人机交互方法、装置、电子设备及存储介质。具体实现方案:接收终端设备发送的对话文本;将对话文本输入大语言模型;其中,大语言模型用于基于对话文本依次生成多个回复文本片段;每得到大语言模型生成的第二预设数量个回复文本片段,则基于第二预设数量个回复文本片段,得到数字人回复内容,并将数字人回复内容发送给终端设备进行播报;或者,将第二预设数量个回复文本片段发送给数字人服务器。采用本公开能够提高数字人的响应效果,具体地,能够在降低响应延迟的基础上,确保整体回复内容的连贯性和流畅性。
-
公开(公告)号:CN118537446A
公开(公告)日:2024-08-23
申请号:CN202410564728.0
申请日:2024-05-08
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T11/60 , G06F40/279 , G06F18/25 , G06N5/04
Abstract: 本公开提供了演示文稿的自动配图方法、装置、设备以及存储介质,本公开涉及数据处理技术领域,尤其涉及人工智能、深度学习、自然语言理解等技术领域。具体实现方案为:从演示文稿的待配图页面中提取出多路描述语句;为每路描述语句分别匹配对应的候选图像,得到候选图像集;确定候选图像集中各候选图像与待配图页面的匹配度;基于各候选图像与待配图页面的匹配度,为待配图页面筛选出目标图像,作为待配图页面的插图。本公开实施例中,通过提取多路描述语句,能够逐步自动准确的为待配图页面筛选出合适的插图。
-
公开(公告)号:CN111126119B
公开(公告)日:2024-08-20
申请号:CN201811296903.3
申请日:2018-11-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V40/16 , G06V10/75 , G06Q30/0201
Abstract: 本申请提出一种基于人脸识别的用户到店行为统计方法和装置,方法包括:对当前时刻各摄像采集设备采集的图像数据进行解析处理,以获取当前时刻店内各区域的用户人脸图像;判断当前时刻店内第一用户的人脸图像是否与第一预设的人脸库中的第二用户的人脸图像匹配,其中,第一预设的人脸库中包含的人脸图像对应用户的到店时间与当前时刻的时间间隔小于阈值;若匹配,则根据第一用户当前所在的区域对第一预设的人脸库中的第二用户的到店行为进行更新。该方法由于第一预设的人脸库中存储的人脸图像对应用户的到店时刻与当前时刻的时间间隔小于阈值,从而在第一预设的人脸库中检索当前时刻获取的用户人脸图像,可以大大提高处理速度、准确性和实时性。
-
公开(公告)号:CN113450034B
公开(公告)日:2024-08-13
申请号:CN202010212589.7
申请日:2020-03-24
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 赵天琪
IPC: G06Q10/083 , G06Q30/0204
Abstract: 本公开实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:将待划分区域进行网格划分,以及将上述待划分区域中满足预设条件的目标道路所占据的网格确定为道路网格;基于道路网格确定联通区域,以及确定联通区域的边界网格;根据划分得到的网格与目标道路的道路信息之间的对应关系,确定边界网格所对应目标道路的道路信息,其中,道路信息包括道路坐标;使用边界网格所对应目标道路的道路坐标构建多边形,得到多边形数据。该实施方式实现了区域范围的自动划分,提高了区划范围划分的效率。
-
-
-
-
-
-
-
-
-