-
公开(公告)号:CN119031211A
公开(公告)日:2024-11-26
申请号:CN202411170414.9
申请日:2024-08-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/854 , G06T3/04 , G06F40/211 , G06F40/30
Abstract: 本公开提供了一种生成视频的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大语言模型、生成模型、图像处理等领域。具体实现方案为:响应于接收到输入信息,将输入信息中的N个输入图像转换为符合输入信息中的目标风格的N个图像;N是大于等于1的整数;根据N个输入图像,确定故事文本;其中,故事文本包括与N个图像相对应N个子文本;根据N个图像和N个子文本,确定初始视频;其中,初始视频包括多个页面,每个页面包括图像和子文本;以及响应于确定针对多个页面中目标页面中的字符的修改操作,根据修改后的字符的字符属性或修改后的目标页面的页面图像更新初始视频,得到目标视频;其中,字符包括目标页面中的子文本。
-
公开(公告)号:CN119003370A
公开(公告)日:2024-11-22
申请号:CN202411251969.6
申请日:2024-09-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F11/36
Abstract: 本公开提供了一种端到端测试方法、装置、电子设备及存储介质,涉及计算机技术领域,具体涉及测试技术领域。具体实现方案为:获取服务端的待测试业务;根据端到端识别策略判断待测试业务是否满足端到端测试模式;若待测试业务满足端到端测试模式,在待测试业务中的测试用例发生变化时,则对测试环境进行更新并生成与更新测试环境对应的代理地址;根据代理地址对待测试业务进行测试,以得到测试结果。本公开通过判断服务端的待测试业务是否满足端到端测试模式的判断,若满足,则将对服务端的测试放到客户端来执行,这一流程可以释放服务端的人力,从而可以节省人力投入,实现了测试自动化和智能化,提升了整体测试吞吐。
-
公开(公告)号:CN113111248B
公开(公告)日:2024-10-25
申请号:CN202110280742.4
申请日:2021-03-16
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 刘俊启
IPC: G06F16/9532 , G06F16/957 , G06F16/583
Abstract: 本公开公开了一种搜索处理方法、装置、电子设备和存储介质,尤其涉及自然语言处理、计算机视觉、智能搜索等人工智能技术领域。其中,具体实现方案为:根据获取的搜索语句,获取第一搜索结果;确定所述搜索语句的类型;在所述搜索语句为预设类型的情况下,在所述第一搜索结果显示界面中显示预设的控件;获取待识别的目标图像;基于所述搜索语句及所述目标图像,获取并返回第二搜索结果显示界面。由此,可以改善系统搜索功能,可以更准确的确定出搜索结果,从而可以尽可能地满足用户的搜索需求,提高了搜索处理效率和准确性,也可以给予用户更好的使用感。
-
公开(公告)号:CN118824038A
公开(公告)日:2024-10-22
申请号:CN202411132825.9
申请日:2024-08-16
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了交通信号灯切换异常检测方法、装置及电子设备,涉及数据处理技术领域,尤其涉及大数据、云计算、智能交通等人工智能领域,可应用于车联网、智能座舱、自动驾驶等技术领域。具体实现方案为:获取目标路口的车辆轨迹行为特征;对车辆轨迹行为特征进行分类,以获取同一行驶方向的车辆轨迹行为特征;根据目标路口的任一行驶方向的车辆轨迹行为特征,确定任一行驶方向的信号灯切换是否异常的初始判断结果;对目标路口的各行驶方向的信号灯切换是否异常的初始判断结果进行联合校验,以确定每个行驶方向的信号灯切换是否异常的目标判断结果;根据各行驶方向的信号灯切换是否异常的目标判断结果,确定目标路口的信号灯切换是否异常。
-
公开(公告)号:CN113819910B
公开(公告)日:2024-10-11
申请号:CN202110961517.7
申请日:2019-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种车辆导航中高架桥区识别方法、装置、电子设备和存储介质,涉及智能交通及车联网技术领域。具体实现方案为:响应于车辆当前处于高架桥区的岔路口,获取车辆上惯性传感器在车辆行进第一距离过程中所测量的惯性数据;获取车辆上图像采集装置在车辆行进第二距离过程中所采集的图像数据;基于二级识别模型对图像数据进行分类识别,以得到图像数据的图像识别结果;根据惯性数据和图像识别结果,识别车辆当前是位于高架桥上还是位于高架桥下。本申请可以准确识别出当前是位于高架桥上还是高架桥下,进而自动规划路线,避免手动切换上下高架路线,提高了导航的准确性。
-
公开(公告)号:CN113112984B
公开(公告)日:2024-10-11
申请号:CN202010031260.0
申请日:2020-01-13
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Inventor: 程高飞
IPC: G10L13/02 , G10L13/047 , G10L13/08
Abstract: 本申请公开了智能音箱的控制方法、装置、设备及存储介质,涉及语音技术领域。具体实现方案为:通过终端设备根据预设文本长度,将待播放文本进行分段;将分段文本依次发送给服务端,以由服务端将接收到的分段文本转换成音频,并发送给智能音箱进行播放。本实施例中通过将待播放文本进行分段,可在每一段分段文本转换为音频后即进行音频播放,而不需要智能音箱等待该待播放文本全部转换成音频才能进行播放,提高响应速度,且便于随时停止文本转换音频、随时停止播放;将文本转换成音频的过程由服务端完成,降低了终端设备的系统资源消耗和电量消耗;并且智能音箱播放分段文本的音频,不占用终端设备的音频通道,不影响终端设备进行其他音频的播放。
-
公开(公告)号:CN118741264A
公开(公告)日:2024-10-01
申请号:CN202411074614.4
申请日:2024-08-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/81 , H04N21/488 , H04N21/466
Abstract: 本公开提供了一种生成视频的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大语言模型、生成模型、图像处理等领域。具体实现方案为:获取主题、目标风格和N个输入图像,N是大于等于1的整数;将N个输入图像转换为符合目标风格的N个图像;根据主题和N个输入图像,确定故事文本;其中,故事文本包括具有顺序的N个子文本,且N个子文本与N个图像相对应;以及基于目标视频模板处理N个图像和N个子文本,得到视频;其中,N个图像在视频中的顺序与N个子文本的顺序一致。
-
公开(公告)号:CN118733691A
公开(公告)日:2024-10-01
申请号:CN202410741174.7
申请日:2024-06-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种POI数据修正方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及数据处理领域,尤其涉及电子地图、智能交通技术领域。实现方案为:确定待修正的包括主点信息和子点信息的POI数据,子点信息包括一个或多个第一可通行节点的第一坐标;获取与主点信息相关联的兴趣面数据;基于兴趣面的边框信息确定与兴趣面空间位置相对应的路网数据,路网数据包括至少一个第二可通行节点的第二坐标;基于第一坐标和第二坐标,确定第一可通行节点与第二可通行节点之间的匹配关系;对一个或多个第一可通行节点进行修正以获得修正后的至少一个第一可通行节点。修正后的至少一个第一可通行节点与至少一个第二可通行节点的数量和坐标均一致。
-
公开(公告)号:CN118733613A
公开(公告)日:2024-10-01
申请号:CN202411001729.0
申请日:2024-07-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/242 , G06F16/2455 , G06F16/248 , G06F16/22 , G06F16/25 , G06F16/332 , G06F16/951 , G06V30/19
Abstract: 本公开提供了一种数据处理方法,涉及人工智能技术领域,尤其涉及大模型、深度学习、自然语言处理、计算机视觉技术领域。具体实现方案为:响应于接收到针对输入数据的查询文本,获取输入数据的数据结构,其中,数据结构包括多个层级的节点,每个节点包含输入数据的内容;从数据结构中获取内容为文本的节点所包含的目标文本;以及基于查询文本和目标文本,确定输出数据。本公开还提供了一种数据处理装置、电子设备和存储介质。
-
公开(公告)号:CN118714397A
公开(公告)日:2024-09-27
申请号:CN202410704445.1
申请日:2024-05-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 谢校康
IPC: H04N21/44 , H04N21/439
Abstract: 本公开提供了一种生成视频的方法、装置、设备和介质,涉及人工智能技术领域,尤其自然语言处理、计算机视觉和深度学习等技术领域。该方法包括:确定多个用户之间的多个用户互动内容,多个用户互动内容各自具有对应的用户互动关系;基于多个用户互动内容和多个用户互动内容各自对应的用户互动关系,利用大语言模型生成视频剧本,视频剧本包括与多个用户对应的多个角色和多个台词,多个台词包括多个角色各自的至少一个台词,并且多个台词各自具有对应的角色互动关系;基于视频剧本,获取与多个台词分别对应的视觉素材和音频;以及基于与多个台词分别对应的视觉素材和音频,生成目标视频。
-
-
-
-
-
-
-
-
-