-
公开(公告)号:CN119031211A
公开(公告)日:2024-11-26
申请号:CN202411170414.9
申请日:2024-08-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/854 , G06T3/04 , G06F40/211 , G06F40/30
Abstract: 本公开提供了一种生成视频的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大语言模型、生成模型、图像处理等领域。具体实现方案为:响应于接收到输入信息,将输入信息中的N个输入图像转换为符合输入信息中的目标风格的N个图像;N是大于等于1的整数;根据N个输入图像,确定故事文本;其中,故事文本包括与N个图像相对应N个子文本;根据N个图像和N个子文本,确定初始视频;其中,初始视频包括多个页面,每个页面包括图像和子文本;以及响应于确定针对多个页面中目标页面中的字符的修改操作,根据修改后的字符的字符属性或修改后的目标页面的页面图像更新初始视频,得到目标视频;其中,字符包括目标页面中的子文本。
-
公开(公告)号:CN110738997A
公开(公告)日:2020-01-31
申请号:CN201911025095.1
申请日:2019-10-25
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种信息修正方法、装置、电子设备及存储介质,涉及语音识别技术。具体实现方案为:获取与用户当前输入的交互语音匹配的语音识别结果,并在所述语音识别结果中进行实体识别,得到实体特征信息;根据最近一次获取的历史语音识别结果,以及所述语音识别结果,生成前后句关联信息;根据所述前后句关联信息,以及所述实体特征信息,获取与所述历史语音识别结果匹配的澄清修正信息。本申请实施例实现了只需通过输入语音即可修改上一次历史语音识别结果中因口误、同音问题语音识别错误的字或词,避免了用户手动输入修改,提升了修改效率,使得语音交互过程更加自然。
-
公开(公告)号:CN108122012B
公开(公告)日:2020-11-24
申请号:CN201711458883.0
申请日:2017-12-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62
Abstract: 本发明公开了一种常驻点中心点的确定方法、装置、设备。其中,所述方法包括:获取存储的用户轨迹坐标点集合;确定所述集合中的轨迹坐标点的邻域坐标点,并统计所述轨迹坐标点的邻域坐标点的数量;根据所述邻域坐标点的数量选取轨迹坐标点,并将选取的轨迹坐标点作为常驻点核心点;如果任一轨迹坐标点及其邻域坐标点均为常驻点核心点,则将所述轨迹坐标点与其邻域坐标点进行合并,将合并的结果作为常驻点中心点。可以基于用户轨迹的各个坐标点的位置分布情况确定常驻点中心点,能够基于少量位置坐标点得到常驻点中心点,解决了终端侧无法得到常驻点的技术问题,能够实现在终端侧确定常驻点的技术效果。
-
公开(公告)号:CN104848849A
公开(公告)日:2015-08-19
申请号:CN201510238088.5
申请日:2015-05-12
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G01C21/00 , G01C21/3438 , G01C21/3453
Abstract: 本申请公开了一种基于定位技术的目标集结地点规划方法和规划装置。其中,基于定位技术的目标集结地点规划方法包括:基于接收方接受请求方的集结请求,获取请求方的位置信息和接收方的位置信息;基于第一预定条件确定约定点列表,约定点列表包括至少一个候选约定点;生成从请求方至候选约定点的第一候选路径以及接收方至候选约定点的第二候选路径;基于第二预定条件,从候选约定点中确定目标集结地点,从第一候选路径中确定第一路径,并从第二候选路径中确定第二路径;其中,第一路径为从请求方至目标集结地点的路径,第二路径为从接收方至目标集结地点的路径。按照本申请的方案,能够得到请求方与接收方均可到达的目标集结地点和最优路径。
-
公开(公告)号:CN118411436A
公开(公告)日:2024-07-30
申请号:CN202410479684.1
申请日:2024-04-19
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 贺晓龙 , 刘超 , 申浩玉 , 张航 , 杨晨辉 , 肖彤 , 张玉 , 王凯 , 杨友存 , 张泽宇 , 孙增旺 , 张丽 , 王红海 , 孟海峰 , 马瑞强 , 罗旭 , 马睿
IPC: G06T11/00 , G06T11/60 , G06F16/583 , G06V10/75 , G06N3/0499
Abstract: 本公开提供了一种漫画生成方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及NLP、大模型、LLM、深度学习等技术领域。具体实现方案为:获取并展示多个故事分镜;其中,故事分镜是对与待生成的目标漫画关联的故事信息进行拆分得到的;响应于对多个故事分镜的确认操作,向服务端发送与目标漫画适配的目标漫画风格;其中,目标漫画风格用于服务端结合多个故事分镜,确定对象特征,并获取与对象特征匹配的至少一个角色形象;接收并展示服务端发送的角色形象,并向服务端发送基于角色形象所确定的目标形象;其中,目标形象用于服务端结合多个故事分镜和目标漫画风格,生成目标漫画;接收并展示服务端发送的目标漫画。
-
公开(公告)号:CN104992706A
公开(公告)日:2015-10-21
申请号:CN201510251387.2
申请日:2015-05-15
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/02 , G06F16/9535 , G10L15/26 , G10L17/26 , G10L25/48 , G10L25/54 , G10L2015/227
Abstract: 本发明提供了一种基于语音的信息推送方法及装置,其中的方法包括:接收语音;获取所述语音中的至少一个声音特征信息;根据所述至少一个声音特征信息将待发送的信息推送给所述语音对应的用户。通过该方法通过语音中的声音特征信息将待发送的信息进行推送,可以针对不同的用户特征进行精准的个性化服务,增加了信息推送的准确性,满足了用户的个性化需求。
-
公开(公告)号:CN102012917B
公开(公告)日:2013-02-20
申请号:CN201010560624.0
申请日:2010-11-26
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明关于处理需要产生脉络信息的新闻事件的一种信息处理装置以及处理方法。信息处理装置包括载入新闻簇信息的新闻簇信息载入模块、分析所述新闻簇信息并产生脉络信息的脉络分析模块及展示所述脉络信息的前端展示模块。本发明的信息处理装置以及处理方法工作量较小、时效性较强、清晰度较高的给出新闻事件的脉络信息。
-
公开(公告)号:CN119027528A
公开(公告)日:2024-11-26
申请号:CN202411001402.3
申请日:2024-07-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T11/00 , G06F40/166 , G06F40/284 , G10L13/08
Abstract: 本公开提供了画本生成方法、装置、设备及存储介质,涉及人工智能、大数据、图像生成等技术领域,尤其涉及文档智能编辑、智能助手、虚拟助手等领域。具体实现方案为:基于确定的主题内容,生成围绕所述主题内容的故事大纲;其中,所述故事大纲包含有围绕所述主题内容的N个段落;所述N为大于等于2的整数;对所述故事大纲所包含的N个段落中的各段落进行分镜理解,以得到针对各段落的多个提示信息;其中,段落的多个提示信息能够描述段落所针对的场景画面;基于所述N个段落中各段落的多个提示信息,得到针对各段落的图像,以得到针对所述主题内容的目标画本。
-
公开(公告)号:CN110738997B
公开(公告)日:2022-06-17
申请号:CN201911025095.1
申请日:2019-10-25
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种信息修正方法、装置、电子设备及存储介质,涉及语音识别技术。具体实现方案为:获取与用户当前输入的交互语音匹配的语音识别结果,并在所述语音识别结果中进行实体识别,得到实体特征信息;根据最近一次获取的历史语音识别结果,以及所述语音识别结果,生成前后句关联信息;根据所述前后句关联信息,以及所述实体特征信息,获取与所述历史语音识别结果匹配的澄清修正信息。本申请实施例实现了只需通过输入语音即可修改上一次历史语音识别结果中因口误、同音问题语音识别错误的字或词,避免了用户手动输入修改,提升了修改效率,使得语音交互过程更加自然。
-
公开(公告)号:CN109243425A
公开(公告)日:2019-01-18
申请号:CN201810917052.3
申请日:2018-08-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了语音识别测试方法、装置、系统、计算机设备及存储介质,其中方法可包括:服务端进行唤醒音频的播放;若接收到设备端上报的唤醒状态,则服务端进行待识别音频的播放,所述唤醒状态为设备端根据获取到的待测试智能设备输出的实时日志确定出待测试智能设备被唤醒后、向服务端上报的唤醒状态;服务端接收设备端上报的识别结果,并进行存储,所述识别结果为设备端从实时日志中获取的待测试智能设备针对待识别音频的识别结果。应用本发明所述方案,能够提升测试效率等。
-
-
-
-
-
-
-
-
-