-
公开(公告)号:CN118537446A
公开(公告)日:2024-08-23
申请号:CN202410564728.0
申请日:2024-05-08
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T11/60 , G06F40/279 , G06F18/25 , G06N5/04
Abstract: 本公开提供了演示文稿的自动配图方法、装置、设备以及存储介质,本公开涉及数据处理技术领域,尤其涉及人工智能、深度学习、自然语言理解等技术领域。具体实现方案为:从演示文稿的待配图页面中提取出多路描述语句;为每路描述语句分别匹配对应的候选图像,得到候选图像集;确定候选图像集中各候选图像与待配图页面的匹配度;基于各候选图像与待配图页面的匹配度,为待配图页面筛选出目标图像,作为待配图页面的插图。本公开实施例中,通过提取多路描述语句,能够逐步自动准确的为待配图页面筛选出合适的插图。
-
公开(公告)号:CN118410779A
公开(公告)日:2024-07-30
申请号:CN202410480787.X
申请日:2024-04-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/166 , G06F40/186 , G06V30/10
Abstract: 本申请公开了文本生成方法、装置、电子设备及存储介质,涉及计算机领域,尤其涉及深度学习、大模型等人工智能领域。具体实现方案为:获取目标图片及目标图片对应的目标内容类别;其中,目标内容类别是目标图片的待生成文本的内容类别;响应于检测到文本生成操作,向服务器发送文本生成请求;其中,文本生成请求中包括目标图片和目标内容类别对应的提示文本;接收服务器发送的目标文本,并展示目标文本;其中,目标文本是采用大模型对目标图片及提示文本进行处理生成的目标内容类别的文本。
-
公开(公告)号:CN118379382A
公开(公告)日:2024-07-23
申请号:CN202410525580.X
申请日:2024-04-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种基于场景的图像生成方法、装置、设备及存储介质,涉及人工智能领域,尤其涉及图像处理领域。具体实现方案为:获取待生成图像的场景需求信息;其中,所述场景需求信息表征图像所描述的场景;根据所述待生成图像的场景需求信息,确定所述待生成图像的图像信息;其中,所述图像信息表征待生成图像中的对象的轮廓信息和待生成图像的图像风格;根据所述待生成图像的图像信息,生成所述待生成图像。实现自动生成不同场景内容的配图,提高图像的生成效率和精度。
-
-