-
公开(公告)号:CN116503686B
公开(公告)日:2024-07-02
申请号:CN202310318509.X
申请日:2023-03-28
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06T5/00
Abstract: 本公开提供了图像矫正模型的训练方法、图像矫正方法、装置及介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域。具体实现方案为:将扭曲图输入图像矫正模型,得到图像矫正模型输出的偏移图;基于偏移图矫正扭曲图的前背景分割图,得到已矫正分割图;基于偏移图和标准偏移图之间的第一损失,以及已矫正分割图和标准分割图之间的第二损失,确定目标损失;基于目标损失调整图像矫正模型的参数。本公开实施例中,基于第一损失使得图像矫正模型输出的偏移图能够关心图像中心区域,基于第二损失使得偏移图能够适应复杂的背景和边缘的形变,由此训练得到的图像矫正模型,具有很好的泛化能力和鲁棒性。
-
公开(公告)号:CN116110054A
公开(公告)日:2023-05-12
申请号:CN202310116117.5
申请日:2023-02-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/16 , G06V30/146 , G06V10/82
Abstract: 本公开提供了一种文档矫正模型的训练及图像矫正方法、装置、设备和介质,涉及深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。具体实现方案为:采用文档矫正模型对样本文档图像进行矫正,以得到目标文档图像;对目标文档图像进行文本行检测,得到至少一个文本行的中心线;根据以下至少一项对文档矫正模型进行训练:目标文档图像中同一中心线上各像素点的图像坐标之间的差异、不同中心线上处于同一排列位置的像素点的图像坐标之间的差异。由此,可实现基于文本行中心线上的各像素点,约束模型矫正后的文档图像上的文本行的中心线方向与文档图像的阅读方向匹配,以提升文档图像的矫正效果,提升文档图像矫正还原的准确度。
-
公开(公告)号:CN115983456A
公开(公告)日:2023-04-18
申请号:CN202211657018.X
申请日:2022-12-22
Applicant: 国能榆林能源有限责任公司 , 北京百度网讯科技有限公司
IPC: G06Q10/04 , G06Q10/0631 , G06Q10/10 , G06Q50/30
Abstract: 本申请提供了一种煤矿辅助运输的全局优化方法和计算机可读存储介质。该方法包括:获取审批流程信息和运输需求,审批流程信息是与运输过程的工单的审批顺序有关的信息;根据审批流程信息,对运输过程的审批顺序进行优化,得到优化后的审批顺序;按照优化后的审批顺序对运输需求进行审批,得到审批结果,并在审批结果表征审批通过的情况下,根据运输需求对运输过程进行优化,得到优化后的运输过程。该方案中,对审批顺序进行不断优化,可以简化审批流程,可以通过智能化的方式进行审批,对于运输过程的资源调度也是可以进行优化的,即对煤矿辅助运输的整个过程进行全局优化,进而可以提高矿井辅助运输的效率。
-
公开(公告)号:CN116416159A
公开(公告)日:2023-07-11
申请号:CN202310389889.6
申请日:2023-04-12
Applicant: 北京百度网讯科技有限公司
IPC: G06T5/00 , G06T7/194 , G06V30/16 , G06V30/148 , G06V30/41 , G06V10/82 , G06N3/0455
Abstract: 本公开提供了一种图像矫正方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于OCR、智慧政务等场景。实现方案为:获取待矫正图像;确定所述待矫正图像的形变图像特征,其中,所述形变图像特征指示所述待矫正图像发生的形变的类型和程度;对所述待矫正图像进行前背景分割,以得到所述待矫正图像的背景信息;根据所述形变图像特征和所述背景信息对所述待矫正图像进行后向预测,以得到所述待矫正图像的后向图;以及基于所述后向图对所述待矫正图像进行矫正。
-
公开(公告)号:CN115933390A
公开(公告)日:2023-04-07
申请号:CN202211497248.4
申请日:2022-11-25
Applicant: 国能榆林能源有限责任公司 , 北京百度网讯科技有限公司
IPC: G05B13/04
Abstract: 本申请提供了一种路口控制策略的确定方法及装置、处理器以及电子设备,通过获取目标路口预设时间段内的交通数据,其中,交通数据至少包括目标路口的通行数据以及路口流量数据;控制交通数据输入至目标值网络,以得到目标值网络输出路口对应的目标控制策略,其中,目标控制策略至少包括目标路口的交通信号灯的控制动作,目标值网络为目标路口设置的目标智能单体对应的值网络,解决了现有技术中井下路口交通信号灯主要通过人工手动控制,导致交通信号灯规则在面对灵活多变的井下运输情况时过于死板、僵硬的问题。
-
公开(公告)号:CN118643342A
公开(公告)日:2024-09-13
申请号:CN202410875590.6
申请日:2024-07-01
Applicant: 北京百度网讯科技有限公司
IPC: G06F18/214 , G06F18/25 , G06F16/58
Abstract: 本公开提供了一种样本对生成、大模型的训练、图像检索方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于OCR等场景。该样本对生成方法包括:对图像样本进行处理,得到对象信息;根据提示词信息和对象信息,生成图像说明文本,其中,提示词信息包括系统提示信息和任务提示信息,图像说明文本用于描述图像样本的属性;以及,根据图像样本和图像说明文本,生成样本对。
-
公开(公告)号:CN116503686A
公开(公告)日:2023-07-28
申请号:CN202310318509.X
申请日:2023-03-28
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06T5/00
Abstract: 本公开提供了图像矫正模型的训练方法、图像矫正方法、装置及介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域。具体实现方案为:将扭曲图输入图像矫正模型,得到图像矫正模型输出的偏移图;基于偏移图矫正扭曲图的前背景分割图,得到已矫正分割图;基于偏移图和标准偏移图之间的第一损失,以及已矫正分割图和标准分割图之间的第二损失,确定目标损失;基于目标损失调整图像矫正模型的参数。本公开实施例中,基于第一损失使得图像矫正模型输出的偏移图能够关心图像中心区域,基于第二损失使得偏移图能够适应复杂的背景和边缘的形变,由此训练得到的图像矫正模型,具有很好的泛化能力和鲁棒性。
-
-
-
-
-
-