-
公开(公告)号:CN114399769B
公开(公告)日:2022-08-02
申请号:CN202210279539.X
申请日:2022-03-22
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V10/82 , G06V10/764 , G06N3/08
Abstract: 本公开提供了一种文本识别模型的训练方法、文本识别方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别等场景。方案为:对获取到的第一样本图像中的部分图像进行掩码预测,得到与第一样本图像对应的预测完整图像,对获取到的第二样本图像中的部分文本进行掩码预测,得到与部分文本对应的预测文本内容,根据预测完整图像和预测文本内容训练得到预训练模型,并根据预训练模型生成文本识别模型,文本识别模型用于对待识别图像进行文本识别,使得预训练模型学习到较强的图像视觉推理能力和文本语义推理能力,从而当基于预训练模型生成的文本识别模型进行文本识别时,提高文本识别的准确性和可靠性。
-
公开(公告)号:CN114612651A
公开(公告)日:2022-06-10
申请号:CN202210239359.9
申请日:2022-03-11
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/25 , G06V10/26 , G06V10/28 , G06V10/774 , G06V20/62 , G06V30/146 , G06V30/148 , G06V30/162 , G06V30/19
Abstract: 本公开提供了ROI检测模型训练方法、检测方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术。具体实现方案为:对样本图像进行特征提取,得到样本特征数据;对样本特征数据进行非线性映射,得到第一特征数据和第二特征数据;根据第一特征数据在标签ROI的关联区域中的第三特征数据和第二特征数据,确定区域间差异数据;根据区域间差异数据和标签ROI的关联区域,调整ROI检测模型的待训练参数。根据本公开的技术,提高了ROI检测模型的检测精度。
-
公开(公告)号:CN114332590A
公开(公告)日:2022-04-12
申请号:CN202210218587.8
申请日:2022-03-08
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种联合感知模型训练、联合感知方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像识别和深度学习技术。具体实现方案为:获取样本图像和样本图像的感知标签;获取预设的联合感知模型;联合感知模型包括特征提取网络和联合感知网络;通过特征提取网络对样本图像进行特征提取,得到目标样本特征;通过联合感知网络根据目标样本特征进行联合感知,得到感知预测结果;根据感知预测结果和感知标签,对预设的联合感知模型进行训练;其中,联合感知包括执行至少两种感知任务。根据本公开的技术,减少了联合感知过程的数据运算量,提高了计算效率。
-
-