-
公开(公告)号:CN109635808B
公开(公告)日:2023-01-17
申请号:CN201811294643.6
申请日:2018-11-01
Applicant: 中国科学院信息工程研究所
IPC: G06V30/19 , G06V10/82 , G06V30/148
Abstract: 本发明公开一种在自然场景图像中对中文关键词及上下文的提取方法,步骤包括:准备一个合适的中文数据集及物体检测分类模型,调整现有标注,对中文逐一文字进行标注;对图片进行中文文字检测,基于物体检测分类模型,将中文文字作为不同类别进行检测分类将;通过计算自定义的匹配系数,从物体检测分类结果中提取关键词,通过不断更新锚点关键词和生成候选直线的方式提取上下文信息。本发明在中文文字关键词及上下文识别上有高精度高召回的效果。
-
公开(公告)号:CN109117836A
公开(公告)日:2019-01-01
申请号:CN201810729838.2
申请日:2018-07-05
Applicant: 中国科学院信息工程研究所
IPC: G06K9/32
Abstract: 本发明公开一种基于焦点损失函数的自然场景下文字检测定位方法和装置。该方法首先对标注的数据进行预处理,然后构造文本检测定位网络,然后引用聚焦损失函数作为训练过程损失函数的一部分,然后对待检测的自然场景图片进行检测。该方法通过调整现有标注使标注更加适合所设计的文字检测网络;基于FCN网络将多卷积层进行合并,使之更加符合文字检测任务;通过引入聚焦损失函数在训练过程中平衡正负样本,提高检测精度。本发明能够在文字检测定位上取得高精度高召回的效果。
-
公开(公告)号:CN109635808A
公开(公告)日:2019-04-16
申请号:CN201811294643.6
申请日:2018-11-01
Applicant: 中国科学院信息工程研究所
CPC classification number: G06K9/344 , G06K9/6256 , G06K9/6268 , G06K2209/01
Abstract: 本发明公开一种在自然场景图像中对中文关键词及上下文的提取方法,步骤包括:准备一个合适的中文数据集及物体检测分类模型,调整现有标注,对中文逐一文字进行标注;对图片进行中文文字检测,基于物体检测分类模型,将中文文字作为不同类别进行检测分类将;通过计算自定义的匹配系数,从物体检测分类结果中提取关键词,通过不断更新锚点关键词和生成候选直线的方式提取上下文信息。本发明在中文文字关键词及上下文识别上有高精度高召回的效果。
-
公开(公告)号:CN109117836B
公开(公告)日:2022-05-24
申请号:CN201810729838.2
申请日:2018-07-05
Applicant: 中国科学院信息工程研究所
IPC: G06V10/25
Abstract: 本发明公开一种基于焦点损失函数的自然场景下文字检测定位方法和装置。该方法首先对标注的数据进行预处理,然后构造文本检测定位网络,然后引用聚焦损失函数作为训练过程损失函数的一部分,然后对待检测的自然场景图片进行检测。该方法通过调整现有标注使标注更加适合所设计的文字检测网络;基于FCN网络将多卷积层进行合并,使之更加符合文字检测任务;通过引入聚焦损失函数在训练过程中平衡正负样本,提高检测精度。本发明能够在文字检测定位上取得高精度高召回的效果。
-
-
-