-
公开(公告)号:CN104881669A
公开(公告)日:2015-09-02
申请号:CN201510243968.1
申请日:2015-05-13
Applicant: 中国科学院计算技术研究所
IPC: G06K9/46
CPC classification number: G06K9/4652
Abstract: 本发明公开了一种基于颜色对比度的局部区域检测子提取方法及系统,涉及图像检索、图像识别、对象跟踪检测领域,该方法包括获取图像,并对所述图像的四个角进行尺度选择,通过二维信息熵值的局部极小值选取所述图像的图像背景的最佳尺度,根据所述最佳尺度,建立背景RGB三通道高斯混合模型;对所述图像中每个像素点建立RGB三通道高斯混合模型,并根据每个所述像素点的RGB三通道高斯混合模型与所述背景RGB三通道高斯混合模型的KL距离,更新所述图像的颜色对比度排序;根据所述颜色对比度排序,通过分水岭的区域检测方式检测对比度一致的区域,所述区域为所述局部区域检测子。本发明提取检测子速度快,内存占用少。
-
公开(公告)号:CN114266244A
公开(公告)日:2022-04-01
申请号:CN202111610175.0
申请日:2021-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06F40/232 , G06F40/268 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种生成用于单字错别字识别模型的训练集的方法,包括:S1、获取语料库,对语料库中的各语句进行分词处理和词性标注,得到多个原始分词序列,每个原始分词序列包括多个分词项以及每个分词项的词性;S2、基于原始分词序列构建各分词项的标签,得到标签序列,其中初始的标签值指示每个分词项对应的文字是正确文字;S3、将相应原始分词序列中一个为单字的分词项替换为与相应单字相似的错误单字,得到带错字分词序列,并更改相应标签序列中单字被替换的分词项对应的标签值以指示其对应的单字为错误文字;S4、重复步骤S3,构建包括多个样本的训练集,每个样本包括分词序列及对应的标签序列,分词序列为原始分词序列或者带错字分词序列。
-