一种基于内容的图像格式中文文档检索方法

    公开(公告)号:CN101866366B

    公开(公告)日:2012-01-18

    申请号:CN201010226787.5

    申请日:2010-07-15

    Abstract: 一种基于内容的图像格式中文文档检索方法,它涉及信息处理技术领域,它解决了现有的基于OCR技术的检索方法不能有效处理字符退化严重的图像格式文档的问题。本发明首先对图像格式文档进行字符分割,得到单个字符图像;然后提取字符图像特征矢量;接着基于局部敏感哈希变换原理LSH,构建hash函数,将每个字符图像特征矢量变换为伪码,并建立字符标引数据库;然后输入查询关键词,并获得所述查询关键词的伪码表示,再将查询关键词的伪码与字符标引数据库中伪码进行字符相似度比较,进而获取查询关键词的所有相似词,并按照其在文档中出现的先后顺序输出相似词,完成检索。本发明适用于图像格式的中文文档检索。

    一种印刷体字符图像样本的自动生成方法

    公开(公告)号:CN102184383A

    公开(公告)日:2011-09-14

    申请号:CN201110096820.1

    申请日:2011-04-18

    Abstract: 一种印刷体字符图像样本的自动生成方法,它涉及字符图像样本的自动生成方法。本发明解决了现有的字符采集方法分割精度低,需人工校验,从而造成样本采集速度慢的技术问题。本发明:将印刷体字符处理成样本字符,设计带有定位区的文档模板,将样本字符输到文档模板的字符区,转换为PDF格式后打印纸质文档,再扫描或照相后,得到实际图像;将PDF格式文档变换为图像,得到理想图像;再从PDF格式文档中抽取字符的位置信息,得到理想图像的字符基准;将理想图像与实际图像配准,建立两幅图像的映射关系,根据射影变换模型将理想图像的字符位置信息映射到实际图像中,将字符图像提取出来,编码保存。本发明适于任何语种的印刷体字符图像。

    一种基于内容的图像格式中文文档检索方法

    公开(公告)号:CN101866366A

    公开(公告)日:2010-10-20

    申请号:CN201010226787.5

    申请日:2010-07-15

    Abstract: 一种基于内容的图像格式中文文档检索方法,它涉及信息处理技术领域,它解决了现有的基于OCR技术的检索方法不能有效处理字符退化严重的图像格式文档的问题。本发明首先对图像格式文档进行字符分割,得到单个字符图像;然后提取字符图像特征矢量;接着基于局部敏感哈希变换原理LSH,构建hash函数,将每个字符图像特征矢量变换为伪码,并建立字符标引数据库;然后输入查询关键词,并获得所述查询关键词的伪码表示,再将查询关键词的伪码与字符标引数据库中伪码进行字符相似度比较,进而获取查询关键词的所有相似词,并按照其在文档中出现的先后顺序输出相似词,完成检索。本发明适用于图像格式的中文文档检索。

    基于局部线性嵌入法构建狗左心室传导系统三维几何结构

    公开(公告)号:CN101650835B

    公开(公告)日:2011-09-28

    申请号:CN200910072846.5

    申请日:2009-09-09

    CPC classification number: G06K9/20

    Abstract: 一种基于局部线性嵌入法构建狗左心室传导系统的三维几何结构,具体涉及一种将平面图像映射成曲面图像的方法。本发明由下述步骤完成心室传导系统的构建:首先,将狗的左心室三维几何构形运用LLE算法映射到平面,记为心室传导系统的二维线状图;然后,将真实的心室传导系统的二维平面图中的传导系统提取出来并与其整合到新的图中;最后,将整合后的新图,再一次运用LLE算法映射到左心室的三维几何构型中,从而得到左心室传导系统的三维几何结构。本发明具有保持空间结构的局部线性特征的优势,同时兼顾高效快速的特点,并利用真实的数据,反应了较为真实的狗的左心室传导系统。

    一种印刷体字符图像样本的自动生成方法

    公开(公告)号:CN102184383B

    公开(公告)日:2013-04-10

    申请号:CN201110096820.1

    申请日:2011-04-18

    Abstract: 一种印刷体字符图像样本的自动生成方法,它涉及字符图像样本的自动生成方法。本发明解决了现有的字符采集方法分割精度低,需人工校验,从而造成样本采集速度慢的技术问题。本发明:将印刷体字符处理成样本字符,设计带有定位区的文档模板,将样本字符输到文档模板的字符区,转换为PDF格式后打印纸质文档,再扫描或照相后,得到实际图像;将PDF格式文档变换为图像,得到理想图像;再从PDF格式文档中抽取字符的位置信息,得到理想图像的字符基准;将理想图像与实际图像配准,建立两幅图像的映射关系,根据射影变换模型将理想图像的字符位置信息映射到实际图像中,将字符图像提取出来,编码保存。本发明适于任何语种的印刷体字符图像。

    基于局部线性嵌入法构建狗左心室传导系统三维几何结构

    公开(公告)号:CN101650835A

    公开(公告)日:2010-02-17

    申请号:CN200910072846.5

    申请日:2009-09-09

    CPC classification number: G06K9/20

    Abstract: 一种基于局部线性嵌入法构建狗左心室传导系统的三维几何结构,具体涉及一种将平面图像映射成曲面图像的方法。本发明由下述步骤完成心室传导系统的构建:首先,将狗的左心室三维几何构形运用LLE算法映射到平面,记为心室传导系统的二维线状图;然后,将真实的心室传导系统的二维平面图中的传导系统提取出来并与其整合到新的图中;最后,将整合后的新图,再一次运用LLE算法映射到左心室的三维几何构型中,从而得到左心室传导系统的三维几何结构。本发明具有保持空间结构的局部线性特征的优势,同时兼顾高效快速的特点,并利用真实的数据,反应了较为真实的狗的左心室传导系统。

Patent Agency Ranking