发明授权
- 专利标题: 古籍中文字的校对方法、系统及校对服务器
-
申请号: CN201310222804.1申请日: 2013-06-05
-
公开(公告)号: CN103257954B公开(公告)日: 2016-08-10
- 发明人: 詹君
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦三层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦三层
- 代理机构: 北京清亦华知识产权代理事务所
- 代理商 宋合成
- 主分类号: G06F17/21
- IPC分类号: G06F17/21 ; G06K9/20
摘要:
本发明提出一种古籍中文字的校对方法,包括:校对服务器获得古籍图像并将古籍图像切分为多个字图像块;对每个字图像块进行识别,计算每个字图像块与标准字之间的相似度;当字图像块与标准字之间的相似度小于等于第一预设值且大于第二预设值时,对对应的字图像块进行聚类,并将对应的字图像块存储至标准字为索引的至少一个待选集合中;将待选集合中的字图像块及待选集合对应的索引提供至客户端,以供客户端的用户进行判断;根据用户的判断结果对待选集合中的字图像块进行校对。本发明的实施例可有效地提高古籍图像中每个字图像块对应的文字识别的正确率,保证古籍图像的翻译质量。本发明还提出了一种古籍中文字的校对系统及校对服务器。
公开/授权文献
- CN103257954A 古籍中文字的校对方法、系统及校对服务器 公开/授权日:2013-08-21