-
公开(公告)号:CN101620680B
公开(公告)日:2014-06-25
申请号:CN200810135701.0
申请日:2008-07-03
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 一种对图像或视频中的字符进行识别和翻译的方法和装置,所述方法包括步骤:获取包含一个或多个第一语言字符的图像或视频;从图像或者视频中检测每个第一语言字符的字符区域;对每个字符区域中的字符进行识别;将由识别出的字符构成的词条划分为多个预定类别之一,并采用与所划分的类别相对应的翻译规则,将词条翻译为第二或更多其他语言;以及显示翻译结果。采用本发明,能够方便快捷地通过移动终端自动识别和翻译自然场景图像或视频中的关键字符,比如路牌、广告、公告、菜单等中的相关说明。
-
公开(公告)号:CN111738401A
公开(公告)日:2020-10-02
申请号:CN201910228917.X
申请日:2019-03-25
Applicant: 北京三星通信技术研究有限公司 , 三星电子株式会社
Abstract: 本申请提供了一种模型优化方法、分组压缩方法、相应的装置、设备。该模型优化方法包括:确定待优化模型中设定隐藏层的压缩参数;根据设定隐藏层的压缩参数,对待优化模型进行压缩处理,得到优化后的模型。本申请提供的技术方案,能够降低模型所占用的空间和内存,达到精简模型的目的,从而提高模型的运行速度。
-
公开(公告)号:CN101533474A
公开(公告)日:2009-09-16
申请号:CN200810083575.9
申请日:2008-03-12
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 一种基于视频或多幅图像的图像拼接方法,包括步骤:a)获取包括文本的视频帧或图像;b)从连续的视频帧或多幅图像中选取视频帧或图像;c)从步骤b)选取的视频帧或图像中提取文本区域或去除背景区域;d)拼接连续的视频帧或图像,或拼接连续的视频帧或图像的字符识别结果。通过本发明可以提高OCR系统的运用范围,从传统的单一图像到连续的视频信号,特别是一些特殊的OCR应用系统,比如基于视频的名片识别。
-
公开(公告)号:CN101667251A
公开(公告)日:2010-03-10
申请号:CN200810215861.6
申请日:2008-09-05
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
IPC: G06K9/20
Abstract: 一种具备辅助定位功能的OCR识别方法,包括步骤:对目标进行拍摄并捕获到包含文字的图像;对所述图像区域进行搜索,检测出一个或多个文本区域;选择特定文本区域;对被选择的特定文本区域中的文字进行识别。通过使用本发明的方法和装置,用户可以自动地获得图像中的文本区域,通过交互的方式得到用户感兴趣的文本区域,以此来进行文字识别和翻译等应用。本发明可以运用到普通的文字场景,比如路牌,公告,报纸等的自动识别和翻译,特别适合于带照相功能的移动终端。本发明能够方便用户的使用,不需要复杂的辅助操作和交互,缩小图像的搜索范围,自动地得到用户感兴趣的文本区域,减少系统的计算运行时间,以及可以提高定位的准确率。
-
-
公开(公告)号:CN101620680A
公开(公告)日:2010-01-06
申请号:CN200810135701.0
申请日:2008-07-03
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 一种对图像或视频中的字符进行识别和翻译的方法和装置,所述方法包括步骤:获取包含一个或多个第一语言字符的图像或视频;从图像或者视频中检测每个第一语言字符的字符区域;对每个字符区域中的字符进行识别;将由识别出的字符构成的词条划分为多个预定类别之一,并采用与所划分的类别相对应的翻译规则,将词条翻译为第二或更多其他语言;以及显示翻译结果。采用本发明,能够方便快捷地通过移动终端自动识别和翻译自然场景图像或视频中的关键字符,比如路牌、广告、公告、菜单等中的相关说明。
-
公开(公告)号:CN101667251B
公开(公告)日:2014-07-23
申请号:CN200810215861.6
申请日:2008-09-05
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
IPC: G06K9/20
Abstract: 一种具备辅助定位功能的OCR识别方法,包括步骤:对目标进行拍摄并捕获到包含文字的图像;对所述图像区域进行搜索,检测出一个或多个文本区域;选择特定文本区域;对被选择的特定文本区域中的文字进行识别。通过使用本发明的方法和装置,用户可以自动地获得图像中的文本区域,通过交互的方式得到用户感兴趣的文本区域,以此来进行文字识别和翻译等应用。本发明可以运用到普通的文字场景,比如路牌,公告,报纸等的自动识别和翻译,特别适合于带照相功能的移动终端。本发明能够方便用户的使用,不需要复杂的辅助操作和交互,缩小图像的搜索范围,自动地得到用户感兴趣的文本区域,减少系统的计算运行时间,以及可以提高定位的准确率。
-
公开(公告)号:CN101533474B
公开(公告)日:2014-06-04
申请号:CN200810083575.9
申请日:2008-03-12
Applicant: 三星电子株式会社 , 北京三星通信技术研究有限公司
Abstract: 一种基于视频或多幅图像的图像拼接方法,包括步骤:a)获取包括文本的视频帧或图像;b)从连续的视频帧或多幅图像中选取视频帧或图像;c)从步骤b)选取的视频帧或图像中提取文本区域或去除背景区域;d)拼接连续的视频帧或图像,或拼接连续的视频帧或图像的字符识别结果。通过本发明可以提高OCR系统的运用范围,从传统的单一图像到连续的视频信号,特别是一些特殊的OCR应用系统,比如基于视频的名片识别。
-
-
-
-
-
-
-