发明授权
CN102483743B 对书写体系和语言的检测
失效 - 权利终止
- 专利标题: 对书写体系和语言的检测
- 专利标题(英): Detecting writing systems and languages
-
申请号: CN201080024183.0申请日: 2010-05-19
-
公开(公告)号: CN102483743B公开(公告)日: 2015-01-07
- 发明人: 理查德·L·赛茨
- 申请人: 谷歌公司
- 申请人地址: 美国加利福尼亚州
- 专利权人: 谷歌公司
- 当前专利权人: 谷歌公司
- 当前专利权人地址: 美国加利福尼亚州
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 陈炜; 李德山
- 优先权: 12/479,522 2009.06.05 US
- 国际申请: PCT/US2010/035413 2010.05.19
- 国际公布: WO2010/141219 EN 2010.12.09
- 进入国家日期: 2011-12-01
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
公开了用于检测书写体系和语言的方法、系统和设备(包括计算机程序产品)。在一种实现方式中,提供了一种方法。该方法包括:接收文本;检测文本的第一分段,其中,大量的第一分段表示第一语言;检测文本的第二分段,其中,大量的第二分段表示第二语言;识别文本中包括的每一个大小为x的n元字串的得分;并且,基于得分的变化来检测边缘,边缘标识文本中从第一语言向第二语言的过渡。
公开/授权文献
- CN102483743A 对书写体系和语言的检测 公开/授权日:2012-05-30