发明授权

  • 专利标题: 对书写体系和语言的检测
  • 专利标题(英): Detecting writing systems and languages
  • 申请号: CN201080024183.0
    申请日: 2010-05-19
  • 公开(公告)号: CN102483743B
    公开(公告)日: 2015-01-07
  • 发明人: 理查德·L·赛茨
  • 申请人: 谷歌公司
  • 申请人地址: 美国加利福尼亚州
  • 专利权人: 谷歌公司
  • 当前专利权人: 谷歌公司
  • 当前专利权人地址: 美国加利福尼亚州
  • 代理机构: 北京集佳知识产权代理有限公司
  • 代理商 陈炜; 李德山
  • 优先权: 12/479,522 2009.06.05 US
  • 国际申请: PCT/US2010/035413 2010.05.19
  • 国际公布: WO2010/141219 EN 2010.12.09
  • 进入国家日期: 2011-12-01
  • 主分类号: G06F17/27
  • IPC分类号: G06F17/27
对书写体系和语言的检测
摘要:
公开了用于检测书写体系和语言的方法、系统和设备(包括计算机程序产品)。在一种实现方式中,提供了一种方法。该方法包括:接收文本;检测文本的第一分段,其中,大量的第一分段表示第一语言;检测文本的第二分段,其中,大量的第二分段表示第二语言;识别文本中包括的每一个大小为x的n元字串的得分;并且,基于得分的变化来检测边缘,边缘标识文本中从第一语言向第二语言的过渡。
公开/授权文献
0/0