使用上下文无关文法的文本规范化方法

    公开(公告)号:CN1255224A

    公开(公告)日:2000-05-31

    申请号:CN98804789.6

    申请日:1998-04-03

    Applicant: 微软公司

    CPC classification number: G06F17/271 G06F17/2765 G10L15/1815 G10L15/26

    Abstract: 一种文本规范化器(38),对从语音识别器(32)输出的文本进行规范化。文本的规范化所产生的文本(50),对文本的接收者来说是不太难处理的并且是更为惯用的。文本(50)可以被规范化而包括音频内容(58),视频内容(56),或者音频和视频内容的组合。文本(50)也可以被规范化而产生超文本文件(60)。文本的规范化是使用上下文无关文法进行的。上下文无关文法包括一些规定如何将文本规范化的规则。上下文无关文法可以被组成树形,用以对文本进行语法分析并使规范化简单易行。上下文无关文法是可扩充的并易于改变。

    使用上下文无关文法的文本规范化方法

    公开(公告)号:CN1285068C

    公开(公告)日:2006-11-15

    申请号:CN98804789.6

    申请日:1998-04-03

    Applicant: 微软公司

    CPC classification number: G06F17/271 G06F17/2765 G10L15/1815 G10L15/26

    Abstract: 一种文本规范化器(38),对从语音识别器(32)输出的文本进行规范化。文本的规范化所产生的文本(50),对文本的接收者来说是不太难处理的并且是更为惯用的。文本(50)可以被规范化而包括音频内容(58),视频内容(56),或者音频和视频内容的组合。文本(50)也可以被规范化而产生超文本文件(60)。文本的规范化是使用上下文无关文法进行的。上下文无关文法包括一些规定如何将文本规范化的规则。上下文无关文法可以被组成树形,用以对文本进行语法分析并使规范化简单易行。上下文无关文法是可扩充的并易于改变。

Patent Agency Ranking