文本语句比较装置
    21.
    发明授权

    公开(公告)号:CN100470533C

    公开(公告)日:2009-03-18

    申请号:CN03157093.3

    申请日:2003-09-12

    Inventor: 刘绍明

    CPC classification number: G06F17/2211

    Abstract: 本发明提供一种对文本语句间进行高精度实时比较的文本语句比较装置。树表示部用图论的有根树来表示作为比较对象的文本语句;节点信息赋予部对由树表示部所表示的树的各节点赋予基于文本语句的信息;树间距离定义部定义基于节点间对应关系的树间的距离;树间距离取得部对作为比较对象的文本语句的树之间,求出由树间距离定义部所定义的树间距离;树间距离应用部将树间距离用于表示文本语句间的差别;文本语句间距离取得部根据树间距离应用部的结果,计算出作为比较对象的文本语句间的距离。

    文章标题及关联信息的自动抽取装置和抽取方法

    公开(公告)号:CN100444194C

    公开(公告)日:2008-12-17

    申请号:CN200510116866.X

    申请日:2005-10-27

    Abstract: 本发明提供一种自动且高精度地抽取文章标题的标题抽取装置。文章标题抽取装置包括:从由文章输入部(30)输入的文本文章中抽取多个标题候选句的标题候选句抽取部(32);抽取所抽取出的多个标题候选句的各自的特征量的候选句标题判定用特征量抽取部(34);根据所抽取的特征量从多个标题候选句中判定标题的标题判定部(36);输出抽取结果的输出部(38)。特征量至少包含作为标题候选句与文章中的多个句子的相似度的函数值的相似度信息。

    文档处理装置和文档处理方法

    公开(公告)号:CN100378720C

    公开(公告)日:2008-04-02

    申请号:CN200510055735.5

    申请日:2005-03-18

    CPC classification number: G06F17/2217

    Abstract: 文档处理装置和文档处理方法。一种文档处理装置包括:指定单元,用于从包括在由多个相应的文档数据表示的多个文档中的字符串中指定对于文档具有公共属性的字符串;和重写单元,用于将所述指定单元指定的字符串中的以不同于限定格式的格式表示的字符串重写为以所述限定格式表示的字符串;和分类单元,用于对由所述指定单元指定的字符串的格式进行分类;和限定单元,用于根据所述分类单元提供的分类结果限定基准格式;其中,所述重写单元将所述指定单元指定的字符串中的以不同于由所述限定单元限定的基准格式的格式表示的字符串重写为以所述基准格式表示的字符串。

    翻译装置、翻译方法以及计算机可读介质

    公开(公告)号:CN101140570A

    公开(公告)日:2008-03-12

    申请号:CN200710104754.1

    申请日:2007-04-26

    Inventor: 刘绍明

    CPC classification number: G06F17/2827

    Abstract: 本发明涉及翻译装置、翻译方法以及计算机可读介质。提供了一种翻译装置,该翻译装置包括:双语例句词典,该双语例句词典存储了第一种语言的多个例句和作为所述多个例句的译文的第二种语言的多个例句;输入单元,该输入单元输入所述第一种语言的输入句;第一搜索单元,该第一搜索单元搜索所述输入句是否与所述第一种语言的所述多个例句中的任一例句匹配;第二搜索单元,该第二搜索单元在所述第一搜索单元没有找到匹配例句时,从所述第一种语言的所述多个例句中搜索与所述输入句相似的至少一个候选例句;以及输出单元,该输出单元输出作为所述第一搜索单元搜索到的例句的译文或者作为所述第二搜索单元搜索到的所述候选例句的译文的所述第二种语言的例句。

    文章标题及关联信息的自动抽取装置、抽取方法及抽取程序

    公开(公告)号:CN1955979A

    公开(公告)日:2007-05-02

    申请号:CN200510116866.X

    申请日:2005-10-27

    Abstract: 本发明提供一种自动且高精度地抽取文章标题的标题抽取装置。文章标题抽取装置包括:从由文章输入部(30)输入的文本文章中抽取多个标题候选句的标题候选句抽取部(32);抽取所抽取出的多个标题候选句的各自的特征量的候选句标题判定用特征量抽取部(34);根据所抽取的特征量从多个标题候选句中判定标题的标题判定部(36);输出抽取结果的输出部(38)。特征量至少包含作为标题候选句与文章中的多个句子的相似度的函数值的相似度信息。

    文本检索装置及方法
    26.
    发明公开

    公开(公告)号:CN1741012A

    公开(公告)日:2006-03-01

    申请号:CN200410057211.5

    申请日:2004-08-23

    Abstract: 本发明提供了一种文本检索装置和方法,其对传统的检索手段进行改良,引入自然语言深层的语义信息进行信息比较及检索。本发明采用将语义信息同向量空间模型相结合的方法,通过赋予语义信息附加的权重来改进向量空间模型的向量特征值,以提高向量特征值同文本语义之间的相关度,实现高精度的信息比较及检索。由于采用向量特征值之间的相似度(距离)来衡量文本之间的相似度,所以其比较及检索速度等同于向量空间模型。

    双语信息检索设备、翻译设备及双语信息检索方法

    公开(公告)号:CN102591898B

    公开(公告)日:2017-04-26

    申请号:CN201110353121.0

    申请日:2011-11-09

    Inventor: 刘绍明

    CPC classification number: G06F17/2827 G06F17/2863

    Abstract: 双语信息检索设备、翻译设备及双语信息检索方法。双语信息检索设备包括输入文本获取单元、第一存储器、第一语言构造信息选择单元、第二存储器和第二语言构造信息选择单元。输入文本获取单元获得第一语言输入文本。第一存储器存储指示第一语言文本构造的多个第一语言构造信息。第一语言构造信息选择单元从存储的多个第一语言构造信息中选择一个与输入文本对应的第一语言构造信息。第二存储器存储指示与选择的第一语言构造信息对应的第二语言文本构造的多个第二语言构造信息。第二语言构造信息选择单元基于与多个第一语言构造信息和多个第二语言构造信息相关的评价信息,从存储在第二存储器的多个第二语言构造信息中选择一个第二语言构造信息。

    翻译装置及信息处理方法
    28.
    发明授权

    公开(公告)号:CN101441623B

    公开(公告)日:2013-08-07

    申请号:CN200810133952.5

    申请日:2008-07-18

    Inventor: 刘绍明

    CPC classification number: G06F17/2827

    Abstract: 一种翻译装置,包括:存储器,用于存储形成例句模式的字符串和形成从该例句模式翻译过来的翻译例句模式的字符串,其中基于形成句子的字符串将例句归类在该例句模式下,形成该例句模式的字符串与形成该翻译例句模式的字符串基于字符串的含义而关联;转换单元,用于将该输入句子转换成包括与由例句共享的公共字符串相对应的公共部分和非公共部分的句子;及翻译单元,用于根据说明了与形成该翻译例句模式的字符串之间的关联的映射来翻译该输入句子,形成该翻译例句模式的该字符串存储在存储器中并与对应于转换后的句子的非公共字符部分相关联。

    简体汉字和繁体汉字相互转换方法及其系统

    公开(公告)号:CN101131690B

    公开(公告)日:2012-07-25

    申请号:CN200610111510.1

    申请日:2006-08-21

    Abstract: 简体和繁体汉字相互转换的系统及方法。把将要被转换的简体/繁体汉字字符串划分成若干个词语/术语,并且把每一个词语/术语鉴别-定义为:其中在标记形式上与繁体/简体汉字的词语/术语相同或虽然不同但具有确定对应关系的第一类词语/术语、以及在标记形式上与繁体/简体汉字的词语/术语不同且不具有确定对应关系的简体/繁体汉字的第二类词语/术语。采用映射表将第一类词语/术语直接映射成与输入的简体/繁体汉字的词语/术语唯一对应的繁体/简体汉字的词语/术语。采用统计分类方法将第二类词语/术语转换成与输入的简体/繁体汉字的词语/术语合理对应的繁体/简体汉字的词语/术语。将采用映射表方法和采用统计分类方法而得到的结果进行组合并输出。

    双语信息检索设备、翻译设备及双语信息检索方法

    公开(公告)号:CN102591898A

    公开(公告)日:2012-07-18

    申请号:CN201110353121.0

    申请日:2011-11-09

    Inventor: 刘绍明

    CPC classification number: G06F17/2827 G06F17/2863

    Abstract: 双语信息检索设备、翻译设备及双语信息检索方法。双语信息检索设备包括输入文本获取单元、第一存储器、第一语言构造信息选择单元、第二存储器和第二语言构造信息选择单元。输入文本获取单元获得第一语言输入文本。第一存储器存储指示第一语言文本构造的多个第一语言构造信息。第一语言构造信息选择单元从存储的多个第一语言构造信息中选择一个与输入文本对应的第一语言构造信息。第二存储器存储指示与选择的第一语言构造信息对应的第二语言文本构造的多个第二语言构造信息。第二语言构造信息选择单元基于与多个第一语言构造信息和多个第二语言构造信息相关的评价信息,从存储在第二存储器的多个第二语言构造信息中选择一个第二语言构造信息。

Patent Agency Ranking