语句改述方法、程序以及系统

    公开(公告)号:CN101563682A

    公开(公告)日:2009-10-21

    申请号:CN200780047490.9

    申请日:2007-12-21

    Inventor: 石川开 赤峰享

    CPC classification number: G06F17/2795 G06F17/28

    Abstract: 对于用户对疑问句的输入,学习疑问句的改述模型,实时生成改述后的表述。当文件集合存储单元(401)的信息被更新时,语句对提取单元(301)从文件集合存储单元(401)提取改述语句对,并将其存储在语句对存储单元(403)中。模型学习单元(302)从语句对存储单元(402)中的改述语句对学习疑问句改述模型,并将其存储在模型存储单元(402)中。语句对提取单元(301)使用模型存储单元(302)所具有的疑问句改述模型从文件集合存储单元(401)再次提取改述语句对并将其存储在语句对存储单元(403)中。当存储的改述语句对与存储在语句对存储单元(403)中的改述语句对相同时,结束疑问句改述模型的学习。候选制定单元(303)从模型存储单元(402)读取疑问句改述模型,生成所输入的疑问句的改述候选。

    文本挖掘装置和其方法
    2.
    发明授权

    公开(公告)号:CN1934570B

    公开(公告)日:2012-05-16

    申请号:CN200580008562.X

    申请日:2005-03-17

    Abstract: 语言解析单元(21)解析从文本DB(11)读入的各个文本,并作为分析结果而生成句子结构。相似结构生成调整单元(25)生成根据来自输入装置的输入而对句子结构间每种类型的差异指定是否判定为同一结构的指定项。相似结构判定调整单元(26)生成根据来自输入装置(6)的输入而对属性值的每种类型指定是否忽略属性值间差异的指定项。相似结构生成单元(22)根据来自相似结构生成调整单元(25)的指定项,生成构成由语言解析单元(21)获得的句子结构的部分结构的相似结构,并将生成的各个相似结构设为各个生成源的部分结构的等价类。频繁相似模式检测单元(24)根据由相似结构判定调整单元(26)给出的指定项而忽略属性值,从来自相似结构生成单元(22)的等价类的集合中检测频繁模式并输出给输出装置(3)。

    文本挖掘装置和其方法以及程序

    公开(公告)号:CN1934570A

    公开(公告)日:2007-03-21

    申请号:CN200580008562.X

    申请日:2005-03-17

    Abstract: 语言解析单元(21)解析从文本DB(11)读入的各个文本,并作为分析结果而生成句子结构。相似结构生成调整单元(25)生成根据来自输入装置的输入而对句子结构间每种类型的差异指定是否判定为同一结构的指定项。相似结构判定调整单元(26)生成根据来自输入装置(6)的输入而对属性值的每种类型指定是否忽略属性值间差异的指定项。相似结构生成单元(22)根据来自相似结构生成调整单元(25)的指定项,生成构成由语言解析单元(21)获得的句子结构的部分结构的相似结构,并将生成的各个相似结构设为各个生成源的部分结构的等价类。频繁相似模式检测单元(24)根据由相似结构判定调整单元(26)给出的指定项而忽略属性值,从来自相似结构生成单元(22)的等价类的集合中检测频繁模式并输出给输出装置(3)。

Patent Agency Ranking