-
公开(公告)号:CN103080937A
公开(公告)日:2013-05-01
申请号:CN201280002564.8
申请日:2012-05-23
申请人: 株式会社东芝 , 东芝解决方案株式会社
CPC分类号: G06F17/2785 , G06F17/2795
摘要: 本发明提供表述不一致检测装置及表述不一致检测程序。实施方式的表述不一致检测装置具备:用语提取部,从文件数据中提取用语;类似度计算部,计算所提取的用语的任意的对的类似度;表述不一致候补判定部,基于类似度来判定用语的对是否是表述不一致候补;以及组分类部,基于作为表述不一致候补的用语的对所共通包含的文字列,对表述不一致候补进行分组。
-
公开(公告)号:CN103282903B
公开(公告)日:2016-09-07
申请号:CN201280004293.X
申请日:2012-03-08
申请人: 株式会社东芝 , 东芝解决方案株式会社
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06F17/2775
摘要: 根据实施方式,话题提取装置具备话题提取单元、话题提示单元。上述话题提取单元具备单词提取单元和话题词提取单元。上述单词提取单元从对象文书集合中提取各单词,计算该各单词的出现频度和该各单词出现的文书频度。上述话题词提取单元针对上述提取的各单词,取得上述对象期间中的出现文书的文书集合,计算表示与话题词的接近性的尺度即话题度,提取上述话题度为预定值以上的单词作为话题词,并且针对该提取的话题词,根据该对象期间中的出现日期时间计算新鲜度。上述话题提示单元按照上述新鲜度的顺序提示上述提取的话题词,并且针对该提示的各话题词提示每个单位期间的出现文书数。
-
公开(公告)号:CN103282903A
公开(公告)日:2013-09-04
申请号:CN201280004293.X
申请日:2012-03-08
申请人: 株式会社东芝 , 东芝解决方案株式会社
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06F17/2775
摘要: 根据实施方式,话题提取装置具备话题提取单元、话题提示单元。上述话题提取单元具备单词提取单元和话题词提取单元。上述单词提取单元从对象文书集合中提取各单词,计算该各单词的出现频度和该各单词出现的文书频度。上述话题词提取单元针对上述提取的各单词,取得上述对象期间中的出现文书的文书集合,计算表示与话题词的接近性的尺度即话题度,提取上述话题度为预定值以上的单词作为话题词,并且针对该提取的话题词,根据该对象期间中的出现日期时间计算新鲜度。上述话题提示单元按照上述新鲜度的顺序提示上述提取的话题词,并且针对该提示的各话题词提示每个单位期间的出现文书数。
-
-