-
公开(公告)号:CN101840406B
公开(公告)日:2015-10-14
申请号:CN200910129465.6
申请日:2009-03-20
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种地名搜索装置包括:地名关系信息库生成单元,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;预处理单元,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和搜索单元,用于利用经所述预处理单元预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。这种地名搜索装置可提高地名搜索处理的效率和准确性。还提供一种地名搜索方法。
-
公开(公告)号:CN102375838A
公开(公告)日:2012-03-14
申请号:CN201010257635.1
申请日:2010-08-17
Applicant: 富士通株式会社
Abstract: 用于构建极性词素数据库以及确定词的极性的方法和装置。用于确定词的极性的方法包括:对于要确定极性的词,计算其与预定的极性词素数据库中的每个极性为褒义的词之间的互信息、与所述极性词素数据库中的每个极性为贬义的词之间的互信息;根据所计算的词与极性词素数据库中的每个极性为褒义的词之间的互信息,计算词与极性词素数据库中的所有极性为褒义的词之间的关联性,根据所计算的词与极性词素数据库中的每个极性为贬义的词之间的互信息,计算词与极性词素数据库中的所有极性为贬义的词之间的关联性;以及对以上两种关联性进行比较,根据比较结果判定词的极性。
-
公开(公告)号:CN102881282B
公开(公告)日:2014-08-20
申请号:CN201110204282.3
申请日:2011-07-15
Applicant: 富士通株式会社
IPC: G10L13/10
Abstract: 本发明实施例公开了提供一种获取韵律边界信息的方法及系统,其中,所述方法包括:获取待标注的文本数据,并获得所述文本数据对应的音频数据;向第一组标注者播放所述音频数据,根据各个标注者的标注结果,获取基于该第一组标注者确定的韵律边界信息;向第二组标注者展现根据所述文本数据生成的句法树,根据各个标注者的标注结果,获取基于该第二组标注者确定的韵律边界信息;将所述基于第一组标注者确定的韵律边界信息与所述基于第二组标注者确定的韵律边界信息进行比对,根据比对结果,确定各个位置的韵律边界信息。通过本发明,能够有效地获取到韵律边界信息,进而提高语音合成结果的自然度。
-
公开(公告)号:CN102789461A
公开(公告)日:2012-11-21
申请号:CN201110130234.4
申请日:2011-05-19
Applicant: 富士通株式会社
Abstract: 本发明提供一种多语词典构建装置,可以包括:单语词典模块,从预置的单语词典中选取词语,并取得与词语对应的每个义项的释义;关键词提取模块,从释义中提取关键词;双语词典模块,从预置的双语词典中查询出词语的翻译词语,其中,双语词典的其中一种语种与单语词典的语种相同;翻译确认模块,分别计算翻译词语与词语及关键词的相似度,以在翻译词语中为词语选出对应每个义项的最终翻译词语,生成多语词典。本发明还提供一种多语词典构建方法。通过本发明,可以实现一种多语词典的自动构建装置和一种多语词典自动构建方法,节省了词典构建工作消耗的人力物力,保证了生成的多语词典的精确度,基于普通的单语、双语词典就可自动完成多语词典编制。
-
公开(公告)号:CN103020040A
公开(公告)日:2013-04-03
申请号:CN201110305010.2
申请日:2011-09-27
Applicant: 富士通株式会社
IPC: G06F17/28
Abstract: 本发明提供了一种源语言改写处理方法和设备及机器翻译系统。该改写处理方法包括:对源语言语句中的待处理语句进行语法分析;根据语法分析结果确定待处理语句中的包含子句嵌套结构的语句;基于语法分析结果对所确定的包含子句嵌套结构的语句进行重构,以获得至少一个包含非嵌套子句的语句;以及用所获得的至少一个包含非嵌套子句的语句中的、含有最多非嵌套子句的语句来替换上述包含子句嵌套结构的语句。该处理装置被配置实现上述处理方法中包括的功能。应用本发明的处理方法、设备或系统,能够将一些复合长句降解并重组为若干非复合的子句,降低机器翻译过程中的翻译难度,提高翻译精度和翻译效率。本发明适用于自然语言处理领域。
-
公开(公告)号:CN102214173A
公开(公告)日:2011-10-12
申请号:CN201010142083.X
申请日:2010-04-02
Applicant: 富士通株式会社
Abstract: 本发明公开了用于选择用于网络发布的关键词的方法和设备。一种用于选择用于网络发布的关键词的方法,包括:获取关键词集合中的关键词的费用信息和关注度信息;对于该关键词集合中的每个关键词,基于该关键词的费用信息和关注度信息,计算该关键词的性价比指标值;以及基于该关键词集合中的各个关键词的性价比指标值,从该关键词集合中选择用于网络发布的关键词或关键词的组合。本发明能够帮助用户选择有效且成本低的关键词或关键词的组合。
-
公开(公告)号:CN101814066A
公开(公告)日:2010-08-25
申请号:CN200910118105.6
申请日:2009-02-23
Applicant: 富士通株式会社
Abstract: 本发明涉及文本阅读难度判断设备及其方法。文本阅读难度判断设备,包括:输入装置,被配置成接收待分析文本、以及有关阅读难度的预定评测主题;特征量难度评测装置,被配置成针对所述待分析文本的每个组成部分获取用于评测所述预定评测主题的至少一个预定的特征量,针对预定特征量计算整个所述待分析文本的相应特征量难度等级,并使用所述特征量难度等级按照该预定特征量所占的预定权重计算有关所述预定评测主题的加权平均信息量,以作为所述待分析文本的有关所述预定评测主题的阅读难度;以及输出装置,被配置成输出所述待分析文本的有关所述预定评测主题的阅读难度。
-
公开(公告)号:CN102881282A
公开(公告)日:2013-01-16
申请号:CN201110204282.3
申请日:2011-07-15
Applicant: 富士通株式会社
IPC: G10L13/10
Abstract: 本发明实施例公开了一种获取韵律边界信息的方法及系统,其中,所述方法包括:获取待标注的文本数据,并获得所述文本数据对应的音频数据;向第一组标注者播放所述音频数据,根据各个标注者的标注结果,获取基于该第一组标注者确定的韵律边界信息;向第二组标注者展现根据所述文本数据生成的句法树,根据各个标注者的标注结果,获取基于该第二组标注者确定的韵律边界信息;将所述基于第一组标注者确定的韵律边界信息与所述基于第二组标注者确定的韵律边界信息进行比对,根据比对结果,确定各个位置的韵律边界信息。通过本发明,能够有效地获取到韵律边界信息,进而提高语音合成结果的自然度。
-
公开(公告)号:CN101840406A
公开(公告)日:2010-09-22
申请号:CN200910129465.6
申请日:2009-03-20
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 提供一种地名搜索装置包括:地名关系信息库生成单元,用于生成作为搜索目的地的地名的地名关系信息库,所述地名关系信息库包括地名、与所述地名相关联的信息项、以及与所述地名相关联的目标项;预处理单元,用于对输入的待搜索关键字进行预处理,以使得所述待搜索关键字的属性与所述信息项中至少一部分信息项的属性相同;和搜索单元,用于利用经所述预处理单元预处理后的待搜索关键字在所述地名关系信息库中进行搜索,以便通过所述预处理后的待搜索关键字的属性与所述至少一部分信息项的属性之间的匹配,获得与所述输入的待搜索关键字相对应的地名及其目标项。这种地名搜索装置可提高地名搜索处理的效率和准确性。还提供一种地名搜索方法。
-
-
-
-
-
-
-
-