-
公开(公告)号:CN105955966A
公开(公告)日:2016-09-21
申请号:CN201610235521.4
申请日:2016-04-15
Applicant: 苏州大学
IPC: G06F17/28
CPC classification number: G06F17/2881 , G06F17/289
Abstract: 本发明公开了一种改进训练语料的平行质量的方法及装置。该方法包括:在预先获得的训练语料库中确定待纠正的目标句对,目标句对包括原文句子和相对应的译文句子;从目标句对的所有组合划分点中,选择一个可用组合划分点;利用可用组合划分点划分目标句对,获得原文句子的两个子句和译文句子的两个子句;确定获得的子句构成的子句对是否平行及各子句间的非平行关系;根据预设的对应规则,使用与确定的非平行关系对应的纠正方式纠正目标句对。应用本发明实施例所提供的技术方案,改进了训练语料的平行质量,提升了统计机器翻译系统的翻译性能。
-
公开(公告)号:CN104346326A
公开(公告)日:2015-02-11
申请号:CN201410571054.3
申请日:2014-10-23
Applicant: 苏州大学
Abstract: 本申请提供的情绪文本的情绪特征确定方法及装置,通过在确定的情绪文本中,提取情绪词的特征词集合,并依据情绪文本集合及特征词集合构建分类器,利用分类器对待确定情绪文本进行分类,获得分类结果,依据分类结果确定出待确定情绪文本的情绪特征为情绪发生或情绪隐藏。需要说明,本实施例中确定出的特征词集合是与情绪词具有上下文关联特征的特征词,利用所述特征词构建分类器,因此,构建的分类器充分考虑上下文对情绪表达的影响,相较于现有技术简单机械地利用情绪词表对情绪特征确定的方式,本实施例确定的准确率大大提高。
-
公开(公告)号:CN104317890A
公开(公告)日:2015-01-28
申请号:CN201410572086.5
申请日:2014-10-23
Applicant: 苏州大学
Abstract: 本申请提供的文本连接词的识别方法及装置,在获取的待识别文本中,提取待识别的连接词,利用预先构建的分类器对该识别连接词进行识别,获得识别结果,进而利用识别结果确定待识别连接词的属性,该属性为连接词或非连接词。在本实施例中,首先在待识别文本中获得连接词,该连接词为初步识别的连接词,再利用利用已标注的连接词样本作为训练集构建的分类器进一步确定,从而准确识别出待识别文本中的连接词。
-
-