Invention Publication
- Patent Title: 双语语句对齐方法及装置
- Patent Title (English): Double-language sentence alignment method and device
-
Application No.: CN200810242112.2Application Date: 2008-12-31
-
Publication No.: CN101488126APublication Date: 2009-07-22
- Inventor: 张玉志
- Applicant: 深圳市点通数据有限公司
- Applicant Address: 广东省深圳市福田区梅林路梅林阁南三楼302A
- Assignee: 深圳市点通数据有限公司
- Current Assignee: 深圳市点通数据有限公司
- Current Assignee Address: 广东省深圳市福田区梅林路梅林阁南三楼302A
- Agency: 深圳市维邦知识产权事务所
- Agent 黄莉
- Main IPC: G06F17/28
- IPC: G06F17/28

Abstract:
本发明公开一种双语语句对齐方法,包括以下步骤:分句步骤;分词步骤;对齐步骤;其特征在于,所述对齐步骤具体包括有:区域划分步骤,分别将待对齐的第一语种、第二语种按照预设的区域划分规则划分为多个包含所述第一语种语句、第二语种语句的比较区域;匹配步骤,计算每对对应的第一语种与第二语种比较区域内的每对语句的相互匹配率,并根据所述相互匹配率确定相互匹配的第一语种语句和第二语种语句组合;执行步骤,将所述相互匹配率最大的第一语种语句和第二语种语句组合执行对齐操作。本发明还公开了相应的双语语句对齐装置。本发明可大大提高对齐的效率、加快语料库的建设速度。
Public/Granted literature
- CN101488126B 双语语句对齐方法及装置 Public/Granted day:2011-05-11
Information query