-
公开(公告)号:CN104484377B
公开(公告)日:2017-11-03
申请号:CN201410746317.X
申请日:2014-12-09
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种替换词典生成方法及装置,其中方法包括:获取句对资源,利用语言先验知识对所述句对资源做规则对齐,生成第一替换词典;对所述句对资源中的剩余语料,利用融合有语言先验知识的IBM模型做统计对齐,生成第二替换词典,其中,所述剩余语料为所述句对资源中经所述规则对齐后剩余的词语;根据所述第一替换词典和第二替换词典生成线上可用的第三替换词典,提高了替换词典的准确率和召回率。