简繁体汉字的转换方法及系统

    公开(公告)号:CN103778110B

    公开(公告)日:2016-08-31

    申请号:CN201210412828.9

    申请日:2012-10-25

    Abstract: 本申请公开了一种简繁体汉字相互转换的方法及系统,其中,简体到繁体的转换系统包括:字典模块,用于保存用户自定义映射字典和简繁体映射字典;输入模块,用于输入要被转换的简体字符串;转换模块,用于先对简体字符串进行分句再进行分词,将得到的简体词语转换为繁体词语;输出模块,用于将所有繁体词语进行组合,形成繁体字符串输出。分词时,使用正向最大匹配算法和逆向最大匹配算法相结合的双向最大匹配算法,计算正向分词结果的正向权值以及逆向分词结果的逆向权值,取权值较大的那个作为最终的分词结果,当权值相等时,取逆向分词结果作为最终分词结果。本申请实现了对同一事物的不同表达方式之间的转换,而且分词结果更加地准确。

    简繁体汉字的转换方法及系统

    公开(公告)号:CN103778110A

    公开(公告)日:2014-05-07

    申请号:CN201210412828.9

    申请日:2012-10-25

    Abstract: 本申请公开了一种简繁体汉字相互转换的方法及系统,其中,简体到繁体的转换系统包括:字典模块,用于保存用户自定义映射字典和简繁体映射字典;输入模块,用于输入要被转换的简体字符串;转换模块,用于先对简体字符串进行分句再进行分词,将得到的简体词语转换为繁体词语;输出模块,用于将所有繁体词语进行组合,形成繁体字符串输出。分词时,使用正向最大匹配算法和逆向最大匹配算法相结合的双向最大匹配算法,计算正向分词结果的正向权值以及逆向分词结果的逆向权值,取权值较大的那个作为最终的分词结果,当权值相等时,取逆向分词结果作为最终分词结果。本申请实现了对同一事物的不同表达方式之间的转换,而且分词结果更加地准确。

Patent Agency Ranking