基于互联网信息的输入法词频库的生成方法和系统
摘要:
本发明公开了一种基于互联网信息输入法词频库的生成方法,包括:通过网络爬虫技术获取互联网的网页;对网页信息进行分词处理;对词条进行词频统计,并保存形成互联网词频库。由于本发明以公开的、实时变化的互联网信息为输入法系统的词频统计来源,生成的词频信息是最新和最佳的;并可以通过各种简单方便的方式更新至输入法系统的系统词频库,使得系统词频库中的词频信息能够与互联网上字词的词频信息保持一致,从而提高了使用者的首选词的命中率,提高了输入速度和效率。
0/0