一种古汉语自动分词及词性标注一体化方法及装置
摘要:
本发明提供一种古汉语自动分词及词性标注一体化方法及装置,能够有效提升古汉语分词及词性标注的正确率。所述方法包括:获取古汉语语料库中的古汉语文本;对获取的古汉语文本的标签进行标签转换,得到包含词性标记信息和分词标记信息的二元标签结构;对得到的二元标签结构进行编码;构建双向长短期记忆神经网络,基于编码后得到的二元标签信息,利用获取的古汉语文本对构建的双向长短期记忆神经网络进行训练,得到基于双向长短期记忆神经网络的自动分词及词性标注一体化模型,其中,所述基于双向长短期记忆神经网络的自动分词及词性标注一体化模型,用于对输入的古汉语文本同时进行分词和标注。本发明适用于机器翻译、信息检索、语义识别领域。
0/0