一种基于自然语言处理的地质表头归并方法及装置

    公开(公告)号:CN114896968A

    公开(公告)日:2022-08-12

    申请号:CN202210649555.3

    申请日:2022-06-10

    Abstract: 本发明公开了一种基于自然语言处理的地质表头归并方法及装置,所述方法包括获取地质表头文本原始数据,对地质表头文本原始数据进行预处理;将所述预处理过的地质表头文本原始数据转化为包括词编号和词的词表,再利用所述词表将地质表头文本原始数据转化为词编号序列;将所述词编号序列输入预先建立的基于长短期记忆神经网络的表头归并模型,经过所述表头归并模型的嵌入层、LSTM层后输出特征向量;使用softmax对所述特征向量计算,得出地质表头文本所属标签类别的概率,输出表头文本的类别预测结果,本发明能够统筹地质表头文本数据集的局部和全局文本特征,具备良好的准确性和稳定性,有效提升地质表头文本类别预测的效果。

Patent Agency Ranking