面向生物医学文本的命名实体识别模型的训练方法
摘要:
本发明提供了一种面向生物医学文本的命名实体识别模型的训练方法。该方法包括:利用输入层处理训练集,得到初始向量矩阵和语言模型矩阵,并利用嵌入层将初始向量矩阵和语言模型矩阵中的词嵌入向量进行向量相加融合运算,得到多维度词嵌入向量;利用Transformer层对多维度词嵌入向量进行处理,得到多维度向量,并利用条件随机场层处理多维度向量,得到标签信息;利用损失函数通过处理标签信息和标注信息,并利用损失值通过反向传播对命名实体识别模型进行参数更新;利用验证集对参数更新后的命名实体识别模型进行验证,根据验证结果对命名实体识别模型进行迭代训练和参数更新,直到满足预设条件,得到训练完成的命名实体识别模型。
0/0