-
公开(公告)号:CN117574901B
公开(公告)日:2024-07-19
申请号:CN202311543190.7
申请日:2023-11-20
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/242 , G06F18/2431 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种实体定位和分类方法、装置、设备及存储介质。本发明将实体识别过程拆分成两步,先单独进行BIO标签预测而不考虑实体,再对BIO序列重新补充实体名,能够提高模型的预测性能,对于相似实体也能够达到可观的预测精度。通过多线程技术,本发明的模型可以训练较大批量的训练集,模型的召回率和准确率均高于简单使用BERT+CRF的实体识别模型。本发明对实体定位模型采取奇偶轮交替训练的策略时,能够更好的召回实体。
-
公开(公告)号:CN117574901A
公开(公告)日:2024-02-20
申请号:CN202311543190.7
申请日:2023-11-20
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/242 , G06F18/2431 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种实体定位和分类方法、装置、设备及存储介质。本发明将实体识别过程拆分成两步,先单独进行BIO标签预测而不考虑实体,再对BIO序列重新补充实体名,能够提高模型的预测性能,对于相似实体也能够达到可观的预测精度。通过多线程技术,本发明的模型可以训练较大批量的训练集,模型的召回率和准确率均高于简单使用BERT+CRF的实体识别模型。本发明对实体定位模型采取奇偶轮交替训练的策略时,能够更好的召回实体。
-