-
公开(公告)号:CN112884354A
公开(公告)日:2021-06-01
申请号:CN202110278179.7
申请日:2021-03-15
Applicant: 北京工商大学
IPC: G06Q10/06 , G06Q50/26 , G06F8/30 , G06F16/951 , G06F40/126 , G06F40/284
Abstract: 本发明涉及一种字词双维度的化妆品安全监管领域事件信息抽取方法,包括:对互联网上爬取到的舆情事件数据进行预处理,在公共领域资源库的基础上构建化妆品安全领域word embedding资源库、对其使用领域语料进行增量训练、通过基于BERT的神经网络提取字词双维度文本特征,完成化妆品安全监管领域事件信息抽取。本发明一定程度上解决了化妆品安全监管领域事件信息抽取准确程度不高,领域性强的难题,通过构建新的模型,将字维度作为文本向量化表示的基础上再加入词维度进行辅助表示,提高事件信息抽取准确性。
-
公开(公告)号:CN112884354B
公开(公告)日:2023-07-11
申请号:CN202110278179.7
申请日:2021-03-15
Applicant: 北京工商大学
IPC: G06Q10/0639 , G06Q50/26 , G06F8/30 , G06F16/951 , G06F40/126 , G06F40/284
Abstract: 本发明涉及一种字词双维度的化妆品安全监管领域事件信息抽取方法,包括:对互联网上爬取到的舆情事件数据进行预处理,在公共领域资源库的基础上构建化妆品安全领域word embedding资源库、对其使用领域语料进行增量训练、通过基于BERT的神经网络提取字词双维度文本特征,完成化妆品安全监管领域事件信息抽取。本发明一定程度上解决了化妆品安全监管领域事件信息抽取准确程度不高,领域性强的难题,通过构建新的模型,将字维度作为文本向量化表示的基础上再加入词维度进行辅助表示,提高事件信息抽取准确性。
-