-
公开(公告)号:CN117540739A
公开(公告)日:2024-02-09
申请号:CN202311284404.3
申请日:2023-10-07
Applicant: 中国科学院信息工程研究所
IPC: G06F40/289 , G06F40/30 , G06N3/0442 , G06F40/211
Abstract: 本发明公开了一种序列到无序多树模型的三元组抽取方法,其特征在于,构建一编码器‑解码器框架,所述编码器‑解码器框架中的编码器包括嵌入层、IDCNN、BiLSTM和第一卷积层CNN;所述编码器‑解码器框架中的解码器包括LSTM、注意力机制层和第二卷积层CNN;本发明采用IDCNN+BiLSTM作为编码器,IDCNN结构采用了多尺度的卷积核,可以捕捉更长的上下文信息,能够提取更多特征,有助于提高模型性能;解码器通过使用无序多标签分类作为输出层,对实体和关系进行联合建模和结构化建模;每个层级中的节点是无序的,且不考虑预定义的三元组顺序,因此预测偏差不会累积并影响其他三元组。