-
公开(公告)号:CN112035607B
公开(公告)日:2022-05-20
申请号:CN202010834878.0
申请日:2020-08-19
Applicant: 中南大学
IPC: G06F16/33 , G06F40/258 , G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种于MG‑LSTM的引文差异匹配方法、装置及存储介质,其中方法包括:获取待甄别引文和可信引文的标题、作者、出版社元数据;以单词和字符为分割粒度,将待甄别引文和可信引文的标题、作者、出版社元数据分别分割转换为标题嵌入向量对、作者嵌入向量对、出版社嵌入向量对;基于注意力机制分别学习各嵌入向量对的权重,并基于对应权重更新各嵌入向量对;将更新后的各嵌入向量对输入预先训练好的引文差异识别模型中,输出引文差异匹配结果类别。可进行引文细粒度甄别,判断引文存在何种差异类型;通过引入注意力机制能更好的表征待甄别引文与可信引文的各元数据间的相互关系,再结合双向LSTM网络同时保留两个方向的特征信息,确保了甄别精度。
-
公开(公告)号:CN112035607A
公开(公告)日:2020-12-04
申请号:CN202010834878.0
申请日:2020-08-19
Applicant: 中南大学
IPC: G06F16/33 , G06F40/258 , G06F40/284 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种于MG-LSTM的引文差异匹配方法、装置及存储介质,其中方法包括:获取待甄别引文和可信引文的标题、作者、出版社元数据;以单词和字符为分割粒度,将待甄别引文和可信引文的标题、作者、出版社元数据分别分割转换为标题嵌入向量对、作者嵌入向量对、出版社嵌入向量对;基于注意力机制分别学习各嵌入向量对的权重,并基于对应权重更新各嵌入向量对;将更新后的各嵌入向量对输入预先训练好的引文差异识别模型中,输出引文差异匹配结果类别。可进行引文细粒度甄别,判断引文存在何种差异类型;通过引入注意力机制能更好的表征待甄别引文与可信引文的各元数据间的相互关系,再结合双向LSTM网络同时保留两个方向的特征信息,确保了甄别精度。
-