-
公开(公告)号:CN113157907A
公开(公告)日:2021-07-23
申请号:CN202110279942.8
申请日:2021-03-16
Applicant: 中南大学
IPC: G06F16/34 , G06F40/126 , G06F40/146 , G06F40/211 , G06F40/284 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质,所述方法包括:步骤1:将待处理的文档中句子的单词编码成词向量,并针对每个句子,利用Bi‑LSTM模型以及自注意力机制构建句子编码器得到句子向量;步骤2:针对待处理的文档,利用Bi‑LSTM模型以及自注意力机制构建篇章编码器得到篇章向量;步骤3:基于所述篇章向量对句子进行分类得到候选句子;步骤4:将候选句子输入基于RST构建的摘要提取器提取出核心EDU,并将所有候选句子的核心EDU拼接为文本摘要;其中,将候选句子分割为文档单元,再利用文本单元构成语篇结构的层次树,层次树的叶子节点EDU表示被分割的文档单元。本发明引入自注意力机制以及语篇结构提高了摘要提取的准确性。