一种基于语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质

    公开(公告)号:CN113157907A

    公开(公告)日:2021-07-23

    申请号:CN202110279942.8

    申请日:2021-03-16

    Applicant: 中南大学

    Abstract: 本发明公开了一种语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质,所述方法包括:步骤1:将待处理的文档中句子的单词编码成词向量,并针对每个句子,利用Bi‑LSTM模型以及自注意力机制构建句子编码器得到句子向量;步骤2:针对待处理的文档,利用Bi‑LSTM模型以及自注意力机制构建篇章编码器得到篇章向量;步骤3:基于所述篇章向量对句子进行分类得到候选句子;步骤4:将候选句子输入基于RST构建的摘要提取器提取出核心EDU,并将所有候选句子的核心EDU拼接为文本摘要;其中,将候选句子分割为文档单元,再利用文本单元构成语篇结构的层次树,层次树的叶子节点EDU表示被分割的文档单元。本发明引入自注意力机制以及语篇结构提高了摘要提取的准确性。

Patent Agency Ranking