-
公开(公告)号:CN116775855A
公开(公告)日:2023-09-19
申请号:CN202310463558.2
申请日:2023-04-26
Applicant: 桂林电子科技大学
IPC: G06F16/34 , G06F16/36 , G06F40/211 , G06F40/284 , G06N3/0442
Abstract: 本发明涉及计算机技术领域,具体涉及一种基于Bi‑LSTM的TextRank中文摘要自动生成方法,以Word2vec模型转换的词向量为输入信息,利用Bi‑LSTM模型进一步处理,将输出的信息作为文本各句子的句向量,并用于计算句子间的相似度。通过以句子间相似度为边权重,以各句子为节点构建TextRank图结构,计算出各句子的TextRank值作为各句子权值,并根据权值大小进行排序,最后抽取候选摘要句组成最终的摘要。本发明通过Bi‑LSTM融合Word2vec+TextRank自动摘要模型,提出新的融合模型W2v‑BiL‑TR,提升了摘要抽取结果的质量。
-
公开(公告)号:CN116561296A
公开(公告)日:2023-08-08
申请号:CN202310462889.4
申请日:2023-04-26
Applicant: 桂林电子科技大学
IPC: G06F16/34 , G06F16/36 , G06F40/284 , G06F40/216 , G06F40/211
Abstract: 本发明涉及计算机技术领域,具体涉及一种基于文本多特征的TextRank中文摘要生成方法,通过Word2vec模型对文本提取词向量,并融合为句向量后计算句子之间的相似度,以相似度为边的权值,以各句子为节点构造TextRank图模型,并计算出各句子的TextRank值,然后对文本分别进行情感词特征、关键词特征、转折词特征以及标点特征的多特征提取,计算出文本中各句子的多特征值并与各句子的TextRank值结合,最后得到各句子的权值进行句子排序,抽取排序靠前的句子作为候选摘要句。本发明在虑文本的语义特征基础上,融合了文本的情感特征,使得生成的摘要质量更高。
-