-
公开(公告)号:CN116894088A
公开(公告)日:2023-10-17
申请号:CN202310880337.5
申请日:2023-07-18
Applicant: 浙江大学
IPC: G06F16/34 , G06F16/35 , G06F40/30 , G06N3/0442 , G06N3/08 , G06N3/045 , G06N3/047 , G06F18/214 , G06F18/241 , G06F18/2415
Abstract: 本发明公开了一种基于语义切分的法律文书自动摘要方法和系统,属于自然语言处理领域。本发明获取民事一审裁判文书作为输入,使用连续句子分类的方法,对裁判文书进行语义切分,将裁判文书划分为争议类别,原告诉求,被告陈述,事实与理由,裁判依据、裁判主文与尾部共五个部分的文本段落;对切分后的每个文本段落分别使用生成式文本摘要的方法得到摘要;对于同一裁判文书的各切分后段落生成的摘要,按顺序拼接得到最终结果。本发明对法律文书进行自动摘要,使用语义切分的方法,缩短了单次输入生成摘要模型的文本长度,并能够保留完整的原文语义结构特征。