-
公开(公告)号:CN115587909A
公开(公告)日:2023-01-10
申请号:CN202110764875.9
申请日:2021-07-06
Applicant: 南京大学
IPC: G06Q50/18 , G06N3/04 , G06N3/08 , G06F16/34 , G06F40/289
Abstract: 一种基于生成式对抗网络的司法文本数据扩增方法,将生成式对抗网络进行改进,使其适用于文本数据的生成,并将其应用于司法文本的数据扩增中,以获得更为丰富的训练文本数据。主要分为三个步骤,第一个步骤为对抗生成网络模型的搭建,将传统的生成式对抗网络进行改进,使其可以应用于文本的生成;第二个步骤是文本的预处理,进行分词及词向量的应用等操作;最后一个步骤为司法文本数据的生成,将司法文本数据预处理后输入对抗生成网络中,进行司法文本数据的生成。本发明可以基于生成式对抗网络进行司法文本的生成,可应用于深度学习的数据扩增中,生成一批与原数据具有相同分布的训练及测试数据,可以更有效地使用现有数据,缓解神经网络泛化能力差的情况,从而促进司法领域深度学习模型的发展。
-
公开(公告)号:CN115587168A
公开(公告)日:2023-01-10
申请号:CN202110764787.9
申请日:2021-07-06
Applicant: 南京大学
IPC: G06F16/332 , G06N3/04 , G06N3/08 , G06F40/268 , G06F40/289 , G06F40/295
Abstract: 本发明是一个根据上下文及答案自动化生成问题的方法。该方法通过把文本的深度语义特征融合到大型预训练模型(BERT、ULMFit)中,进而获取文本的深层次的语义表示。该方法不仅考虑了典型的文本语言信息(如POS、NER),还针对QG问题提出了一种新的语言学特征QAF。经过大量的实验,结果表明该方法达到目前最优水平。本发明的目的在于提供一种高质量的问题生成方法,促进问答技术等领域的发展,加速实现智能化的人机交互,进而促进社会发展和高效率运行。
-
公开(公告)号:CN115587159A
公开(公告)日:2023-01-10
申请号:CN202110764789.8
申请日:2021-07-06
Applicant: 南京大学
IPC: G06F16/33 , G06F16/332
Abstract: 本发明提出了一种社区问答系统关键信息补充方法,用于帮助提问者回顾自己的提问方式,补充遗漏的要素便于网友更快地解决这一问题,亦或是在这一环节中引导提问者自行解决问题。该发明的主要创新在于(1)使用Similar Questions Model框架中的相似度算法从数据集中计算问题帖之间的相似度;(2)使用BM25完成问题匹配,相似度计算工作;(3)通过RAKE算法生成关键词或者关键短语。
-
公开(公告)号:CN115587726A
公开(公告)日:2023-01-10
申请号:CN202110764872.5
申请日:2021-07-06
Applicant: 南京大学
IPC: G06Q10/0631 , G06Q10/0639
Abstract: 一种基于案情事实的深度刑期预测方法,其将深度学习的模型使用在司法领域的刑期预测方面,将案情事实处理为特征向量,刑期作为标签。方法主要分为三个步骤,第一个步骤为文本的预处理,将抽取出的案情事实做分词和特征化工程,处理后的序列作为案情的特征表示,然后将刑期划分为5个种类并为每一个案件做好标签。第二个步骤是将处理好的数据集作为输入,用fastText算法训练得到刑期预测模型,最后一个步骤是将测试集按照第一个步骤的方式处理后,使用第二个步骤得到的模型进行刑期预测,然后和实际上的标签进行比对。本发明可以基于案情事实基本准确的预测出刑期的标签,为工作人员提出量刑建议提供了参考。
-
公开(公告)号:CN115587167A
公开(公告)日:2023-01-10
申请号:CN202110764752.5
申请日:2021-07-06
Applicant: 南京大学
IPC: G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明是一个能够根据上下文及答案自动化生成问题的方法。该方法通过把整个段落进行编码,捕获整个段落的语义信息;同时使用句子级编码方式结合句子级注意力机制,获得句子间的逻辑关系。该方法克服了传统问题生成模型不能使用完整上下文信息的弊端,充分利用了上下文段落的语义信息和句子间的逻辑关系。经过大量的实验,结果表明该方法能够有效的生成较高质量的问题。本发明的目的在于提供一种高质量的问题生成方法,促进问答技术等领域的发展,加速实现智能化的人机交互,进而促进社会发展和高效率运行。
-
公开(公告)号:CN115587166A
公开(公告)日:2023-01-10
申请号:CN202110764618.5
申请日:2021-07-06
Applicant: 南京大学
IPC: G06F16/332 , G06F16/35 , G06N3/04
Abstract: 本发明是一种面向对话系统的线程跟踪方法。本方法运用RNN+Attention+Gate模型完成多轮对话的多标签意图识别,在存储器中保存上下文信息作为记忆,引入Attention机制筛选有用记忆,通过门控制来判定当前语句是否需要引用上下文信息,从而得到线程跟踪结果。本发明目的在于确定多轮对话中的不同线程,帮助用户理解该对话集的主题,从而解决根据上下文信息识别语句的多意图问题。
-
-
-
-
-