一种基于联合深度学习模型的法条推荐方法

    公开(公告)号:CN110750635B

    公开(公告)日:2023-12-15

    申请号:CN201911009433.2

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器‑解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。

    一种基于词向量学习模型的微博中文情感词典构建方法

    公开(公告)号:CN109376251A

    公开(公告)日:2019-02-22

    申请号:CN201811143903.X

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量学习模型的微博中文情感词典构建方法,包括:(1)针对当前微博数据的特征来获取相应的训练语料;(2)对训练语料进行数据预处理工作;(3)构造候选词典;(4)构造种子情感词典;(5)训练参数与配置的选取和定义;(6)训练词向量学习模型;(7)评估词向量学习模型训练结果;(8)迭代执行步骤(6),直到所有参数遍历训练完毕;(9)选择最优评估结果的词向量;(10)训练词语级情感极性分类器;(11)应用词语级情感极性分类器并获取最终的目标情感词典。本发明设计了一个结合语义和情感信息的词向量学习模型,由此设计了面向微博的中文情感词典构建方法,可以提升获取中文情感词典的效率与质量。

    一种基于联合深度学习模型的法条推荐方法

    公开(公告)号:CN110750635A

    公开(公告)日:2020-02-04

    申请号:CN201911009433.2

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器-解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。

    一种裁判文书说理评估方法

    公开(公告)号:CN109582950A

    公开(公告)日:2019-04-05

    申请号:CN201811143966.5

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于计算相似度的裁判文书说理评估方法,主要步骤包括:切分法条前后件;使用XML解析技术提取出文书中的关键信息;构建法律专有停用词库,输入文本预处理等;将输入文本输入进模型中得到文本匹配结果;若是“法条与结论”的评估,使用“匹配关键字,比较量刑程度”的思路来判断逻辑是否一致;综合每一项评估主体的计算结果,将清晰简明的评估结果反馈给系统用户。本发明模拟法官检验裁判文书是否存在说理缺少关键环节、说理不充分、判决结果不合理的真实应用场景,每篇文书的评估速度约为8~10秒,速度较快,对于常见的9种刑事案件的评估准确率较高,能够满足真实应用场景下的使用要求。

    一种基于深度学习和特征融合的文本情感分类方法

    公开(公告)号:CN110750648A

    公开(公告)日:2020-02-04

    申请号:CN201911003328.8

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明提出一种基于深度学习和特征融合的文本情感分类方法,该方法通过整合层次特征学习文本表示,包括:根据文本极性及否定词,为情感词设计不同环境的向量表示;为词性采样得到向量区分同形词;结合表情符优化词向量,使用神经网络模型学习基于词向量的单句特征;通过字序列学习基于字向量的单句特征;两部分拼接得到句子级特征;对于至少包含两个单句的文档,句向量序列输入到上层神经网络学习基于神经网的文档特征,并对段首、段尾和包含总结词的句子取平均获得基于规则的文档特征,两部分拼接获得文档级特征。针对具体任务,将单句或文档特征输入随机森林分类器即可预测情感类别。与基础模型相比,本发明能够有效提高文本情感分类的准确性。

Patent Agency Ranking