-
公开(公告)号:CN108897770A
公开(公告)日:2018-11-27
申请号:CN201810534856.5
申请日:2018-05-25
Applicant: 南京大学
Abstract: 本发明公开了一种面向裁判文书的法条名称规范化及案由与法条的关联统计方法。本方法面对法院的裁判文书,采用了编辑距离算法,对法条法规进行规范化处理,针对裁判文书中案由和法条之间的密切关系,提出了案由法条关联统计分析方法。本方法主要包括裁判文书的半结构化预处理,读取结构化文书中案由和法条信息,法律法条的规范化处理,法律法条按实体法真实情况进行筛选并建立数据库,生成EXCEL表单形式的案由法条关联统计信息,生成TXT形式的法条案由关联统计信息。本方法充分考虑裁判文书人为书写错误,规范化法条名称,统计出各案由的常引法条的规律。
-
公开(公告)号:CN109376251A
公开(公告)日:2019-02-22
申请号:CN201811143903.X
申请日:2018-09-25
Applicant: 南京大学
Abstract: 本发明公开了一种基于词向量学习模型的微博中文情感词典构建方法,包括:(1)针对当前微博数据的特征来获取相应的训练语料;(2)对训练语料进行数据预处理工作;(3)构造候选词典;(4)构造种子情感词典;(5)训练参数与配置的选取和定义;(6)训练词向量学习模型;(7)评估词向量学习模型训练结果;(8)迭代执行步骤(6),直到所有参数遍历训练完毕;(9)选择最优评估结果的词向量;(10)训练词语级情感极性分类器;(11)应用词语级情感极性分类器并获取最终的目标情感词典。本发明设计了一个结合语义和情感信息的词向量学习模型,由此设计了面向微博的中文情感词典构建方法,可以提升获取中文情感词典的效率与质量。
-