一种可复用的法条推荐框架

    公开(公告)号:CN110717843A

    公开(公告)日:2020-01-21

    申请号:CN201911009434.7

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种可复用的法条推荐框架,包括以下步骤:提取裁判文书集构建训练语料;对裁判文书进行预处理,包括抽取出案件基本情况段落和引用法条列表,对案件基本情况进行中文分词,学习案件基本情况的向量表示模型,构建法条推荐任务的输出空间以及学习法条的语义向量模型;对用户输入的案件情况进行预处理;设计多标签分类模型对法条集进行预排序获得候选推荐法条集;对候选推荐法条集进行二次排序,获得最终推荐结果;输出推荐法条列表。本发明模拟给定案件基本情况筛选相关法条进行引用的真实场景,额外考虑法条自身的语义信息、法条与法条之间的关联进行法条推荐,通过再排序策略优化推荐结果,提高了法条推荐的准确性。

    一种司法领域数据的规范方法

    公开(公告)号:CN110609828A

    公开(公告)日:2019-12-24

    申请号:CN201810561376.8

    申请日:2018-05-29

    Applicant: 南京大学

    Abstract: 本发明旨在提出司法数据标准制的一般方法,目的在于为司法信息化系统间整合提供数据基础、提高数据质量和促进数据的共享,从而完善进一步完善司法信息化建设。此工作方法分为四个主要环节:数据需求的定义、数据清单的产生、数据标准的制定、数据标准的审定。这一方法为构建司法数据仓库打下基础,能够提高数据仓库的源系统数据的一致性和可用性,为司法数据标准规划提供了一套可以借鉴的思路。

    一种基于词向量学习模型的微博中文情感词典构建方法

    公开(公告)号:CN109376251A

    公开(公告)日:2019-02-22

    申请号:CN201811143903.X

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量学习模型的微博中文情感词典构建方法,包括:(1)针对当前微博数据的特征来获取相应的训练语料;(2)对训练语料进行数据预处理工作;(3)构造候选词典;(4)构造种子情感词典;(5)训练参数与配置的选取和定义;(6)训练词向量学习模型;(7)评估词向量学习模型训练结果;(8)迭代执行步骤(6),直到所有参数遍历训练完毕;(9)选择最优评估结果的词向量;(10)训练词语级情感极性分类器;(11)应用词语级情感极性分类器并获取最终的目标情感词典。本发明设计了一个结合语义和情感信息的词向量学习模型,由此设计了面向微博的中文情感词典构建方法,可以提升获取中文情感词典的效率与质量。

    一种基于深度强化学习的计算卸载调度方法

    公开(公告)号:CN109257429A

    公开(公告)日:2019-01-22

    申请号:CN201811143682.6

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明是一种基于深度强化学习的计算卸载调度方法,为物联网设备提供了一种计算卸载作出卸载决策方法,包括针对计算卸载的基本模型,对需要卸载的各个方面进行决策。基于不同的优化目标,通过改变价值函数,以达到不同的优化目标。本算法中的Deep-SARSA算法相似于DQN算法是结合强化学习与深度学习的深度强化学习算法,在配合了经验池可以有效的将卸载状态与卸载动作转变为深度学习的可训练样本。本发明能够有效的对不限维度的卸载状态模型进行机器学习,降低学习的复杂度,该方法使用神经网络作为Q值得线性逼近器,可以有效的提高训练速度,减少训练所需要的样本,该方法能有效的在既定模型和优化目标下,通过深度强化学习,作出最优的决策。

    一种基于PageRank和信息熵的裁判文书的文本分词方法

    公开(公告)号:CN108776653A

    公开(公告)日:2018-11-09

    申请号:CN201810534689.4

    申请日:2018-05-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于PageRank和信息熵的裁判文书的文本分词方法,该发明属于自然语言处理领域中的中文分词技术,主要采用了改进的PageRank算法、信息熵、互信息以及关键词词典对中文文本进行分词。本发明针对法律领域的裁判文书,在PageRank算法基础上建立了分词方法,根据Rank向量切分候选词,并利用信息熵对候选词进行修正,再依据裁判文书的关键词词典做术语合并,最终输出分词结果,该方法能够较为准确地对裁判文书进行分词。本发明与现有方法相比,其显著优点是:不需要通过大量文本语料库进行统计或训练以建立大规模的词典,仅对输入文本进行统计,将输入文本作为现有语料库进行统计挖掘,最终结合裁判文书的关键词术语词典即可完成分词。

    一种基于文本相似度的裁判文书的证据链关系模型构建方法

    公开(公告)号:CN108763485A

    公开(公告)日:2018-11-06

    申请号:CN201810534766.6

    申请日:2018-05-25

    Applicant: 南京大学

    CPC classification number: G06F17/271 G06F17/2775 G06F17/2785

    Abstract: 本发明是一种基于文本相似度的裁判文书证据链关系模型构建方法,该构建方法的主要步骤包括:(1)针对中文裁判文书进行文本预处理;(2)读取预处理后裁判文书中的证据段与事实段;(3)抽取证据链体及事实的What、Where、Who、When和How Much这五类关键要素;(4)通过计算关键要素联结计算构造证据链关系模型中的证据与证据的关联以及证据与事实的关联完成模型构建;(5)并计算建模后的证据链关系模型中每条证据链的权重;(6)将构建出的模型以Excel表格格式输出;(7)使用证据链建模工具展示生成的证据链关系模型的结构。本发明主要针对中国法律裁判文书说理评估中的证据链关系模型构建任务,根据裁判文书说理的特征和法院文书的结构特点,改善裁判文书预处理方法,优化关键要素提取技术,能够有效运用于评估裁判文书的事实说理水平。

    一种基于眼动数据的疲劳检测方法和装置

    公开(公告)号:CN106073805B

    公开(公告)日:2018-10-19

    申请号:CN201610369357.6

    申请日:2016-05-30

    Applicant: 南京大学

    Inventor: 胡炜 冯桂焕 骆斌

    Abstract: 本发明公开了一种基于眼动数据的疲劳检测方法和装置。该方法通过与待测人进行UI交互测试待测人反应的敏捷度,在测试的同时通过眼动仪采集眼动基本数据计算出眼动疲劳特征数据,最后再由反应的敏捷度和眼动疲劳特征数据结合采用机器学习算法判断出待测人是否处于疲劳状态。其中,与待测人进行UI交互测试待测人反应的敏捷度的过程由字符搜索测试和阅读理解测试组成。经测试,本发明的检测准确率达到了95.2%,相比于之前的疲劳检测法,具有极高的准确性、实用性、简便性、易学性等优点。

    基于内核的安卓程序实时行为分析方法及系统

    公开(公告)号:CN105184166B

    公开(公告)日:2018-02-13

    申请号:CN201510682288.X

    申请日:2015-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了基于内核的安卓程序实时行为分析方法以及能够实现该方法的行为分析系统,其中方法包括系统调用监控初始化步骤;内核系统调用拦截监控与解析步骤;基于解析结果生成信息日志步骤;基于信息日志的应用程序行为重构步骤。本发明通过在内核中拦截并解析系统调用,重构出应用程序的文件,网络以及安卓特有的进程间同行等行为,整个过程在内核中进行实时监控,保证行为获取的准确性,同时内核拥有最高的权限,恶意软件难以进行规避。本方法不修改安卓系统的任何代码,性能损耗低,实践证明本方法所产生的结果能作为取证的关键证据,以及提供恶意软件检测的依据。

    基于主题模型的裁判文书相似度分析方法

    公开(公告)号:CN107291688A

    公开(公告)日:2017-10-24

    申请号:CN201710376341.2

    申请日:2017-05-22

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于主题模型的裁判文书相似度分析方法。该方法采用机器学习中的LDA(Latent Dirichlet Allocation)主题模型,针对裁判文书,提出一种基于语义的、半自动化的、通用的相似度分析方法。本方法主要包括选取语料、建立相似度标注、文本预处理、输入选取、参数设置、迭代训练、生成模型和应用模型等步骤。该方法在一般相似度分析方法的基础上,充分考虑裁判文书内容上专业词汇丰富、语义复杂的特点,利用裁判文书半结构化的特性,从而提升了裁判文书相似度分析的准确性和适用性。

    基于安卓程序应用间攻击的自动化补丁系统及方法

    公开(公告)号:CN106022116A

    公开(公告)日:2016-10-12

    申请号:CN201610313468.5

    申请日:2016-05-12

    Applicant: 南京大学

    Inventor: 伏晓 谢佳筠 骆斌

    CPC classification number: G06F21/55

    Abstract: 本发明公开了一种基于安卓程序应用间攻击的自动化补丁系统及方法,其中方法包括配置初始化步骤、路径提取步骤、关键点定位步骤、应用间攻击补丁步骤。本发明中系统运行在应用层,能够十分精确的捕获上层语义,进而识别出恶意的行为,并针对这种行为进行自动化补丁;同时使用双向控制,能够识别出较为丰富的攻击类型,具备较强的分析防护能力。本发明采用静态分析和动态防护相结合的方式,克服了以往方法针对应用内部恶意行为的不足,提供了一种针对应用间恶意攻击的防护方法,使得防护效果全面有效。

Patent Agency Ranking