一种业务流程模型图像识别与再构方法

    公开(公告)号:CN110838105B

    公开(公告)日:2023-09-15

    申请号:CN201911048985.4

    申请日:2019-10-30

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于图像轮廓识别及图像分类的从BPMN图片中提取业务流程模型信息并再构的方法,步骤包括使用形态学操作对图片进行分割,快速而准确地将业务流程模型图片分割成独立的部分;使用轮廓检测算法替代主流的目标检测深度神经网络算法,在保证准确率的前提下提升元素检测的效率,确定图片中元素的位置和大小;使用霍夫变换来检测图片中的直线,从而完成连接关系的检测,使用特殊递归算法保证复杂的连接关系也能被正确检测;使用光学字符识别技术,识别BPMN图元中的文本信息,使得模型更加完整;能够自动从BPMN图片中构建业务流程模型并导出模型定义文件,便于修改与编辑,大大节省了人工绘制业务流程模型所需要耗费的时间。

    一种面向裁判文书的证据链关系模型的构建方法

    公开(公告)号:CN107632968A

    公开(公告)日:2018-01-26

    申请号:CN201710376342.7

    申请日:2017-05-22

    Applicant: 南京大学

    Abstract: 本发明是一种面向中文裁判文书的证据链关系模型构建方法,构建方法的流程如图所示,主要包括以下步骤:针对中文裁判文书进行文本预处理;读取处理后的XML格式文件提取出证据链体集合和事实集合;根据4W1H关键要素提取策略获得每个证据链体及事实的关键词集合;通过计算关键要素关联度构造证据链关系模型中的联结完成模型构建;将构建出的模型生成为Excel表格;将结构化模型显示为可视模型。本发明主要针对法律裁判文书说理评估中的证据链关系模型构建任务,根据裁判文书说理的特征和法院文书词汇的特点,改善裁判文书预处理方法,优化关键要素提取技术,提高证据链中联结的计算正确率,能够有效运用于评估裁判文书的事实说理水平。

    基于词向量模型的法条推荐方法

    公开(公告)号:CN109446416B

    公开(公告)日:2021-09-28

    申请号:CN201811170180.2

    申请日:2018-09-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量模型的法条推荐方法,该发明属于推荐系统技术领域中的协同过滤推荐技术,协同过滤是通过借助相似的事物来为事物推荐或者筛选信息的技术,推荐法条需要借助裁判文书中的基本案件情况获取其他案情相近的文书,然后根据多个前例推荐法条。本发明与现有方法相比,其显著优点是:引入词向量模型后,通过词向量的计算能够更准确地表达两段案件基本情况的相似程度,从而为裁判文书找到案情更相似的文书。并且根据多个相似案情的文书可以采取多种协同过滤推荐策略,获得更准确的推荐结果。

    一种面向软件资产复用的众包需求管理和分析框架

    公开(公告)号:CN110888629A

    公开(公告)日:2020-03-17

    申请号:CN201911048873.9

    申请日:2019-10-30

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向软件资产复用的众包需求管理和分析框架,包括以下步骤:由项目发布者发布项目;通过众包平台收集项目需求;将收集到的项目需求进行预处理,包括检验需求重复/冲突并进行需求分类,对需求进行优先级排序等以及对收集到的项目需求做初步筛选;对经过筛选的项目需求进行一些软件资产完善操作,包括UML图的绘制、软件设计、项目文档的编辑以及相关代码的提交;将已生成的软件资产同项目需求或其他软件产物进行关联;生成软件资产关联表。本发明可以帮助快速定位到其他可复用的软件资产,即尽可能早地实现软件资产复用,实现在整个研发过程中软件资产关联明确化,大大节省众包需求管理的时间,提高了工作效率。

    基于词向量模型的法条推荐方法

    公开(公告)号:CN109446416A

    公开(公告)日:2019-03-08

    申请号:CN201811170180.2

    申请日:2018-09-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量模型的法条推荐方法,该发明属于推荐系统技术领域中的协同过滤推荐技术,协同过滤是通过借助相似的事物来为事物推荐或者筛选信息的技术,推荐法条需要借助裁判文书中的基本案件情况获取其他案情相近的文书,然后根据多个前例推荐法条。本发明与现有方法相比,其显著优点是:引入词向量模型后,通过词向量的计算能够更准确地表达两段案件基本情况的相似程度,从而为裁判文书找到案情更相似的文书。并且根据多个相似案情的文书可以采取多种协同过滤推荐策略,获得更准确的推荐结果。

    一种裁判文书的检索方法

    公开(公告)号:CN109359173A

    公开(公告)日:2019-02-19

    申请号:CN201811272641.7

    申请日:2018-10-24

    Applicant: 南京大学

    Abstract: 本发明公开了一种裁判文书的检索方法,包括以下步骤:(1)根据裁判文书内容定义索引字段,设置字段类型,创建索引;(2)将裁判文书文件导入索引;(3)对裁判文书进行检索,并根据检索条件,按照匹配程度排序并分页显示结果列表,进一步筛选以缩小结果集;(4)对结果列表中的单篇裁判文书具体信息分节点异步加载和展示;(5)对结果列表中的裁判文书文件进行下载。本发明能提供高效的裁判文书全文检索和清晰的裁判文书阅读体验,显著降低了裁判文书的检索难度和阅读难度,极大的提升了法律从业人员的工作效率。

    一种基于LDA主题模型的法条推荐方法

    公开(公告)号:CN108763484A

    公开(公告)日:2018-11-06

    申请号:CN201810534723.8

    申请日:2018-05-25

    Applicant: 南京大学

    CPC classification number: G06Q50/18

    Abstract: 本发明是一种基于LDA主题模型的法条推荐方法,包括以下步骤:提取裁判文书集构建训练语料;将裁判文书进行预处理,包括抽取出案件基本情况段落和引用法条列表,将案件基本情况进行中文分词,去除法律专有停用词以及法条名称标准化;对案件情况进行预处理;训练LDA主题模型提取与案件情况相似的裁判文书集;提取推荐法条集,设计法条关联度打分机制计算法条与案件的关联度,并结合频繁项集挖掘关联法条;输出推荐法条列表。本发明模拟法官在实际审判过程中,经常查阅相似裁判文书来决定法条引用的真实场景,从语义层面度量了裁判文书的相似度,能准确获得相似的裁判文书并进行关联法条推荐,提高了法条推荐的准确性。

    一种裁判文书的文本信息脱敏方法

    公开(公告)号:CN112149180A

    公开(公告)日:2020-12-29

    申请号:CN202011036947.X

    申请日:2020-09-27

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于规则设计的敏感信息命名实体识别和处理方法,包括以下步骤:对用户输入进行预处理,包括过滤不可脱敏项和保存待脱敏裁判文书文件至本地;对裁判文书进行预处理,包括重新调整文书结构,去除其中无用字符;应用脱敏规则,根据用户输入的待脱敏项处理文书,使用正则表达式进行匹配,并通过特征词进行判断和处理,再利用找到的敏感信息词生成其在文书中的信息坐标集合;逐行读取原文书文本,并依次提取信息坐标进行文本替换;输出脱敏后文书文件。本发明模拟法院审管办人员在实际将裁判文书进行网络发布过程中,进行脱敏处理的真实场景,从文书结构分析了各敏感信息的相关规则,能准确定位敏感信息,提高了脱敏结果的准确性。

    面向领域的文本大数据快速分词方法

    公开(公告)号:CN110956036A

    公开(公告)日:2020-04-03

    申请号:CN201811143681.1

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向领域的文本大数据快速分词方法,涉及大数据和自然语言预处理领域,解决了目前对大量中文实时文本分词速度慢且较难识别新词的问题。本发明的关键步骤有二:(1)对语料中的邻接字建立频次模型;(2)查找合适的位置将待分词句子切分为若干词语片段。本发明所采用的方法和效果有如下特点:(1)基于统计,不需要预先建立词典,和其他人工干预;(2)在专用领域的语料上有较强的新词发现能力;(3)分词时间复杂度为O(n),明显快于其他分词工具;(4)分词的平均错误率在10%以下。

    一种基于深度神经网络的电子卷宗标题定位提取与分类方法

    公开(公告)号:CN110929746A

    公开(公告)日:2020-03-27

    申请号:CN201910454209.8

    申请日:2019-05-24

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于深度神经网络的电子卷宗标题定位提取与分类方法,包括以下步骤:将卷宗图片输入神经网络提取多张多尺寸的特征图,根据输出的特征图计算类别分数以及边框位置,通过多种标题选举算法推选出文书当中的标题位置以及标题类别。本发明目的是为了解决在实际处理电子卷宗过程中,经常需要手动对电子卷宗图像进行分类的情况,从单纯的图像层面而不是通过OCR(光学字符识别)等方式来提取图像的标题,通过图像的特征能够准确获得图像标题的位置及类别,提高了鲁棒性泛用性,提高了图像分类的准确性。

Patent Agency Ranking