基于目标跟踪的半自动图像标注样本生成方法

    公开(公告)号:CN103559237B

    公开(公告)日:2017-02-15

    申请号:CN201310511762.3

    申请日:2013-10-25

    Applicant: 南京大学

    Inventor: 李宁 郭乔进

    Abstract: 本发明公开一种基于目标跟踪的半自动图像标注样本生成方法,该方法包括目标跟踪和半自动标注两个过程组成。通过利用目标跟踪机制生成一系列样本,同时设计了一种模板学习机制,用于目标区域的跟踪和检测,最后通过利用学习到的模板对视频或图像进行检测,并通过人工标注来辅助进行确认,从而生成标注样本。本发明的优点是能够通过利用很少的人力消耗来获取大量的标注图像样本。

    一种面向HDFS的网络报文并行读取方法

    公开(公告)号:CN106027414A

    公开(公告)日:2016-10-12

    申请号:CN201610353612.8

    申请日:2016-05-25

    Applicant: 南京大学

    CPC classification number: H04L49/9042 H04L67/1097

    Abstract: 本发明提供一种面向HDFS的网络报文并行读取方法,包括网络数据捕获与pcap报文解析两个阶段。本方法依托Hadoop平台的分布式框架MapReduce与分布式文件系统HDFS,将捕获的网络数据包写入HDFS,并通过本发明实现的二进制pcap流解析方法将pcap报文并行的解析出来,形成key‑value对然后交由MapReduce框架进行分析处理。通过本发明中的方法大大提高了HDFS下pcap格式文件的并行读取能力,进而提高了后续网络数据包的并行分析与处理效率。

    用于脑卒中分析的多智能体评价准则融合的特征选择系统

    公开(公告)号:CN112434737B

    公开(公告)日:2024-03-19

    申请号:CN202011333029.3

    申请日:2020-11-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于脑卒中分析的多智能体评价准则融合的特征选择系统,包括数据输入单元、数据预处理单元、初始特征序列建立单元、多智能体强化单元、特征融合单元、逻辑回归模型单元,通过对脑卒中数据进行不同属性的处理,并通过多智能体强化学习将三种特征评价准则按照最优权重策略进行特征融合,进一步得到所有特征的重要性排序序列和最优的特征子集,本发明在提高准确率的前提下减少特征子集,得到与脑卒中最相关的影响因素,进而从特征选择的角度提高对脑卒中疾病的预测性能。

    一种用于众测任务发布的文本摘要与图文检索生成方法

    公开(公告)号:CN113392245A

    公开(公告)日:2021-09-14

    申请号:CN202110664152.1

    申请日:2021-06-16

    Applicant: 南京大学

    Abstract: 本发明公开了一种用于众测任务发布的文本摘要与图文检索生成方法,采集真实众测场景任务发布中提取的相关数据,对相关数据进行筛选整理与清洗;对给定的相关单个或多个任务文档进行摘要生成,利用上阶段获得的任务相关文本摘要,收集相关图片数据库并检索出合适的图像;对检索出的两幅相关图像进行二次融合加工,以生成的方式整合为一张图片,提高图片与任务的匹配度和信息量。本发明通过在众测任务发布中对较为繁杂的任务文档提取较为简短的文本摘要,降低了众测平台方的工作量;同时使用图文检索与图像融合技术,生成具有特色的任务图片。

    基于社团发现的主题模型构建方法

    公开(公告)号:CN107122494B

    公开(公告)日:2020-06-26

    申请号:CN201710361414.0

    申请日:2017-05-22

    Applicant: 南京大学

    Abstract: 本发明公开一种基于社团发现的主题模型构建的方法的技术方案,先后包括如下步骤:基于短文本数据提取蕴含的关系网络;采用社团发现算法将关系网络划分成多个社团;将各社团中提取的短文本进行扩充以得到具有词共现关系的长文档,并将得到的多个长文档构成长文档集合;针对长文档集合进行主题挖掘,得到基于社团发现的TMCD主题模型。该方法从数据中内在蕴含的社团关系的角度出发,以社团发现算法为基础进行短文本的自扩展,解决了数据稀疏性问题。

    一种基于主题模型的短文本方面提取方法

    公开(公告)号:CN110532378A

    公开(公告)日:2019-12-03

    申请号:CN201910395663.0

    申请日:2019-05-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于主题模型的短文本方面提取方法,包括如下步骤:1)伪文档构建阶段:根据数据集构建词汇共现网络,生成词汇的伪文档;2)主题嵌入模块设置阶段:基于伪文档将词嵌入与主题嵌入联合训练,丰富词汇的潜在语义信息;3)注意力机制构建阶段:基于词向量信息重构句嵌入,最小化目标函数生成词汇权重参数;4)方面词汇聚类阶段:在词嵌入高维空间应用k-means聚类算法,输出最终方面词汇簇。本发明将主题嵌入与词嵌入联合训练,丰富了词汇的潜在语义信息,并通过注意力机制提高方面词汇权重,降低非方面词汇的权重,从而极大的提高了短文本方面提取模型的性能。

    基于新标签发现和标签增量学习的动态多标签分类方法

    公开(公告)号:CN108717552A

    公开(公告)日:2018-10-30

    申请号:CN201810470711.3

    申请日:2018-05-17

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于新标签发现和标签增量学习的动态多标签分类方法,在初始阶段,根据初始数据基于pairwise label ranking loss和误分类损失建立初始分类模型和初始集成聚类模型;数据流预测阶段,将具有新标签的样本放入一个缓冲区存储;模型更新阶段,构建新标签的子模型,将新标签子模型更新到分类模型中,并基于新标签样本对集成聚类模型更新。该方法不仅可以及时发现数据流中数据诞生的新标签,还避免了在数据流中存储大量的数据,只需要缓存一定的数据作为更新即可,进一步避免了重新训练模型导致的时间成本问题,同时解决了动态多标签分类问题中新标签产生的问题并在数据流中维持较高分类性能。

    基于社团结构挖掘算法的在线社会网络信息传播最大化方法

    公开(公告)号:CN104820945B

    公开(公告)日:2018-06-22

    申请号:CN201510186252.2

    申请日:2015-04-17

    Applicant: 南京大学

    Abstract: 基于复杂网络社团发现算法的信息传播最大化方法,包括如下步骤:1)复杂网络生成阶段:预处理从在线社会网络上爬取到的数据变为有向带权图;模型训练阶段:a)利用社团发现算法对复杂网络进行社团发现。b)为每一个社团,输出对应的子图。c)为每一个子图进行不同种子节点选取实验。d)利用所产生数据进行训练模型,并把得到的模型保存到指定区域以待使用。2)种子节点选取阶段:a)要进行挖掘的原始复杂网络分割为不同的社团,并生成对应子图。b)导入模型训练阶段训练好的预测。c)利用预测模型计算出每个子图应分配到几个种子节点进行挖掘。复杂网络数据中选取最具传播能力节点时的时间效率。具有选取结果优,数据处理速度快等优点。

    基于多标签模型的帕金森病证型的辅助预测方法

    公开(公告)号:CN104794339A

    公开(公告)日:2015-07-22

    申请号:CN201510186253.7

    申请日:2015-04-17

    Applicant: 南京大学

    Abstract: 本发明涉及一种基于多标签模型的帕金森病证型的辅助预测方法,包括预测模型的构建、均衡性评估和挖掘预测阶段处理模块;预测模型的构建模块:选定一个主证;选取K个次证;将主证和K个次证组成新的证型集;评估该证型集的均衡性;若均衡性满足条件,则确定了主证与次证的关联性,否则返回b;将证型集作为训练数据构建一个多标签模型;均衡性评估,将得到的证型集进行组合;统计证型组合的数量和出现的频率;根据信息熵公式,计算该证型集的熵值;结束;预测阶段,将给定的待预测数据传给得到模型进行分类;将所有模型的分类结果进行投票,得到最终预测结果。该方法解决了多标签分类算法在类别稀疏和不均衡的情况下预测不准确的问题。

    一种用于电信潜在换机用户发现的数据挖掘方法

    公开(公告)号:CN104794195A

    公开(公告)日:2015-07-22

    申请号:CN201510186319.2

    申请日:2015-04-17

    Applicant: 南京大学

    Abstract: 本发明提供用于电信潜在换机用户发现的数据挖掘方法,包括如下步骤:1)数据集构造阶段:a收集用户的消费信息、用户历史换机信息、用户信息、终端信息;b数据预处理,同时产生数据集;c处理类别不均衡的数据集,形成最终的训练集和预测集;挖掘阶段:a)获取步骤1-c中处理生成的数据集;b)实施决策树算法发现潜在换机用户;c)结束。本发明是基于数据挖掘的技术在电信用户中找出潜在的换机用户。和传统的方法相比更精确、更高效,具有实现简单、代价低等一系列的优点。

Patent Agency Ranking