-
公开(公告)号:CN106056137A
公开(公告)日:2016-10-26
申请号:CN201610353613.2
申请日:2016-05-25
Applicant: 南京大学
CPC classification number: G06K9/6276 , G06Q30/0255
Abstract: 本发明提供一种基于数据挖掘多分类算法的电信集团业务推荐方法,包括如下步骤:构建数据集阶段:1a)采用KNN算法预判用户的候选类子集;1b)基于类标特征属性构建用于训练与预测的标准数据集;模型训练与预测阶段:2a)获取步骤1b)中标准数据集;2b)训练一个朴素贝叶斯二分类;2c)采用分类器预测用户与集团类标的关系;结果合并阶段:3a)获取步骤2c)中二分类预测;3b)基于置信度策略合并二分类结果得到用户最终集团类标;c)结束。本发明的基于候选类子集和类标特征属性的多分类算法准确高效的为用户推荐集团业务,利用了海量业务数据进行精准营销,不仅能够减少用户流失,而且能够提高用户满意度,促进电信业发展。
-
公开(公告)号:CN102646168B
公开(公告)日:2014-12-17
申请号:CN201210110861.6
申请日:2012-04-16
Applicant: 南京大学
IPC: G06F19/00
Abstract: 本发明提供一种适用中药方剂(Traditional Chinese Medicine Herbs,以下简称TCMF)网络的基于共近邻相似三角形凝聚的层次重叠社区发现方法,包括如下步骤:1)共近邻相似三元组凝聚阶段a寻找所有三元组;b对任意两个三元组计算相似度;c给定三元组的相似度阈值,合并相似度高于相似度阈值的三元组对作为初始社区;d结束;2)簇合并阶段a计算任意两个初始社区的距离;b定初始社区距离阈值,合并距离小于距离阈值的两个初始社区;c结束。本发明的基于TCMF网络的层次重叠核心药群发现方法为TCMF网络发现提供了一种新的方法,该方法通过三个参数α,β,γ的设定能挖掘TCMF网络的高重叠及层次药群社区结构,为方剂配伍中核心药群发现提供了解决方案。
-
公开(公告)号:CN104077358A
公开(公告)日:2014-10-01
申请号:CN201410243718.3
申请日:2014-06-03
Applicant: 南京大学
CPC classification number: G06F17/30628 , G06F17/30675
Abstract: 本发明提供一种用于海量短文本信息发现的自动机方法,包括如下步骤:1)自动机建立:a用Trie树结构保存所有关键词,其中树节点视为状态,树边视为状态跳转;b为每个节点的跳转信息建立哈希表;c为每个词尾状态添加词尾标记和整词信息;d为每个节点添加fail跳转;e结束;2)自动机运行:a逐字读取文本,根据当前状态的跳转信息和读入字符进行跳转操作;b每当跳转到词尾状态时,输出该状态内保存的整词信息;c结束。本发明用于海量短文本信息发现的自动机方法在保证正确性的前提下,利用自动机方法大大提高了海量文本信息发现的效率,利用哈希表的方法减少了自动机跳转时查找跳转表的耗时,全程自动化,用户体验友好。
-
公开(公告)号:CN102663387A
公开(公告)日:2012-09-12
申请号:CN201210110064.8
申请日:2012-04-16
Applicant: 南京大学
Abstract: 本发明提供一种基于牙科全景图片的皮质骨宽度CW计算方法,包括如下步骤:1)基于OTSU和DLS的颏孔识别:a)图像预处理,使图像的颏孔和轮廓变得明显;b)采用OTSU方法对图像的阈值分割;c)形态学处理,让阈值分割后的图像边缘更加平滑;d)利用Canny算子检测图像边缘;e)最小二乘法椭圆拟合;f)结束;2)基于图像聚类和DLS的皮质骨宽度计算;a)提取ROI,提取左ROI时是以左颏孔为右上角,以颏孔到全景图下边缘为边长;而右ROI是以颏孔为左上角,以颏孔到全景图下边缘为边长;b)ROI预处理;c)图像聚类;d)形态学处理;e)最小二乘法曲线拟合;f计算皮质骨宽度,即计算颏孔点到上下边缘的距离差;g)结束。本发明在基于牙科全景图片下,实现了颏孔的自动识别和基于ROI的CW计算,在CW计算方法中提高了CW计算的准确性和效率,为医学图像处理提供了方便。
-
公开(公告)号:CN101482876B
公开(公告)日:2011-11-09
申请号:CN200810244679.3
申请日:2008-12-11
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明基于权重的链接多属性的实体识别方法,包括以下步骤:1)数据预处理阶段:a)收集节点间关系数据;b)确定节点之间权重的表现方式,包括权重属性定义以及权重属性计算方法;c)生成给定节点的四层联系图;d)结束;2)实体识别阶段:a)通过把1-c生成的联系图中链接多属性映射为单属性得到中间关联图;b)计算给定节点与中间关联图中的其他节点的相似度;c)进行相似度排序,得到相似度前几位的节点编号;d)结束;本发明的基于权重的链接多属性的实体识别方法,利用了实际中关系数据的权重和模式信息来进行相似度度量,以此扩展了传统的实体识别的相似度度量方法,并使用提出的相似度量方法成功解决了链接多属性的实体识别问题。
-
公开(公告)号:CN101977180A
公开(公告)日:2011-02-16
申请号:CN201010265437.X
申请日:2010-08-21
Applicant: 南京大学 , 江苏南大苏富特科技股份有限公司
IPC: H04L29/06
Abstract: 一种基于漏洞攻击的安全协议验证方法,方法采用安全协议一致性目标来描述安全协议的认证性与秘密性安全属性,使用基于进程状态变迁规则定义与数据类型映射模式的方式实现对安全协议的建模。本方法将对安全协议的验证转换成攻击者基于会话消息的性质约束,求解目标会话数据,攻击协议会话,发现安全协议漏洞的过程。本方法通过对安全协议的建模,实现攻击者由安全协议规则约束出发,通过拆分约束形成求解目标,并由求解过程形成求解域,最终实现对安全协议漏洞的搜索与验证。实验证明,本方法针对规则安全协议具备可终止性。
-
公开(公告)号:CN1838588A
公开(公告)日:2006-09-27
申请号:CN200610039899.3
申请日:2006-04-26
Applicant: 南京大学 , 江苏南大苏富特软件股份有限公司
Abstract: 基于高速数据处理平台的入侵检测方法和系统,由系统数据交换支持系统、数据接入及预处理板卡、入侵检测数据处理板卡组成;其中,接入板可实现接入数据预处理,通过对数据包计算HASH,将它们动态负载均衡的发到多块入侵检测处理板卡上进行处理;入侵检测数据处理板并行运行,以使整个系统达到千兆线速所需的处理效率;设有系统数据交换支持系统,负责在各系统部件之间进行数据传送。该系统利用高性能数据处理硬件平台对网络数据包接收及转发、查找、分析的高效性,结合流量负载均衡算法,在传统基于X86硬件架构的基础上,实现了一个千兆环境下的分布式入侵检测系统,提供了较好的检测性能。
-
公开(公告)号:CN114418253B
公开(公告)日:2025-04-25
申请号:CN202110664342.3
申请日:2021-06-16
Applicant: 南京大学
IPC: G06Q10/0631 , G06N3/042
Abstract: 本发明公开了一种基于图神经网络的自适应众包任务推荐方法,获取真实应用场景中的众包任务对象集合和推荐人群集合,根据众包任务对象和推荐人群依据经典KNN方法构建出众包网络图结构和推荐人群网络图结构;利用图神经网络方法GCN分别在众包网络图结构、推荐人群网络图结构上进行多轮信息传播,对众包任务以及推荐人进行任务嵌入表示和推荐人嵌入表示学习;递归的进行嵌入表示学习操作,多轮学习后,将得到的众包嵌入表示和推荐人嵌入表示采用t‑SNE映射到同一空间当中,根据邻近原则,将对应的任务推荐到具体到个人。本发明不仅可精准推荐众包任务到个人,而且比传统的众包任务推荐方法更加高效且准确,且更加科学合理。
-
公开(公告)号:CN113297089B
公开(公告)日:2023-06-20
申请号:CN202110642819.8
申请日:2021-06-09
Applicant: 南京大学
IPC: G06F11/36 , G06F16/36 , G06F40/289 , G06F40/295 , G06F40/30
Abstract: 本发明公开了一种基于知识图谱的众测助理实现方法。数据采集阶段,确定好与测试领域相关的关键词;数据预处理阶段,设计相应的规则提取内容中的三元组,同时将别名、外文名用于实体对齐,与通用知识图谱CN‑DBpedia合并;数据存储阶段,以图数据库Neo4j存储数据,利用Cypher查询语句将三元组嵌入图数据库中;问句解析阶段,从用户的输入中,利用模板匹配从中抽取出槽值对,槽对应实体,值对应关系或属性,用py2neo嵌入Cypher语句查询相应的结果,并以聊天格式返回给用户。本发明以图数据库作为存储结构,满足了智能助理所要求的最大延时,领域内的知识图谱能够使智能助理为测试人员提供更好的帮助。
-
公开(公告)号:CN113361762A
公开(公告)日:2021-09-07
申请号:CN202110612266.1
申请日:2021-06-02
Applicant: 南京大学
Abstract: 本发明提出了众包任务中的数据偏见处理方法。在众包数据收集阶段,需要获取足够多的数据,并且需要保证数据质量。但是在利用众包获取大量的标签数据可能会存在偏见。该方法利用可解释机器学习方法对众包数据收集的结果进行诊断,分析可能存在的机器学习方法中前处理,后处理对众包数据可能存在的偏见进行处理。数据偏见分析和诊断阶段,对数据中可能存在的偏见和模型漏洞进行分析;前处理阶段,通过前处理,包括盲点法,因果歧视法改善数据偏见,提升模型公平性;后处理阶段,通过均等机会,均等PPV等方法改善模型偏见。本发明可以比较有效地诊断数据收集过程中可能存在的偏见,并可以较为有效地消除后续可能使用数据的机器学习模型偏见。
-
-
-
-
-
-
-
-
-