一种基于有监督情感文本和词向量的情感词典构建方法

    公开(公告)号:CN108647191B

    公开(公告)日:2021-06-25

    申请号:CN201810473308.6

    申请日:2018-05-17

    Applicant: 南京大学

    Abstract: 本发明提出一种基于有监督情感文本和词向量的情感词典构建方法,包括数据处理阶段、词向量情感嵌入阶段、情感词典生成阶段共三个阶段。本方法使用神经网络生成词向量,将情感嵌入到词向量内部,挖掘词与词之间的内在联系,然后构建词关系图,使用标签传播算法传播情感标签,自动构建特定领域的情感词典。通过本发明解决了基于人工和基于知识库的方法所构造的情感词典在处理特定领域的情感分析任务时不准确的问题。

    一种基于对抗训练和对抗学习网络的半监督文本分类方法

    公开(公告)号:CN110532377A

    公开(公告)日:2019-12-03

    申请号:CN201910395284.1

    申请日:2019-05-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于对抗训练和对抗学习网络的半监督文本分类方法,在初始化网络阶段,首先初始化预测网络,其次初始化评判网络;对抗学习训练阶段,通过预测网络和评判网络的对抗作用,利用policy gradient策略对预测网络进行不断的优化,直至达到最优的效果;模型预测阶段,使用已经训练好的预测网络对新样本的标签进行预测。该方法利用对抗训练可以有效提高模型的正则化能力,增强模型的鲁棒性,同时借鉴对抗学习可以直接利用未标记样本进行模型的训练,通过对抗学习网络中子网络间的对抗作用不断迭代,能有效提高网络的分类性能。

    适用TCMF网络的基于多三角形群组相似性凝聚的重叠社区发现方法

    公开(公告)号:CN105184075B

    公开(公告)日:2018-07-06

    申请号:CN201510553048.X

    申请日:2015-09-01

    Applicant: 南京大学

    Abstract: 本发明提供一种适用TCMF网络的基于多三角形群组相似性凝聚的重叠社区发现方法,包括如下步骤:1)寻找初始社团阶段:a寻找中心点,并初始化社团;b搜索多三角形群组,加入到初始社团;c重复上述步骤直到中心点的度数小于阈值;d将未分派的结点加入到初始社团;e结束;2)合并初始社团阶段:a计算每两个社团之间的相似度;b选择最相似的两个社团合并;c重复以上步骤直到结束。基于多三角形群组相似性凝聚的重叠社团发现方法适用于TCMF网络,利用多三角形的技术大大提高了社团划分的准确度,可以从TCMF网络当中准确地发现药群社区结构信息。

    一种中药方剂核心药物的发现方法

    公开(公告)号:CN104820775A

    公开(公告)日:2015-08-05

    申请号:CN201510183745.0

    申请日:2015-04-17

    Applicant: 南京大学

    Abstract: 一种中药方剂核心药物的发现方法,由改进聚类算法和加权TF-IDF算法两部分组成,聚类算法包括方剂数据的预处理、聚类距离函数的选择和聚类挖掘算法三部分,其中方剂数据的预测理将方剂数据处理成适合聚类算法的模型;聚类距离的选择用于选择合理的聚类距离函数;距离挖掘算法用于将相似的方剂聚类成一个簇;加权TF-IDF算法用于计算药物的权重,发明的权重计算公式结合聚类结果、药物顺序重要度、TF-IDF算法三部分;算法具有较高的准确性。

    基于格式塔视觉原理的运动目标区域整合优化方法

    公开(公告)号:CN102663368B

    公开(公告)日:2014-09-17

    申请号:CN201210111016.0

    申请日:2012-04-16

    Applicant: 南京大学

    Abstract: 本发明提供一种基于格式塔视觉原理的运动目标区域整合优化方法,包括规则抽象阶段和整合优化阶段。本发明的基于格式塔视觉原理的运动目标区域整合优化方法,根据格式塔视觉原理的两个原则,抽象出将两个目标车辆区域整合的规则,当两个目标满足所有整合条件的时候,将两个目标整合为一个目标,回归这两个目标本身该有的整体特性。

    基于复杂网络模型并行化标签传播算法的药物社团发现方法

    公开(公告)号:CN102663108B

    公开(公告)日:2013-11-13

    申请号:CN201210111171.2

    申请日:2012-04-16

    Applicant: 南京大学

    Abstract: 本发明提供一种基于复杂网络模型并行化标签传播算法的药物社团发现方法,包括如下步骤:组网阶段:a)预处理生成中药数据集,格式化为文本数据;b)将初始文本数据部署至Hadoop平台;c)并行化组建中药药物(Traditional Chinese Medicine简称TCM)网络;d)结束。挖掘阶段:a)获取步骤1-c处理生成的TCM网络文本文件;b)将TCM网络文本文件部署至Hadoop平台;c)实施并行化标签传播算法发现药物社团;d)结束。本发明的基于复杂网络模型并行化标签传播算法的药物社团发现方法建立了TCM网络模型,利用并行化技术提高了组网以及标签传播算法的可扩展性和运行速度,并且能有效挖掘复方中药性相似的药物社团,帮助研究中药配伍规律。

    基于格式塔视觉原理的运动目标区域整合优化方法

    公开(公告)号:CN102663368A

    公开(公告)日:2012-09-12

    申请号:CN201210111016.0

    申请日:2012-04-16

    Applicant: 南京大学

    Abstract: 本发明提供一种基于格式塔视觉原理的运动目标区域整合优化方法,包括规则抽象阶段和整合优化阶段。本发明的基于格式塔视觉原理的运动目标区域整合优化方法,根据格式塔视觉原理的两个原则,抽象出将两个目标车辆区域整合的规则,当两个目标满足所有整合条件的时候,将两个目标整合为一个目标,回归这两个目标本身该有的整体特性。

    基于复杂网络模型并行化标签传播算法的药物社团发现方法

    公开(公告)号:CN102663108A

    公开(公告)日:2012-09-12

    申请号:CN201210111171.2

    申请日:2012-04-16

    Applicant: 南京大学

    Abstract: 本发明提供一种基于复杂网络模型并行化标签传播算法的药物社团发现方法,包括如下步骤:组网阶段:a)预处理生成中药数据集,格式化为文本数据;b)将初始文本数据部署至Hadoop平台;c)并行化组建中药药物(Traditional Chinese Medicine简称TCM)网络;d)结束。挖掘阶段:a)获取步骤1-c处理生成的TCM网络文本文件;b)将TCM网络文本文件部署至Hadoop平台;c)实施并行化标签传播算法发现药物社团;d)结束。本发明的基于复杂网络模型并行化标签传播算法的药物社团发现方法建立了TCM网络模型,利用并行化技术提高了组网以及标签传播算法的可扩展性和运行速度,并且能有效挖掘复方中药性相似的药物社团,帮助研究中药配伍规律。

    高性能网络数据处理平台系统和处理方法

    公开(公告)号:CN1838624A

    公开(公告)日:2006-09-27

    申请号:CN200610039900.2

    申请日:2006-04-26

    Abstract: 高性能网络数据处理平台系统,包括网络处理器、符合CPCI2.16系统数据交换支持系统、采用CPCI 2.16的机箱作为系统数据交换支持系统,包括冗余电源、系统硬件故障自检单元,采用多块支持CPCI 2.16的x86处理板构成数据接入及预处理板卡、数据处理和存储板卡、系统硬件故障自检单元,数据接入板采用高速网络处理器,并集成支持高速查表的三重内容可寻址存储器芯片和支持对内容进行模式检查、匹配和标记的协处理器芯片、CPCI2.16接口控制芯片构成数据处理及存储板卡,构建一个实用高性能网络数据处理平台系统。各处理单元间实现高效通信和高效的处理同步机制,降低各并行处理单元间数据依赖。

    一种基于语义嵌入的词向量改进模型的建立方法

    公开(公告)号:CN110532395B

    公开(公告)日:2021-09-28

    申请号:CN201910395662.6

    申请日:2019-05-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于语义嵌入的词向量改进模型的建立方法,包含如下步骤:1)双向长短期记忆网络训练阶段;2)上下文向量计算阶段:将句子和目标单词t输入步骤1训练好的双向长短期记忆网络中,求得上下文向量;3)上下文向量语义聚类阶段:a使用余弦相似度计算当前的上下文向量和单词t每个语义簇中心相似度;b使用贝叶斯非参数统计模型计算当前上下文向量归属为的类簇的概率P;c最大化P值并求出该值对应的类簇;c对当前上下文向量归属的类簇中心进行偏移;4)语义向量计算阶段。本发明利用神经网络和贝叶斯非参数统计方法为解决了当前词向量模型无法解决单词存在的一词多义问题。

Patent Agency Ranking