一种基于对抗训练和对抗学习网络的半监督文本分类方法

    公开(公告)号:CN110532377B

    公开(公告)日:2021-09-14

    申请号:CN201910395284.1

    申请日:2019-05-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于对抗训练和对抗学习网络的半监督文本分类方法,在初始化网络阶段,首先初始化预测网络,其次初始化评判网络;对抗学习训练阶段,通过预测网络和评判网络的对抗作用,利用policy gradient策略对预测网络进行不断的优化,直至达到最优的效果;模型预测阶段,使用已经训练好的预测网络对新样本的标签进行预测。该方法利用对抗训练可以有效提高模型的正则化能力,增强模型的鲁棒性,同时借鉴对抗学习可以直接利用未标记样本进行模型的训练,通过对抗学习网络中子网络间的对抗作用不断迭代,能有效提高网络的分类性能。

    一种基于社交网络的众包测试人员招募方法

    公开(公告)号:CN112418803B

    公开(公告)日:2024-04-12

    申请号:CN202011342832.3

    申请日:2020-11-25

    Applicant: 南京大学

    Abstract: 本发明提供了一种基于社交网络的众包测试人员招募方法,包括任务分割、任务发布和传播、传播网络构建、收益分配四个阶段;首先将众测任务分割为单个测试者可以完成的小任务;然后将任务发布给众包测试平台,使得任务信息在社交网络中进行传播;其次采用邀请码技术来记录每个测试人员的上级,从而形成传播网络;最后在收益分配阶段,根据传播网络进行收益分配。本发明解决了传统众包测试中无法在短时间内招募到足够的测试人员的问题,为众测提供人员保障。本发明利用社交网络强大的人员招募能力,在短时间内为众测招募到足够的工作者,同时创建了灵活的收益分配方式,使得人员招募具有良好的激励性。

    一种基于频率属性和PCA的时空索引建立方法

    公开(公告)号:CN110134692B

    公开(公告)日:2023-04-07

    申请号:CN201910413012.X

    申请日:2019-05-17

    Applicant: 南京大学

    Abstract: 一种基于频率属性和PCA的时空索引建立方法,1)数据采集,采集并获取足够多的真实应用场景中的对象产生的具有经度、纬度、时间以及查询频率四个特征(称为基于频率属性的时空特征)的数据,数据的这四个特征字段不能存在任何缺失;2)数据预处理,将获取的当前划分的数据块中所有数据看作时空三维坐标系中的点,选取前K个(默认为4)频率最大的数据点,根据PCA算法得到这四个点对应的投影平面;3),索引计算,根据在投影面上的四个点,连接这四个点构成一个凸四边形,选取四条边的中点并连接对边的中点以此构建两个划分平面;4)索引建立,递归的进行步骤2和步骤3的划分操作,每一个划分的空间块即可对应为树中的一个结点。

    基于哈希和PCA的时空索引建立方法

    公开(公告)号:CN110134693A

    公开(公告)日:2019-08-16

    申请号:CN201910413036.5

    申请日:2019-05-17

    Applicant: 南京大学

    Abstract: 一种基于哈希和PCA的对数据的时空特征建立索引的方法,1)数据采集,获取足够多的真实应用场景中的对象产生的具有经度、纬度、时间三个特征、称为时空三维特征的数据,这三个特征字段不能存在任何缺失;2)数据预处理,将所有时空三维特征的数据看作时空三维坐标系中的点,采用PCA算法将该坐标系的坐标轴进行旋转,得到数据在新坐标系中的坐标;3)索引计算,根据每个时空三维特征的数据的新坐标计算哈希值,并根据时空三维特征的数据分布情况调整哈希计算过程的参数;4)索引建立,为三级索引分别建立三张表,第三级索引的表存储指向时空三维特征的数据的指针,其余表存储指向下一级索引的指针。

    一种基于频率属性和PCA的时空索引建立方法

    公开(公告)号:CN110134692A

    公开(公告)日:2019-08-16

    申请号:CN201910413012.X

    申请日:2019-05-17

    Applicant: 南京大学

    Abstract: 一种基于频率属性和PCA的时空索引建立方法,1)数据采集,采集并获取足够多的真实应用场景中的对象产生的具有经度、纬度、时间以及查询频率四个特征(称为基于频率属性的时空特征)的数据,数据的这四个特征字段不能存在任何缺失;2)数据预处理,将获取的当前划分的数据块中所有数据看作时空三维坐标系中的点,选取前K个(默认为4)频率最大的数据点,根据PCA算法得到这四个点对应的投影平面;3),索引计算,根据在投影面上的四个点,连接这四个点构成一个凸四边形,选取四条边的中点并连接对边的中点以此构建两个划分平面;4)索引建立,递归的进行步骤2和步骤3的划分操作,每一个划分的空间块即可对应为树中的一个结点。

    一种基于增量学习的多标签数据流分类方法

    公开(公告)号:CN110110792A

    公开(公告)日:2019-08-09

    申请号:CN201910385391.6

    申请日:2019-05-09

    Applicant: 南京大学

    Abstract: 一种基于增量学习的多标签数据流分类方法,步骤一,初始训练阶段,将多标签数据流建模成固定实例数的数据块,根据初始的数据块,对于每个数据块进行朴素贝叶斯模型的训练以及应用KMeans算法得到簇心集合;训练好的朴素贝叶斯分类模型和簇心集合共同作为基分类器;步骤二,概念漂移检测阶段,初始学习阶段朴素贝叶斯集成模型中的基分类器数量达到一定个数时,分别从数据层面和模型层面进行概念漂移的检测;步骤三,增量更新阶段,当最新的数据块Dt到来时,针对集成模型中的每个基分类器,用Dt中的每个样本本身所携带的信息对基分类器进行更新,进行实例信息更新;能及时检测到数据流中的概念漂移,避免在遇到概念漂移时算法性能遭遇大幅下滑,而且能够对于最新到来的数据进行增量学习,保证了模型的性能。

    基于哈希和PCA的时空索引建立方法

    公开(公告)号:CN110134693B

    公开(公告)日:2023-05-05

    申请号:CN201910413036.5

    申请日:2019-05-17

    Applicant: 南京大学

    Abstract: 一种基于哈希和PCA的对数据的时空特征建立索引的方法,1)数据采集,获取足够多的真实应用场景中的对象产生的具有经度、纬度、时间三个特征、称为时空三维特征的数据,这三个特征字段不能存在任何缺失;2)数据预处理,将所有时空三维特征的数据看作时空三维坐标系中的点,采用PCA算法将该坐标系的坐标轴进行旋转,得到数据在新坐标系中的坐标;3)索引计算,根据每个时空三维特征的数据的新坐标计算哈希值,并根据时空三维特征的数据分布情况调整哈希计算过程的参数;4)索引建立,为三级索引分别建立三张表,第三级索引的表存储指向时空三维特征的数据的指针,其余表存储指向下一级索引的指针。

    一种基于社交网络的众包测试人员招募方法

    公开(公告)号:CN112418803A

    公开(公告)日:2021-02-26

    申请号:CN202011342832.3

    申请日:2020-11-25

    Applicant: 南京大学

    Abstract: 本发明提供了一种基于社交网络的众包测试人员招募方法,包括任务分割、任务发布和传播、传播网络构建、收益分配四个阶段;首先将众测任务分割为单个测试者可以完成的小任务;然后将任务发布给众包测试平台,使得任务信息在社交网络中进行传播;其次采用邀请码技术来记录每个测试人员的上级,从而形成传播网络;最后在收益分配阶段,根据传播网络进行收益分配。本发明解决了传统众包测试中无法在短时间内招募到足够的测试人员的问题,为众测提供人员保障。本发明利用社交网络强大的人员招募能力,在短时间内为众测招募到足够的工作者,同时创建了灵活的收益分配方式,使得人员招募具有良好的激励性。

Patent Agency Ranking