基于心理学行为分析的众包欺诈检测方法

    公开(公告)号:CN104133769B

    公开(公告)日:2017-01-25

    申请号:CN201410376503.9

    申请日:2014-08-02

    Inventor: 李鹏 张楷卉 刘洋

    Abstract: 基于心理学行为分析的众包欺诈检测方法。目前众包质量控制技术不能有效应对众包被检测者的欺诈行为,导致众包质量低下。本发明的方法包括如下步骤:被检测者对原始数据文档进行工作;通过时钟控制单元(1)对整个系统的全局进行时间控制,根据时钟控制单元记录的工作的时间以及次数,将文档传递至数据分组单元2)进行动态地分组;通过数据分组单元将文档阶段性地分组,并且将达到标准的文档传送到其他单元进行处理;被检测者标签质量控制单元3)会对所得的文档子集上的反映进行筛选,最后被检测者质量控制单元(4)检测到被检测者的欺诈行为,发送电信号驱动标记机(8)进行标记。本发明用于检测众包欺诈行为。

    面向失衡数据集的簇边界采样与动态剪枝的失衡数据分类方法

    公开(公告)号:CN104102718A

    公开(公告)日:2014-10-15

    申请号:CN201410342032.X

    申请日:2014-07-17

    Inventor: 李鹏 张楷卉

    CPC classification number: G06K9/6218 G06K9/6267

    Abstract: 面向失衡数据集的簇边界采样与动态剪枝的失衡数据分类方法,属于失衡数据分类领域。为了解决目前失衡数据分类方法分类效果不好的问题。它包括:步骤一:对失衡数据集D基于密度聚类进行簇边界采样,获取重采样后的失衡数据集B;步骤二:对重采样后的失衡数据集B基于KNN动态阈值进行剪枝,获取剪枝后的失衡数据集T;步骤三:对剪枝后的失衡数据集T采用SVM分类器进行分类,获取分类后的失衡数据集。它应用于医疗诊断、癌症检测、蛋白质的检测、故障检测、客户流失预测等领域。

    基于聚类抽样核变换的失衡数据分类方法

    公开(公告)号:CN104063520A

    公开(公告)日:2014-09-24

    申请号:CN201410342031.5

    申请日:2014-07-17

    Inventor: 李鹏 张楷卉

    CPC classification number: G06F17/30598

    Abstract: 基于聚类抽样核变换的失衡数据分类方法,属于失衡数据分类领域。为了解决传统的失衡数据分类方法分类效果不好的问题。它包括:步骤一:将待分类的失衡数据进行向量化,获得失衡数据集;步骤二:利用基于动态自组织映射的聚类抽样的方法对步骤一获得失衡数据集内的向量进行重采样,获得重采样后的失衡数据集;步骤三:对分类器SVM的核函数进行变换,对步骤二获得的重采样后的失衡数据集利用核变换的分类器SVM进行分类,获得分类后的失衡数据集。它应用于医疗诊断、保险等欺诈检测、蛋白质的检测、故障检测、客户流失预测等领域。

    基于心理学行为分析的众包欺诈检测方法

    公开(公告)号:CN104133769A

    公开(公告)日:2014-11-05

    申请号:CN201410376503.9

    申请日:2014-08-02

    Inventor: 李鹏 张楷卉 刘洋

    Abstract: 基于心理学行为分析的众包欺诈检测方法。 目前众包质量控制技术不能有效应对众包被检测者的欺诈行为,导致众包质量低下。本发明的方法包括如下步骤:被检测者对原始数据文档进行工作;通过时钟控制单元(1)对整个系统的全局进行时间控制,根据时钟控制单元记录的工作的时间以及次数,将文档传递至数据分组单元(2)进行动态地分组;通过数据分组单元将文档阶段性地分组,并且将达到标准的文档传送到其他单元进行处理;被检测者标签质量控制单元(3)会对所得的文档子集上的反映进行筛选,最后被检测者质量控制单元(4)检测到被检测者的欺诈行为,发送电信号驱动标记机(8)进行标记。本发明用于检测众包欺诈行为。

    基于聚类分层抽样补偿逻辑回归的失衡数据预测方法

    公开(公告)号:CN104102716A

    公开(公告)日:2014-10-15

    申请号:CN201410341930.3

    申请日:2014-07-17

    Inventor: 李鹏 张楷卉

    CPC classification number: G06F17/30536 G06F17/30598

    Abstract: 基于聚类分层抽样补偿逻辑回归的失衡数据预测方法,属于失衡数据预测领域。为了解决传统预测模型预测失衡数据的效果不好的问题。它包括如下步骤:步骤一:采用k-means算法对待预测的样本集进行聚类,获取K个类的数据;步骤二:对获取K个类的数据进行分层抽样,抽取n个数据;步骤三:对分层样本的逻辑回归模型的参数进行最大似然估计,获取分层样本逻辑回归模型的参数估计式,确定分层样本逻辑回归模型;步骤四:将抽取的n个数据输入至分层样本逻辑回归模型中,确定待预测的样本集是否是失衡数据集。它应用于需预测失衡数据的生物、医学、工程、计算等领域。

    基于用户群组行为分析的视频推荐方法及装置

    公开(公告)号:CN103731738A

    公开(公告)日:2014-04-16

    申请号:CN201410032276.8

    申请日:2014-01-23

    Abstract: 基于用户群组行为分析的视频推荐方法及装置,涉及一种视频推荐方法及装置。为了解决为了解决传统视频推荐方法对视频数据和用户数据的处理方式,不利于数据分析,也不适用于动态变化情况的问题。它对用户行为进行采集分析,将视频数据和观看所述视频的客户数据转化为行为操作数据,并通过日志数据对用户进行第一次分组;将用户行为日志数据进行分析并取得用户频繁项的关联规则,获得用户在最近行为中的规则习惯并实现动态更新;对每个群组内的用户互相进行相似度计算,并进行第二次分组,找出用户间更加相似的群组,将每个用户选择的视频做协同过滤后推荐给同群组内的其他用户。它用于为用户推荐个性化视频。

Patent Agency Ranking