一种敏感数据识别和脱敏的装置及方法

    公开(公告)号:CN108268785A

    公开(公告)日:2018-07-10

    申请号:CN201611254013.7

    申请日:2016-12-30

    Abstract: 本发明提供一种敏感数据识别和脱敏的装置及方法,其装置包括:输入单元,用于响应当前触发的数据脱敏请求,获取待脱敏的目标数据;识别单元,用于识别待脱敏的目标数据是否为敏感数据,若是,则执行数据脱敏单元,否则直接执行输出单元;所述数据脱敏单元,用于对已识别为敏感数据的目标数据执行脱敏操作;所述输出单元,用于输出处理后不具敏感性的目标数据。本发明的有益效果在于,利用NBM建立分类器实现对敏感数据的识别,避免对非敏感数据进行脱敏操作造成的运算负担;采用变形和交换相结合的方法对敏感数据脱敏,只需对敏感数据中的小部分数据记录按照脱敏规则进行数据变形,再利用交换实现对所有数据的脱敏,大大减少了运算量。

    一种基于树状图的数据相似度匹配方法及装置

    公开(公告)号:CN108268548A

    公开(公告)日:2018-07-10

    申请号:CN201611270556.8

    申请日:2016-12-30

    Abstract: 本发明公开一种基于树状图的数据相似度匹配方法及装置,其方法包括:步骤S1,对需要进行相似度匹配的数据,建立以所述数据为部分节点的树状图;步骤S2,以信息量为基础,对所述数据进行相似度计算;步骤S3,以属性为基础,对所述数据进行相似度计算;步骤S6,对所述数据相似度进行加权计算,得到总相似度;其装置包括对应的树状图建立单元、信息量相似度计算单元、属性相似度计算单元和总相似度计算单元。这样,可以综合影响所述数据相似度的多个因素,得到更准确的总相似度。

    一种基于ur-CAIM算法的不平衡数据集特征选择方法及装置

    公开(公告)号:CN108268478A

    公开(公告)日:2018-07-10

    申请号:CN201611257589.9

    申请日:2016-12-30

    Abstract: 本发明公开一种基于ur-CAIM算法的不平衡数据集特征选择方法,其包括:步骤a:定义数据集合;步骤b:计算初始CAIM准则,即数据集类别标签集合与数据集连续属性之间的相关性;步骤c:计算类别标签集合与数据集连续属性之间的互信息;步骤d:计算CAIR准则:步骤e:计算CAIU准则;步骤f:对CAIM准则进行改进;步骤g,根据改进的CAIM准则计算离散值、计算属性F的IV值,并设定阈值e,将IV值大于e的属性作为后续建模需要的特征;本发明还公开一种与基于ur-CAIM算法的不平衡数据集特征选择方法相对应的装置。这样,本发明利用改进的CAIM准则对连续属性离散化,挑选出了对后续建模有重要作用的特征变量,减少了异常值对模型的影响,具有一定的稳健性。

    一种基于KNN算法的半结构化数据分类方法及装置

    公开(公告)号:CN108268458A

    公开(公告)日:2018-07-10

    申请号:CN201611253977.X

    申请日:2016-12-30

    CPC classification number: G06F16/35

    Abstract: 本发明公开一种基于KNN算法的半结构化数据分类方法及装置,该方法包括:步骤S1,将训练集中的所有训练半结构化数据都表示成计算机能够识别的数据向量;步骤S2,得到该类别的类中心向量;步骤S3,接收测试半结构化数据后,将所述测试半结构化数据表示为所述数据向量;步骤S4,计算所述测试半结构化数据与训练集中每个类的类中心向量的距离;步骤S5,计算对应的相似度;步骤S6,将所述测试半结构化数据归类为与其相似度最大的类中;该装置包括对应的训练转换单元、类中心向量计算单元、测试转换单元、距离计算单元、相似度计算单元和分类单元。这样,引入测试半结构化数据与训练半结构化数据所在类的相似性,使得分类结果准确,且提高了分类精度。

    一种基于SVM的群体数据分类方法及装置

    公开(公告)号:CN108268873A

    公开(公告)日:2018-07-10

    申请号:CN201611254023.0

    申请日:2016-12-30

    Abstract: 本发明公开一种基于SVM的群体数据分类方法及装置,其方法包括:步骤S1,提取历史群体数据,确定群体及群体的特征数据;步骤S2,根据所述特征数据,构建所述群体的二次特征矩阵;步骤S3,根据所述二次特征矩阵,训练对应的SVM分类器;步骤S4,使用所述SVM分类器对待分类群体数据进行分类;其装置包括对应的历史数据处理单元、特征矩阵构建单元、分类器训练单元和分类器分类单元。这样,可以通过计算机对群体数据进行分类,方便、快速,节省了大力的人力物力;另外,相比其他分类器,SVM在分类器性能上有较大提升,并且具有高分类精度的优势,从而提高群体组成分析的准确性。

    一种基于SVM的文本分类方法及装置

    公开(公告)号:CN108268457A

    公开(公告)日:2018-07-10

    申请号:CN201611253965.7

    申请日:2016-12-30

    Abstract: 本发明公开一种基于SVM的文本分类方法,其包括:步骤a:对文本进行切词、删词和分类处理;步骤b,由于分词后的词语数量众多,需要对特征进行简约化,以减少计算量;步骤c,提取特征词权重,用实向量表示文本;步骤d,用SVM对文本特征权重向量进行训练,得到分类器;还公开了一种与以上所述基于SVM的文本分类方法相对应的装置,该装置包括文本分类模块、文本特征简化模块、文本实向量表示模块和分类器生成模块。这样,本发明采用基于词典和基于统计的分词方法,提高了分词速度;利用信息熵提取特征信息,有效的降低了维度,减少了计算量;用TF-IDF提取特征词权重,把原本非结构化的文本信息转化为结构化信息,有利于进一步处理。

    一种圆极化螺旋纹微带天线

    公开(公告)号:CN106876964A

    公开(公告)日:2017-06-20

    申请号:CN201611259678.7

    申请日:2016-12-30

    CPC classification number: H01Q1/38 H01Q1/48 H01Q1/50 H01Q15/24

    Abstract: 本专利申请公开了一种圆极化螺旋纹微带天线,包括介质基板、接地板、螺旋微带线,所述接地板和所述螺旋微带线分别位于介质基板的正反面;所述接地板与所述介质基板的一维尺寸完全相同,接地板上开有的十字缝隙,所述十字缝隙的交叉处处于所述接地板的几何中心;还包括依次堆叠在所述接地板上的第一矩形介质块位和第二矩形介质块位,第一矩形介质块也位于接地板的几何中心处;第二矩形介质块位于第一介质块顶面的几何中心处;该一种圆极化螺旋纹微带天线的工作频率设置在12.15GHz。具有,阻抗带宽和轴比带宽同时较好,进而在工作频率设置在12.15GHz时,圆极化性能良好的效果。

Patent Agency Ranking