一种重复数据的数据质量检测方法及装置

    公开(公告)号:CN105488212B

    公开(公告)日:2019-06-14

    申请号:CN201510925893.5

    申请日:2015-12-11

    Abstract: 本发明为一种重复数据的数据质量检测方法及装置,所述方法包括:步骤b,生成模型训练集;步骤c,分析所述模型训练集中的各个组合对,并标记为记录重复或记录不重复;步骤d,计算记录重复的概率,并筛选出概率较大的字段组合作为样本字段组合;步骤e,对待检测数据的值进行分析;步骤f,据进行重复检测,筛选出所有重复字段满足所述样本字段组合的记录组合;所述装置包括与各个步骤相对应的训练集生成单元、样本记录标重单元、样本组合筛选单元、检测数据分析单元和检测数据筛选单元。这样,通过对字段组合进行重复可能性的计算,无需比较任意两条记录的重复可能性,缩短了时间,提高了检测效率;同时也可以检测两条数据部分相同的情况。

    一种基于混合多项分布的文本分类算法

    公开(公告)号:CN108268469A

    公开(公告)日:2018-07-10

    申请号:CN201611254483.3

    申请日:2016-12-30

    Abstract: 本发明提供一种基于混合多项分布的文本分类算法,包括以下步骤:S1:输入训练集文本;S2:计算并保存所有文本类别C的概率分布;S3:初始化混合多项分布的参数值θ、πk以及分量个数K;S4:使用当前参数值θ、πk,计算完整数据的对数似然函数关于隐藏变量后验概率分布的期望;S5:用EM算法训练混合多项分布的参数值θ、πk;S6:对不同的所述分量个数K,分别画出模型对测试集和所述训练集的预测误差图线,选择预测误差最小的K值;S7:输出结果。本发明的有益效果在于,本发明将朴素贝叶斯算法结合混合多项分布,用EM算法对混合模型的参数进行估计,以提高模型的分类精度。

    社会行为数据模型的构建方法

    公开(公告)号:CN107194715A

    公开(公告)日:2017-09-22

    申请号:CN201710224931.3

    申请日:2017-04-07

    CPC classification number: G06Q30/0201 G06Q30/0202

    Abstract: 本发明公开了一种数据分析技术,具体是社会行为数据模型的构建方法,包括如下步骤:获取客户基本信息;获取不同方面的社会行为数据;对社会行为数据进行标准化处理;利用标准化后的数据建立社会行为数据模型;通过对此模型的分析,建立算法对客户下一阶段行为进行预测;获取客户后续阶段行为作为反馈来验证并修正所建立的数据模型、预测模型;所述修正是将客户后续阶段的行为数据作为验证数据,将后续阶段的数据与预测模型输出的预测结果相比较,形成正、反例;通过正例与反例更正数据模型与预测模型的权值。本发明社会行为数据模型能够准确预测客户的行为需求。

    一种基于聚类算法的网络信息处理方法

    公开(公告)号:CN114970649A

    公开(公告)日:2022-08-30

    申请号:CN202110201619.9

    申请日:2021-02-23

    Abstract: 本发明公开了一种基于聚类算法的网络信息处理方法,涉及信息处理技术领域。具体包括获取初始数据,设定所述初始数据的中心点,根据所述中心点将初始数据划分成至少两个初始簇;计算各初始簇中的数据与该初始簇的中心点之间的距离并形成距离矩阵,根据该距离矩阵获取数据相似性的权重;根据数据相似性的权重对参数进行调整和数据更新并生成新的簇。旨在自动对不完整的多数据形态信息将信息进行分类,以将缺少部分信息的同类数据融合在一起,以得到包含所有信息的数据,方便信息提取和应用。

    一种基于局部感知思想的混沌图像加密方法和装置

    公开(公告)号:CN108154460B

    公开(公告)日:2021-06-22

    申请号:CN201611103959.3

    申请日:2016-12-05

    Abstract: 本发明公开一种基于局部感知思想的混沌图像加密方法,其包括:步骤a,准备原始图像;步骤b,确定加密密钥;步骤c,得到DCT变换特征图像;步骤d,得到转化密钥序列;步骤e,进行双置乱加密;步骤f,得到加密图像;还公开一种与以上所述的方法相对应的装置,其包括:原始图像准备模块,加密密钥确定模块,DCT变换特征图像生成模块,转化密钥序列生成模块,双置乱加密模块和加密图像生成模块。这样,利用局部感知的思想去提取图像特征,在DCT离散余弦变换后的特征图像上采用双重混沌序列加密方法进行加密,提高了解密的难度,对应增强了密码的隐秘性,也就提高了信息的保密安全性。

    一种基于手机支付的指纹识别系统

    公开(公告)号:CN108182375B

    公开(公告)日:2020-11-06

    申请号:CN201611125849.7

    申请日:2016-12-08

    Abstract: 本发明公开一种基于手机支付的指纹识别系统,包括以下步骤:S1:指纹图像采集;S2:指纹图像滤波增强;S3:指纹图像二值化;S4:指纹图像细化;S5:指纹图像特征提取;S6:指纹匹配,输出匹配结果。所述基于手机支付的指纹识别系统,针对指纹图像预处理阶段,从图像增强,二值化以及细化等方面对传统的指纹识别技术进行了改进,增强了指纹识别技术的鲁棒性,提高了手机支付过程中指纹识别技术的准确性和安全性。

    一种基于协同过滤与logistic回归的个性化推荐方法及装置

    公开(公告)号:CN108268464A

    公开(公告)日:2018-07-10

    申请号:CN201611254081.3

    申请日:2016-12-30

    Abstract: 本发明公开一种基于协同过滤与logistic回归的个性化推荐装置,其包括输入单元,提取单元,评分单元,预测单元,计算单元,选取单元,预处理单元,模型计算单元,比较与推荐单元以及输出单元。先利用用户的历史信息计算用户间的相似度,将与目标用户相似度高的用户作为邻居,将邻居喜欢的商品作为待推荐商品,按照购买可能性进行排序,按此顺序进行推荐。本发明基于最近邻协同找出了用户可能感兴趣的商品,在此过程中用奇异值分解,解决了评分矩阵的稀疏性问题,并根据购买可能性对待推荐商品进行排序,这相对于根据用户兴趣排序而言更准确,能够更好的实现精准营销。

    一种改进的对缺失值插补的算法

    公开(公告)号:CN108197079A

    公开(公告)日:2018-06-22

    申请号:CN201611122144.X

    申请日:2016-12-08

    Abstract: 本发明公开一种改进的对缺失值插补的算法,包括:对所有数据进行层次类聚、针对含有缺失值的类,根据是否有缺失值的记录,将记录分为完全数据组m1和缺失数据组m2、将m1中的数据随机分成训练集和测试集,用k种插补方法预测测试集,得出准确度最高的方法、判断此方法是否为弱方法,若是,结合bagging算法得到该类的缺失值插补的函数,若否,该算法为最终算法、运用最终插补函数对该类的缺失值进行插补、判断是否存在还有缺失值的类。所述改进的对缺失值插补的算法会根据数据特有的性质,在众多的缺失值插补方案中,选择比较适合该数据集的方法,利用bagging算法的原理,对比各种方法对缺失值的插补效果,从而得出比较实用该数据的缺失值插补的方法。

    一种基于手机支付的指纹识别系统

    公开(公告)号:CN108182375A

    公开(公告)日:2018-06-19

    申请号:CN201611125849.7

    申请日:2016-12-08

    CPC classification number: G06K9/00087 G06K9/00067 G06Q20/322

    Abstract: 本发明公开一种基于手机支付的指纹识别系统,包括以下步骤:S1:指纹图像采集;S2:指纹图像滤波增强;S3:指纹图像二值化;S4:指纹图像细化;S5:指纹图像特征提取;S6:指纹匹配,输出匹配结果。所述基于手机支付的指纹识别系统,针对指纹图像预处理阶段,从图像增强,二值化以及细化等方面对传统的指纹识别技术进行了改进,增强了指纹识别技术的鲁棒性,提高了手机支付过程中指纹识别技术的准确性和安全性。

    机载双频段共口径相控阵天线及布阵方法

    公开(公告)号:CN107204517A

    公开(公告)日:2017-09-26

    申请号:CN201710225337.6

    申请日:2017-04-07

    Abstract: 本发明涉及机载天线技术领域,公开了一种机载双频段共口径相控阵天线,包括天线本体,天线本体包括上下层设置的共口径微带天线;微带天线包括上层的S波频段微带天线和下层的UHF频段微带天线,S波频段微带天线含有介质板Ⅰ和贴片天线阵列,UHF频段微带天线包括介质板Ⅱ和辐射贴片,辐射贴片作为贴片天线阵列的金属地板;还公开了机载双频共口径相控阵天线的布阵方法,包括以下步骤:S1:选择介质板Ⅰ,在介质板Ⅰ的正面印制S频段的贴片天线阵列;S2:选择介质板Ⅱ,在介质板Ⅱ的正面印制UHF频段的辐射贴片,反面附上接地板;S3:将介质板Ⅱ正面的辐射贴片与介质板Ⅰ的反面相贴;S4:利用同轴探针对贴片天线阵列和辐射贴片馈电。

Patent Agency Ranking