基于hive的协同过滤推荐方法

    公开(公告)号:CN110532330B

    公开(公告)日:2022-06-03

    申请号:CN201910830907.3

    申请日:2019-09-03

    摘要: 本发明公开了基于hive的协同过滤推荐方法,hive是建立在Hadoop集群上的数据仓库工具,底层计算采用MapReduce架构,所以hive能够分布式处理数据量巨大的表,本发明的方法基于hivesql语言,应用矩阵分解的思想,解决了协同过滤推荐系统中的超大矩阵的储存运算等问题,实现了计算用户‑商品(影片)评分、商品与商品相似度矩阵及用户‑推荐商品的数据表的计算,完成了推荐系统中的关键算法部分,特别适合应用于大数据背景下的个性化推荐系统领域。

    一种基于审计系统采购信息记录异常值处理方法

    公开(公告)号:CN109522309A

    公开(公告)日:2019-03-26

    申请号:CN201811360480.7

    申请日:2018-11-15

    摘要: 本发明公开了一种基于审计系统采购信息记录异常值处理方法,包括步骤1:编写格拉布斯法检验函数;步骤2:通过读取指令读取文本数据;步骤3:对步骤2所读取到的数据进行预处理;步骤4:根据需求通过group_by命令对步骤3所得的数据进行分组;步骤5:将步骤4所得的每组数据作为输入,然后调用步骤1编写的格拉布斯法检验函数标记或删除异常值;步骤6:将步骤5所得的最终数据保存为文本文档。通过比较各种计算机语言与各种统计检验法的优缺点后,选择了Python语言作为编程语言,格拉布斯法作为数据检测方法。在数据分组过程中,利用group_by命令进行快速的分组,并且在此基础上对每组数据进行检验,极大的提高了工作效率,节省了人力与物力资源。

    一种高容量富镍前驱体、正极材料及其制备方法

    公开(公告)号:CN111908519A

    公开(公告)日:2020-11-10

    申请号:CN202010723033.4

    申请日:2020-07-24

    发明人: 高剑 刘洋 谭铁宁

    摘要: 本发明公开了一种高容量富镍前驱体、正极材料及其制备方法,具体为先分别制得镍、锰盐的混合溶液、碱溶液和氨水溶液,在一定条件下快速制备前驱体NixM1-x(OH)2,随后将前驱体与锂源通过球磨、喷雾混合均匀,在高温、氧气气氛下进行烧结,得到富镍正极材料。本发明所述富镍正极材料的制备方法,反应时间短,能源消耗低,对设备要求低,极大的降低了材料的制备成本。并且通过本发明制备的富镍正极材料具有颗粒大小可控、形貌均匀、放电比容量高、电化学性能好等优势。

    基于hive的协同过滤推荐方法

    公开(公告)号:CN110532330A

    公开(公告)日:2019-12-03

    申请号:CN201910830907.3

    申请日:2019-09-03

    摘要: 本发明公开了基于hive的协同过滤推荐方法,hive是建立在Hadoop集群上的数据仓库工具,底层计算采用MapReduce架构,所以hive能够分布式处理数据量巨大的表,本发明的方法基于hivesql语言,应用矩阵分解的思想,解决了协同过滤推荐系统中的超大矩阵的储存运算等问题,实现了计算用户-商品(影片)评分、商品与商品相似度矩阵及用户-推荐商品的数据表的计算,完成了推荐系统中的关键算法部分,特别适合应用于大数据背景下的个性化推荐系统领域。

    基于三维建模仿真软件的工业大数据实时采集及分析方法

    公开(公告)号:CN112380783B

    公开(公告)日:2022-04-05

    申请号:CN202011441879.5

    申请日:2020-12-11

    摘要: 本发明公开了基于三维建模仿真软件的工业大数据实时采集及分析方法,包括启动仿真软件,虚拟传感器调用二次开发平台的api将仿真数据发送到socket端口;虚拟传感器的注册方法为:在二次开发平台进行编码环境的配置;根据采集需求编码,编码用于实现并封装功能:坐标标点查找、目标点坐标计算和时间戳记录;编码完成后,生成DLL文件;根据三维建模仿真软件二次开发平台的插件注册要求编写dat文件,使用插件注册模块运行dat文件,完成虚拟传感器的注册;实时处理socket端口的数据流并存储到数据库;并进行实时仿真和统计分析。采用虚拟传感器采集仿真数据,解决产品在未建设完成前无法对产品进行优化的问题。

    销量预测方法、系统及终端

    公开(公告)号:CN111882363A

    公开(公告)日:2020-11-03

    申请号:CN202010782742.X

    申请日:2020-08-06

    IPC分类号: G06Q30/02 G06N20/00

    摘要: 本发明涉及销量预测领域,本发明旨在解决现有的产品销量预测方法存在准确率较低的问题,提出一种销量预测方法、系统及终端,其技术方案概括为:获取待预测产品基于时间序列的历史销量数据和外部环境变量数据;对至少一种时间序列分析模型和至少一种机器学习模型进行训练,分别利用网格搜索法得到各时间序列分析模型和机器学习模型的最优参数及对应的训练误差;基于待预测时间并根据训练误差小于预设值的多个销量预测模型及其对应的最优参数对待预测产品进行销量预测,得到多个销量预测值,根据所述多个销量预测值确定最终销量预测值。本发明提高了销量预测的准确率,适用于空调产品的销量预测。

    销售预测方法
    8.
    发明公开

    公开(公告)号:CN112435077A

    公开(公告)日:2021-03-02

    申请号:CN202011463674.7

    申请日:2020-12-11

    IPC分类号: G06Q30/02

    摘要: 本发明涉及销售预测领域,具体涉及一种销售预测方法,实现了自动选择对应算法策略建模进行销售预测,极大地提高了算法建模的灵活性以及算法建模的效率。技术方案概括为,采集数据并统一数据格式,并根据统一格式后的数据进行抽象建模;为抽象建模建立算法库,并为算法库中的算法生成对应参数搜索范围;根据搜索范围选择对应搜索策略;根据对应搜索策略选择相应模型进行模型融合,并根据融合模型进行销售预测。本发明适用于销售预测。

    基于三维建模仿真软件的工业大数据实时采集及分析方法

    公开(公告)号:CN112380783A

    公开(公告)日:2021-02-19

    申请号:CN202011441879.5

    申请日:2020-12-11

    摘要: 本发明公开了基于三维建模仿真软件的工业大数据实时采集及分析方法,包括启动仿真软件,虚拟传感器调用二次开发平台的api将仿真数据发送到socket端口;虚拟传感器的注册方法为:在二次开发平台进行编码环境的配置;根据采集需求编码,编码用于实现并封装功能:坐标标点查找、目标点坐标计算和时间戳记录;编码完成后,生成DLL文件;根据三维建模仿真软件二次开发平台的插件注册要求编写dat文件,使用插件注册模块运行dat文件,完成虚拟传感器的注册;实时处理socket端口的数据流并存储到数据库;并进行实时仿真和统计分析。采用虚拟传感器采集仿真数据,解决产品在未建设完成前无法对产品进行优化的问题。

    一种销量特征预测方法
    10.
    发明公开

    公开(公告)号:CN111898837A

    公开(公告)日:2020-11-06

    申请号:CN202010849299.3

    申请日:2020-08-21

    IPC分类号: G06Q10/04 G06Q30/02 G06N20/00

    摘要: 本发明公开了一种销量特征预测方法,包括以下步骤:选定外部特征数据;获取外部特征数据;数据由多列构成,第一列为时间序列,列名为timestamp,其余是相应的特征数据;特征数据预处理;利用网格搜索法对特征数据进行预测。本发明通过使用相关算法预测特征的未来值来解决无法获取特征真实值的问题。与传统单一预测方法相比,本专利采取网格搜索法自动调参,解决了繁琐的调参问题,提高了预测的准确率。