一种用于智慧数据碰撞的机器学习方法及装置

    公开(公告)号:CN111105041A

    公开(公告)日:2020-05-05

    申请号:CN201911210149.1

    申请日:2019-12-02

    Abstract: 本发明公开了一种用于智慧数据碰撞的机器学习方法及装置,提供一种基于K-means拓展的智慧数据碰撞的算法,采用人工智能的方式,极大释放了人工劳动力,提高了表格和字段关联的识别精度和速度,并且该方法实现在低端硬件,数据来源不一的情况下仍然可以高效、精准的识别出相关字段和相关表格。解决了现有方案当数据来源不一、不规范,但是仍然具有可用价值时,仍然需要人力标注,人力匹配字段和表格,针对业务要求,每个团队都要重新定制化开发不同的表格,字段挖掘模型,耗费大量成本的问题。

    一种卷积神经网络的神经节点的影响因子分析方法及装置

    公开(公告)号:CN110807520A

    公开(公告)日:2020-02-18

    申请号:CN202010016237.4

    申请日:2020-01-08

    Abstract: 本发明公开了一种卷积神经网络的神经节点的影响因子分析方法及装置,本发明所提供的基于PageRank的卷积神经网络可视化算法,提供了大多数卷积神经网络训练过程中都需要的通用模块,如:调整参数、选择重要节点、降低计算量、归一化处理、重要影响因子分析、输入输出结果的流向等功能,并可以与任何标准化的卷积神经网络和多种评价节点重要关联程度的指标的集成,以高效率,高精度的关联分析和最大限度的利用已有数据。解决传统卷积神经网络调整参数时的盲目和结果的不可解释性,依靠全局遍历所有参数组合和算法调参经验进行模型调优的可解释性不高,效率慢,费时等问题,更大地提高了卷积神经网络的可解释性和模型的准确性。

    一种用于智慧数据碰撞的机器学习方法及装置

    公开(公告)号:CN111105041B

    公开(公告)日:2022-12-23

    申请号:CN201911210149.1

    申请日:2019-12-02

    Abstract: 本发明公开了一种用于智慧数据碰撞的机器学习方法及装置,提供一种基于K‑means拓展的智慧数据碰撞的算法,采用人工智能的方式,极大释放了人工劳动力,提高了表格和字段关联的识别精度和速度,并且该方法实现在低端硬件,数据来源不一的情况下仍然可以高效、精准的识别出相关字段和相关表格。解决了现有方案当数据来源不一、不规范,但是仍然具有可用价值时,仍然需要人力标注,人力匹配字段和表格,针对业务要求,每个团队都要重新定制化开发不同的表格,字段挖掘模型,耗费大量成本的问题。

    一种基于K-MEANS、WORD2VEC的抽取关键词的方法

    公开(公告)号:CN107122352B

    公开(公告)日:2020-04-07

    申请号:CN201710352450.0

    申请日:2017-05-18

    Abstract: 本发明公开了一种基于K‑MEANS、WORD2VEC的抽取关键词的方法,该方法通过归纳全局语义和各分支主题,利用WORD2VEC算法构建出空间向量,使用K‑means算法剔除模糊词,计算质心距,聚类评估后得到高质量的关键词,并且通过提升权重值,实现词库的动态优化,使关键词提取具备学习进化能力。本发明抽取的关键词能够体现文档的内部分类主题,每一个关键字能够很好地的体现该分类,具有最终关键词质量高,适应性更广泛,结果更加准确等特点。

    一种基于K‑MEANS、WORD2VEC的抽取关键词的方法

    公开(公告)号:CN107122352A

    公开(公告)日:2017-09-01

    申请号:CN201710352450.0

    申请日:2017-05-18

    Abstract: 本发明公开了一种基于K‑MEANS、WORD2VEC的抽取关键词的方法,该方法通过归纳全局语义和各分支主题,利用WORD2VEC算法构建出空间向量,使用 K‑means算法剔除模糊词,计算质心距,聚类评估后得到高质量的关键词,并且通过提升权重值,实现词库的动态优化,使关键词提取具备学习进化能力。本发明抽取的关键词能够体现文档的内部分类主题,每一个关键字能够很好地的体现该分类,具有最终关键词质量高,适应性更广泛,结果更加准确等特点。

Patent Agency Ranking