-
公开(公告)号:CN111105041A
公开(公告)日:2020-05-05
申请号:CN201911210149.1
申请日:2019-12-02
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种用于智慧数据碰撞的机器学习方法及装置,提供一种基于K-means拓展的智慧数据碰撞的算法,采用人工智能的方式,极大释放了人工劳动力,提高了表格和字段关联的识别精度和速度,并且该方法实现在低端硬件,数据来源不一的情况下仍然可以高效、精准的识别出相关字段和相关表格。解决了现有方案当数据来源不一、不规范,但是仍然具有可用价值时,仍然需要人力标注,人力匹配字段和表格,针对业务要求,每个团队都要重新定制化开发不同的表格,字段挖掘模型,耗费大量成本的问题。
-
公开(公告)号:CN110807520A
公开(公告)日:2020-02-18
申请号:CN202010016237.4
申请日:2020-01-08
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种卷积神经网络的神经节点的影响因子分析方法及装置,本发明所提供的基于PageRank的卷积神经网络可视化算法,提供了大多数卷积神经网络训练过程中都需要的通用模块,如:调整参数、选择重要节点、降低计算量、归一化处理、重要影响因子分析、输入输出结果的流向等功能,并可以与任何标准化的卷积神经网络和多种评价节点重要关联程度的指标的集成,以高效率,高精度的关联分析和最大限度的利用已有数据。解决传统卷积神经网络调整参数时的盲目和结果的不可解释性,依靠全局遍历所有参数组合和算法调参经验进行模型调优的可解释性不高,效率慢,费时等问题,更大地提高了卷积神经网络的可解释性和模型的准确性。
-
公开(公告)号:CN111105041B
公开(公告)日:2022-12-23
申请号:CN201911210149.1
申请日:2019-12-02
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种用于智慧数据碰撞的机器学习方法及装置,提供一种基于K‑means拓展的智慧数据碰撞的算法,采用人工智能的方式,极大释放了人工劳动力,提高了表格和字段关联的识别精度和速度,并且该方法实现在低端硬件,数据来源不一的情况下仍然可以高效、精准的识别出相关字段和相关表格。解决了现有方案当数据来源不一、不规范,但是仍然具有可用价值时,仍然需要人力标注,人力匹配字段和表格,针对业务要求,每个团队都要重新定制化开发不同的表格,字段挖掘模型,耗费大量成本的问题。
-
公开(公告)号:CN111242247A
公开(公告)日:2020-06-05
申请号:CN202010346765.6
申请日:2020-04-28
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种伴随分析的时间片划分方法及系统,提出一种基于层次聚类法的伴随分析时间片划分算法。时间因为其连续性难以进行明确的划分,因此时间片划分是伴随分析问题中的一个难点。本文方法采用无监督的机器学习算法划分时间片,方便高效。该方法不需预设分片数量,可使用时间距离阈值控制分片效果,同时提供多种计算模式,算法灵活、可控,高度贴合实战需求,满足多种实战场景。
-
公开(公告)号:CN107122352B
公开(公告)日:2020-04-07
申请号:CN201710352450.0
申请日:2017-05-18
Applicant: 成都四方伟业软件股份有限公司
IPC: G06F40/289 , G06F16/35 , G06K9/62
Abstract: 本发明公开了一种基于K‑MEANS、WORD2VEC的抽取关键词的方法,该方法通过归纳全局语义和各分支主题,利用WORD2VEC算法构建出空间向量,使用K‑means算法剔除模糊词,计算质心距,聚类评估后得到高质量的关键词,并且通过提升权重值,实现词库的动态优化,使关键词提取具备学习进化能力。本发明抽取的关键词能够体现文档的内部分类主题,每一个关键字能够很好地的体现该分类,具有最终关键词质量高,适应性更广泛,结果更加准确等特点。
-
公开(公告)号:CN109684382A
公开(公告)日:2019-04-26
申请号:CN201811568520.7
申请日:2018-12-20
Applicant: 成都四方伟业软件股份有限公司
IPC: G06F16/2458 , G06K9/62
Abstract: 本发明实施例涉及数据处理技术领域,具体而言,涉及一种二维密度聚类方法及装置,该方法对随机选取得到的第一样本选取数个二维坐标点进行笛卡尔积连接,进而实现对每个二维坐标点的并行聚类计算,将传统的全量遍历修改为并行遍历,实现了类簇划分的多线程多进程并发执行,能够有效减少计算时间,提高计算效率。
-
公开(公告)号:CN107122352A
公开(公告)日:2017-09-01
申请号:CN201710352450.0
申请日:2017-05-18
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种基于K‑MEANS、WORD2VEC的抽取关键词的方法,该方法通过归纳全局语义和各分支主题,利用WORD2VEC算法构建出空间向量,使用 K‑means算法剔除模糊词,计算质心距,聚类评估后得到高质量的关键词,并且通过提升权重值,实现词库的动态优化,使关键词提取具备学习进化能力。本发明抽取的关键词能够体现文档的内部分类主题,每一个关键字能够很好地的体现该分类,具有最终关键词质量高,适应性更广泛,结果更加准确等特点。
-
-
-
-
-
-