-
公开(公告)号:CN111105041B
公开(公告)日:2022-12-23
申请号:CN201911210149.1
申请日:2019-12-02
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种用于智慧数据碰撞的机器学习方法及装置,提供一种基于K‑means拓展的智慧数据碰撞的算法,采用人工智能的方式,极大释放了人工劳动力,提高了表格和字段关联的识别精度和速度,并且该方法实现在低端硬件,数据来源不一的情况下仍然可以高效、精准的识别出相关字段和相关表格。解决了现有方案当数据来源不一、不规范,但是仍然具有可用价值时,仍然需要人力标注,人力匹配字段和表格,针对业务要求,每个团队都要重新定制化开发不同的表格,字段挖掘模型,耗费大量成本的问题。
-
公开(公告)号:CN111242247A
公开(公告)日:2020-06-05
申请号:CN202010346765.6
申请日:2020-04-28
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种伴随分析的时间片划分方法及系统,提出一种基于层次聚类法的伴随分析时间片划分算法。时间因为其连续性难以进行明确的划分,因此时间片划分是伴随分析问题中的一个难点。本文方法采用无监督的机器学习算法划分时间片,方便高效。该方法不需预设分片数量,可使用时间距离阈值控制分片效果,同时提供多种计算模式,算法灵活、可控,高度贴合实战需求,满足多种实战场景。
-
公开(公告)号:CN109684382A
公开(公告)日:2019-04-26
申请号:CN201811568520.7
申请日:2018-12-20
Applicant: 成都四方伟业软件股份有限公司
IPC: G06F16/2458 , G06K9/62
Abstract: 本发明实施例涉及数据处理技术领域,具体而言,涉及一种二维密度聚类方法及装置,该方法对随机选取得到的第一样本选取数个二维坐标点进行笛卡尔积连接,进而实现对每个二维坐标点的并行聚类计算,将传统的全量遍历修改为并行遍历,实现了类簇划分的多线程多进程并发执行,能够有效减少计算时间,提高计算效率。
-
公开(公告)号:CN107301668B
公开(公告)日:2019-03-15
申请号:CN201710447083.2
申请日:2017-06-14
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种基于稀疏矩阵、卷积神经网络的图片压缩方法,包括以下步骤:将图像转换成二维矩阵数据,利用卷积神经网络评估、优化和构建稀疏矩阵图像,再通过卷积神经网络优选压缩方案,用选取出的最优压缩方案对稀疏矩阵图像进行压缩处理,最后得到高压缩比高、失真少的压缩图像。本发明解决了现有压缩技术压缩比低、压缩后图片质量下降太多,使图像难以使用和识别的问题,并且本压缩方法能够根据图片内容进行优化,自行选择合适的图像构建和压缩方法,使图片特征提取和压缩方法具备自行优化和学习的能力。
-
公开(公告)号:CN107301668A
公开(公告)日:2017-10-27
申请号:CN201710447083.2
申请日:2017-06-14
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种基于稀疏矩阵、卷积神经网络的图片压缩方法,包括以下步骤:将图像转换成二维矩阵数据,利用卷积神经网络评估、优化和构建稀疏矩阵图像,再通过卷积神经网络优选压缩方案,用选取出的最优压缩方案对稀疏矩阵图像进行压缩处理,最后得到高压缩比高、失真少的压缩图像。本发明解决了现有压缩技术压缩比低、压缩后图片质量下降太多,使图像难以使用和识别的问题,并且本压缩方法能够根据图片内容进行优化,自行选择合适的图像构建和压缩方法,使图片特征提取和压缩方法具备自行优化和学习的能力。
-
公开(公告)号:CN109214002A
公开(公告)日:2019-01-15
申请号:CN201810980045.8
申请日:2018-08-27
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明提供了一种文本对比方法、装置及其计算机存储介质,涉及深度学习技术领域。所述文本对比方法应用于深度文本对比模型,包括:通过所述双向长短时记忆神经网络获得需要进行一致性对比的第一文本的第一语义编码;通过所述注意力层确定所述第一语义编码中每个字符的权重;基于所述权重,通过全连接层将所述第一语义信息编码转换为第一特征表示;将所述第一特征表示和其他深度文本对比模型生成的所述第二特征表示输入所述能量函数,根据所述能量函数的输出结果判断所述第一文本和所述第二文本是否相似。该文本对比方法采用注意力机制捕获每个字符的权重,更注重于找到输入数据中与当前输出相关的有用信息,提高了文本对比的准确性。
-
公开(公告)号:CN109165384A
公开(公告)日:2019-01-08
申请号:CN201810971954.5
申请日:2018-08-23
Applicant: 成都四方伟业软件股份有限公司
IPC: G06F17/27
Abstract: 本发明实施例提供一种命名实体识别方法及装置。方法包括获取待识别文本;将待识别文本输入字嵌入模型获得待识别文本中每个字对应的字向量,以及将待识别文本输入拼音嵌入模型获得每个字对应的拼音向量;将每个字向量和对应的拼音向量进行组合获得组合向量,将所有的字的组合向量输入BiLSTM中进行语义编码,获得待识别文本对应的语义信息特征;根据语义信息特征获得待识别文本中对应的实体标签序列。装置用于执行上述方法,本发明实施例通过根据字嵌入模型和拼音向量模型分别得到待识别文本的字向量和拼音向量,并将字向量和拼音向量进行组合输入到BiLSTM中进行识别,从而能够很好的弥补字向量表示的不足,使得识别的准确率大大提高。
-
公开(公告)号:CN111105041A
公开(公告)日:2020-05-05
申请号:CN201911210149.1
申请日:2019-12-02
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种用于智慧数据碰撞的机器学习方法及装置,提供一种基于K-means拓展的智慧数据碰撞的算法,采用人工智能的方式,极大释放了人工劳动力,提高了表格和字段关联的识别精度和速度,并且该方法实现在低端硬件,数据来源不一的情况下仍然可以高效、精准的识别出相关字段和相关表格。解决了现有方案当数据来源不一、不规范,但是仍然具有可用价值时,仍然需要人力标注,人力匹配字段和表格,针对业务要求,每个团队都要重新定制化开发不同的表格,字段挖掘模型,耗费大量成本的问题。
-
公开(公告)号:CN110807520A
公开(公告)日:2020-02-18
申请号:CN202010016237.4
申请日:2020-01-08
Applicant: 成都四方伟业软件股份有限公司
Abstract: 本发明公开了一种卷积神经网络的神经节点的影响因子分析方法及装置,本发明所提供的基于PageRank的卷积神经网络可视化算法,提供了大多数卷积神经网络训练过程中都需要的通用模块,如:调整参数、选择重要节点、降低计算量、归一化处理、重要影响因子分析、输入输出结果的流向等功能,并可以与任何标准化的卷积神经网络和多种评价节点重要关联程度的指标的集成,以高效率,高精度的关联分析和最大限度的利用已有数据。解决传统卷积神经网络调整参数时的盲目和结果的不可解释性,依靠全局遍历所有参数组合和算法调参经验进行模型调优的可解释性不高,效率慢,费时等问题,更大地提高了卷积神经网络的可解释性和模型的准确性。
-
-
-
-
-
-
-
-