-
公开(公告)号:CN109977988A
公开(公告)日:2019-07-05
申请号:CN201811643314.8
申请日:2018-12-29
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06K9/62
Abstract: 本发明提出一种针对海量类别数据进行分批分类的机器学习方法及系统,包括:将海量类别数据拆分成多个子分类任务,每个子分类任务只建立局部类别的分类器,满足内存资源可以实现;多个子分类器结果进行集成,进行二次分类,确定最终的分类结果。通过本发明,可解决分类数量过多时,导致的模型存储空间,超过计算机语言自身限制,导致无法进行机器学习训练问题;可解决将单机训练性能慢,无法满足时间要求问题;可解决单台服务器无法满足训练的资源要求问题。
-
公开(公告)号:CN109857758A
公开(公告)日:2019-06-07
申请号:CN201811647923.0
申请日:2018-12-29
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F16/245 , G06F16/28
Abstract: 本发明提出一种基于邻居窗口的关联分析方法及系统,在关联分析中,通过将数据和自身关联窗口以及邻居窗口的联合关联分析,解决跨越关联窗口边界的关联数据分析;使用有限的空间资源实时挖掘关联窗口中所有数据项之间的关联规则。本发明能以有限的空间代价实时挖掘数据项之间存在的所有关联规则,并具有较高的效率和优良的可扩展性。
-