基于子空间编码和机器学习模型的洞察发现方法及系统

    公开(公告)号:CN118779499A

    公开(公告)日:2024-10-15

    申请号:CN202410721106.4

    申请日:2024-06-05

    Applicant: 复旦大学

    Abstract: 本发明提供一种基于子空间编码和机器学习模型的洞察发现方法及系统,主要应用场景为探索式数据分析中的自动洞察发现环节。本发明中,针对直接使用数据中的属性列构建特征向量会导致洞察发现过程中的数据范围无法有效区分的问题,通过基于给定的数据范围所对应的数据子空间完成所有的特征提取和编码过程,保证数据范围向量化的唯一性;针对多个数据范围的计算顺序问题,采用随机森林模型对数据范围进行优先级预测,从而在给定的时间预算内对最有可能蕴含洞察的数据范围进行洞察挖掘。本发明与其他现存探索性数据分析过程中的洞察推荐方法相比,无论是效率还是效果都更为优秀,能够在更短的时间挖掘出更有价值的数据洞察并返回给分析人员。

    面向探索性数据分析的数据洞察装置

    公开(公告)号:CN118656361A

    公开(公告)日:2024-09-17

    申请号:CN202410829778.7

    申请日:2024-06-25

    Applicant: 复旦大学

    Abstract: 本发明提供了一种面向探索性数据分析的数据洞察装置,具有这样的特征,包括离线构建模块用于根据目标数据集,构建对应的模式立方体;在线分析模块用于根据分析指令和模式立方体,计算得到洞察结果,其中,在线分析模块包括:数据范围生成单元用于生成数据范围;同质数据范围生成单元用于生成各个数据范围对应的同质数据范围;在线模式计算单元用于根据模式立方体,计算各个同质数据范围对应的数据模式;洞察生成单元用于对各个同质数据范围,将该同质数据范围的数据模式进行共异分析,得到对应的洞察;推荐单元用于对所有洞察进行价值分析生成洞察结果。总之,本装置能够避免对数据范围模式的重复计算,提高洞察发现效率。

Patent Agency Ranking