-
公开(公告)号:CN118734817A
公开(公告)日:2024-10-01
申请号:CN202410855453.6
申请日:2024-06-28
Applicant: 复旦大学
IPC: G06F40/177 , G06F40/151 , G06F16/22 , G06F16/28 , G06F18/2415 , G06N3/0475 , G06N3/094 , G06N3/0455
Abstract: 本发明提供了一种面向关系型表格的数据生成方法及装置,具有这样的特征,包括以下步骤:步骤S1,根据指定表格构建训练数据集;步骤S2,构建判别器和生成器;步骤S3,根据训练数据集,对判别器和生成器进行对抗训练,得到训练好的生成器作为数据合成模型;步骤S4,将随机采样的噪声向量与条件向量进行拼接,得到输入向量;步骤S5,将输入向量输入数据合成模型,得到合成数据向量;步骤S6,对合成数据向量进行转换,得到合成表格数据。总之,本方法能够生成更贴近表格数据的合成数据。
-
公开(公告)号:CN118656361A
公开(公告)日:2024-09-17
申请号:CN202410829778.7
申请日:2024-06-25
Applicant: 复旦大学
IPC: G06F16/21 , G06F16/22 , G06F16/26 , G06F16/2458
Abstract: 本发明提供了一种面向探索性数据分析的数据洞察装置,具有这样的特征,包括离线构建模块用于根据目标数据集,构建对应的模式立方体;在线分析模块用于根据分析指令和模式立方体,计算得到洞察结果,其中,在线分析模块包括:数据范围生成单元用于生成数据范围;同质数据范围生成单元用于生成各个数据范围对应的同质数据范围;在线模式计算单元用于根据模式立方体,计算各个同质数据范围对应的数据模式;洞察生成单元用于对各个同质数据范围,将该同质数据范围的数据模式进行共异分析,得到对应的洞察;推荐单元用于对所有洞察进行价值分析生成洞察结果。总之,本装置能够避免对数据范围模式的重复计算,提高洞察发现效率。
-
公开(公告)号:CN114756772A
公开(公告)日:2022-07-15
申请号:CN202210370416.7
申请日:2022-04-09
Applicant: 复旦大学
IPC: G06F16/9537 , G06F16/2458 , G06F16/906
Abstract: 本发明属于数据分析技术领域,具体为一种时空数据查询处理中的抽样系统。本发明系统包括时空网格划分器、样本生成器:时空网格划分器按照一定粒度在时空坐标系上划分网格,并给每个网格分配样本容量;具体的划分粒度可以根据实际需求定义;样本生成器按照划分器分配的样本容量在每个网格内均匀采样,并汇总成最终样本。本发明可帮助分析人员从时空大数据中获取更为全面的样本,发掘容易被简单均匀采样遗漏的信息,增加样本分析结论的可靠性。
-
-