-
公开(公告)号:CN115794786A
公开(公告)日:2023-03-14
申请号:CN202211184387.1
申请日:2022-09-27
Applicant: 之江实验室
IPC: G06F16/215 , G06F16/22
Abstract: 本发明公开了一种检测数据清洗过程中数据表格变化的方法,该方法首先根据多种数据转换操作对数据表格造成的改变总结一份数据表格变化空间,所述数据表格变化空间包含两个维度,即数据对象和变化属性,所述数据对象包括表、行、列和单元格,所述变化属性包括数量属性、顺序属性、关系属性、值属性和类型属性;然后基于所述数据表格变化空间对比数据清洗过程中数据输入表与数据输出表的变化。本发明根据不同数据对象在多种变化属性上对比数据表格的变化,使得数据表格变化的检测结果更加细致全面,可应用于推断数据清洗代码的语义、可视化数据表格的变化等众多场景上,使得该检测方法的适用性更强。
-
公开(公告)号:CN114490860A
公开(公告)日:2022-05-13
申请号:CN202210071437.9
申请日:2022-01-21
Applicant: 之江实验室
IPC: G06F16/26 , G06F16/215 , G06F16/25 , G06F40/30 , G06F40/186
Abstract: 本发明公开了一种数据转换操作语义的可视化方法及装置、电子设备,包括:为数据转换操作挑选含有二维数据表的图形图符模板;根据数据转换操作,确定用于展示在二维数据表上的行和列;从真实表格中挑选出与数据转换操作语义相关的行列单元格数据,并填入二维数据表中;在二维数据表的外围填入与数据转换操作语义相关的非真实表格数据;为所述二维数据表中的单元格进行颜色的编码;用标记框将二维数据表中具有依赖关系的列框选出,并用连接线相连;根据真实表格的行列数目大小,为二维数据表绘制行列滚动条。本发明采用多种视觉通道从不同维度可视化数据转换操作的语义,具有通用性广、可扩展性强、可解释性高等优点。
-