-
公开(公告)号:CN113792553B
公开(公告)日:2024-12-03
申请号:CN202111014678.1
申请日:2021-08-31
Applicant: 清华大学
IPC: G06F40/30 , G06F40/253 , G06F40/216 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种用于自然语言处理神经网络模型的可视化分析方法和系统,涉及自然语言处理技术领域,该方案通过接收神经网络模型和用于训练所述神经网络模型的训练语料库;计算所述训练语料库中每个单词与所述神经网络模型中输出层输出的语义向量的第一互信息,根据所述第一互信息获取所述训练语料库中每个单词对所述神经网络模型的重要程度;将所述训练语料库中每个单词及其对所述神经网络模型的重要程度进行可视化展示。由此,采用上述方案的本申请可以实现对不同结构的神经网络模型进行对比分析并可视化展示,从而改善用户体验。
-
公开(公告)号:CN116701879A
公开(公告)日:2023-09-05
申请号:CN202310840644.0
申请日:2023-07-10
IPC: G06F18/20 , G06F18/214 , G06F18/24 , G06N20/00
Abstract: 本发明提出一种用于对样本进行加权的可视分析系统和方法,其中,方法包括:接收多个验证样本和多个训练样本,其中多个训练样本中的第一部分样本已知其类别标注正确,第二部分样本已知其类别标注错误,并且剩余的第三部分样本未知其类别标注是否正确;根据多个验证样本和多个训练样本,生成每个验证样本对每个训练样本的加权关系;根据第一部分样本和第二部分样本,以及每个验证样本对每个训练样本的加权关系,通过迭代更新每个验证样本的权重并计算对应的多个验证样本的正确性和平衡性,生成每个验证样本的最终权重;以及显示多个验证样本、多个训练样本、每个验证样本对每个训练样本的加权关系、以及每个验证样本的最终权重。
-
公开(公告)号:CN113657424A
公开(公告)日:2021-11-16
申请号:CN202110719824.4
申请日:2021-06-28
Applicant: 清华大学
IPC: G06K9/62
Abstract: 本发明提出了一种对利用图像对应的文本训练的图像目标检测模型的输出进行可视化的系统和方法,其中,系统包括:接收模块,用于接收多个训练样本的图像和文本;类别抽取模块,用于抽取图像所包含的目标的类别;目标检测模块用于训练出图像目标检测模型,并利用训练出的模型抽取无标注训练样本的图像包含的目标的位置及类别;图像和类别双聚类模块用于对多个训练样本的图像和类别进行聚类,得到训练样本的图像的聚类结果,类别的聚类结果,以及图像和类别共现聚类结果;可视化模块用于显示图像的聚类结果中每个聚类的代表性图像、所述类别的聚类结果中的每个聚类的名称、以及图像与类别共现聚类结果中的每个共现聚类。
-
公开(公告)号:CN110457155A
公开(公告)日:2019-11-15
申请号:CN201910703759.9
申请日:2019-07-31
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种样本类别标签的修正方法、装置及电子设备,用于通过可视化方法基于用户标注的数据对类标进行修正。该方法包括:获取分类数据的类标数据,并进行特征提取得到特征数据;对所述特征数据多次采样,按照采样顺序将对应得到的多层特征数据中每相邻两层特征数据按照上下级关系进行级联,构建层次结构图;将所述层次结构图的任一层至少部分区域的特征数据,及所述至少部分区域的特征数据下级级联的特征数据联合,对联合后的特征数据进行降维,对应得到一个二维平面数据;接收基于所述二维平面数据进行标注的数据,得到可信数据集;基于所述可信数据集和所述类标数据,利用双重优化类标数据的修正方法,修正获取的类标数据。
-
公开(公告)号:CN113657424B
公开(公告)日:2024-12-17
申请号:CN202110719824.4
申请日:2021-06-28
Applicant: 清华大学
IPC: G06V10/25 , G06V10/762 , G06V10/774
Abstract: 本发明提出了一种对利用图像对应的文本训练的图像目标检测模型的输出进行可视化的系统和方法,其中,系统包括:接收模块,用于接收多个训练样本的图像和文本;类别抽取模块,用于抽取图像所包含的目标的类别;目标检测模块用于训练出图像目标检测模型,并利用训练出的模型抽取无标注训练样本的图像包含的目标的位置及类别;图像和类别双聚类模块用于对多个训练样本的图像和类别进行聚类,得到训练样本的图像的聚类结果,类别的聚类结果,以及图像和类别共现聚类结果;可视化模块用于显示图像的聚类结果中每个聚类的代表性图像、所述类别的聚类结果中的每个聚类的名称、以及图像与类别共现聚类结果中的每个共现聚类。
-
公开(公告)号:CN116701945A
公开(公告)日:2023-09-05
申请号:CN202310836473.4
申请日:2023-07-10
IPC: G06F18/214 , G06F18/23 , G06F18/24
Abstract: 本发明提出一种用于对样本进行可视化的方法和系统,其中,系统包括:接收模块用于接收多个样本,每个样本的信息包括该样本的重要度、特征向量、以及初始分类类别;投影模块用于根据每个样本对应的特征向量,获得每个样本在二维平面上的各自的投影点;平面图生成模块用于获得投影点在所述二维平面上构建的初始平面图;子区域生成模块用于获得所述二维平面上的多个子区域,其中每个子区域对应每个样本;圆包装布局生成模块用于获得每个样本在二维平面上对应的各自的圆;以及可视化模块用于根据每个样本对应的各自的圆,在所述二维平面上对所述多个样本进行可视化展示。
-
公开(公告)号:CN115204390A
公开(公告)日:2022-10-18
申请号:CN202210705263.7
申请日:2022-06-21
Applicant: 清华大学
Abstract: 本发明公开了一种用于神经网络架构空间的可视分析系统和方法。该方法包括:接收至少一个神经网络架构;获得所述神经网络架构中任意两个神经网络架构之间的图编辑距离;根据所述图编辑距离,获得所述神经网络架构的聚类层次化结构,其中,所述聚类层次化结构的每一层包括至少一个神经网络架构类别,每个类别包括神经网络架构;以及对所述神经网络架构的聚类层次化结构中的至少一层进行可视化,其中可视化视图提供所述神经网络架构的全局概览和其中任意一个神经网络架构的上下文信息。
-
公开(公告)号:CN110427531B
公开(公告)日:2022-07-01
申请号:CN201910656140.7
申请日:2019-07-19
Applicant: 清华大学 , 中国人民解放军总医院
IPC: G06F16/904
Abstract: 本发明公开了一种用于对多个样本进行网格布局可视化的方法、系统和计算机可读存储介质。该方法包括:将多个样本中的每个样本投影在二维平面上,所述二维平面至少包括多个网格;获得所述多个样本中的每个样本与所述多个网格的每个网格之间的距离;根据所述获得的距离,调整所述多个样本中的每个样本与所述多个网格的每个网格之间的对应关系,使得每一个样本可放置的网格数为k,并且每个网格允许放置的样本数为k,所述k为大于等于1的整数;计算所述多个样本中的每个样本对应的唯一网格;根据计算的所述多个样本中的每个样本对应的唯一网格在所述二维平面中对所述多个样本进行可视化展示。
-
公开(公告)号:CN110443289A
公开(公告)日:2019-11-12
申请号:CN201910656146.4
申请日:2019-07-19
Applicant: 清华大学 , 中国人民解放军总医院
Abstract: 本发明提出了一种用于检测偏离分布样本的方法、系统、计算机可读存储介质。其中方法包括:利用多个训练样本的原始特征,训练出多个神经网络分类器;从多个神经网络分类器中获得多个训练样本的高层语义特征;利用多个训练样本的至少一个高层语义特征和至少一个原始特征,使用多种训练模型,训练出多个分类器,其中训练出的多个分类器用于检测偏离分布样本;将多个训练样本的至少一个高层语义特征和至少一个原始特征作为输入,获得训练出的多个分类器对多个训练样本的多个综合分类结果;利用获得的训练出的多个分类器的分类结果,确定多个分类器的每个分类器的权重,从而得到多个加权分类器。
-
公开(公告)号:CN118839044A
公开(公告)日:2024-10-25
申请号:CN202410855806.2
申请日:2024-06-28
IPC: G06F16/904 , G06F16/906
Abstract: 本发明公开了大规模数据集进行网格布局的可视化的计算机系统、方法和程序产品,方法包括:获取带有类别层次结构的大规模数据集以及在显示页面上显示的样本个数K,大规模数据集包含N个样本、类别层次结构以及样本对类别的隶属度;从N个样本中随机抽取第一组K个样本;计算第一组K个样本中每个样本对于第一类别中每个类别的隶属度;计算第一组K个样本中每个样本在显示页面上的布局位置;为第一类别中的每个类别分配一种颜色;在显示页面上显示第一组K个样本。该系统、方法和程序产品能够在对带有类别层次结构的大规模数据集进行探索的过程中保持视觉的稳定性,及将混淆样本放置在混淆聚类类别的边界处,使用户容易追踪与分析数据。
-
-
-
-
-
-
-
-
-