一种用于构建图半监督学习模型的方法和系统

    公开(公告)号:CN111612062B

    公开(公告)日:2023-11-24

    申请号:CN202010428382.3

    申请日:2020-05-20

    Abstract: 本发明公开了一种用于构建图半监督学习模型的方法、计算机系统以及计算机可读存储介质。根据该方法,利用多个训练样本中的任意两个训练样本之间的距离,构建一个图结构,将所述图结构作为更新后的图结构;对于所述更新后的图结构,循环执行如下步骤:获得所述更新后的图结构中的一个子图结构;利用所述多个训练样本中的任意两个训练样本之间的距离,在指定的可选k值范围内,获得所述子图结构的最优k值;根据所述最优k值更新所述子图结构,从而获得再次更新后的图结构;响应于不需要获得所述再次更新后的图结构的一个子图结构,训练所述再次更新后的图结构对应的图半监督学习模型。

    用于对样本进行可视化的方法、系统和可读存储介质

    公开(公告)号:CN116578374A

    公开(公告)日:2023-08-11

    申请号:CN202310633032.4

    申请日:2023-05-31

    Abstract: 本发明公开了用于对样本进行可视化的方法、系统和可读存储介质。其中,系统包括:接收模块用于接收多个样本,其中每个样本的信息包括该样本对应的特征向量、该样本的聚类类别与标注类别;投影模块用于根据多个样本中的每个样本的特征,获得多个样本在二维平面上的投影点的位置;网格生成模块用于根据多个样本中的每个样本将其投影点的位置,获得多个样本在二维平面上对应的网格;网格调整模块用于迭代调整样本对应的网格的位置,从而获取多个样本对应的网格更新后的位置;可视化模块被配置为根据多个样本中的每个样本对应的网格与网格更新后的位置,在二维平面上对多个样本进行可视化展示。

    对多个样本进行网格布局可视化的方法和系统

    公开(公告)号:CN110427531A

    公开(公告)日:2019-11-08

    申请号:CN201910656140.7

    申请日:2019-07-19

    Abstract: 本发明公开了一种用于对多个样本进行网格布局可视化的方法、系统和计算机可读存储介质。该方法包括:将多个样本中的每个样本投影在二维平面上,所述二维平面至少包括多个网格;获得所述多个样本中的每个样本与所述多个网格的每个网格之间的距离;根据所述获得的距离,调整所述多个样本中的每个样本与所述多个网格的每个网格之间的对应关系,使得每一个样本可放置的网格数为k,并且每个网格允许放置的样本数为k,所述k为大于等于1的整数;计算所述多个样本中的每个样本对应的唯一网格;根据计算的所述多个样本中的每个样本对应的唯一网格在所述二维平面中对所述多个样本进行可视化展示。

    提高众包标注数据质量的可视分析系统及方法

    公开(公告)号:CN109934266A

    公开(公告)日:2019-06-25

    申请号:CN201910122426.7

    申请日:2019-02-19

    Applicant: 清华大学

    Abstract: 本发明公开了一种提高众包标注数据质量的可视分析系统及方法,其中,该系统包括:混淆矩阵可视化模块,展示不同类别之间的混淆程度,以根据所述混淆程度选择分析的易混淆类别;实例可视化模块,通过有约束的t-SNE降维展示每个实例的不确定类标和实例之间的相互影响信息;标注者行为可视化模块,通过散点图展示每个标注者在所选定类别上的标注准确率与无效标注程度评分,以确定无效标注者;交互递进式确认模块,将用户对实例的类标和标注者可靠度的确认信息进行传播,以推荐另外需要标注的实例和标注者。该系统的四个模块与众包学习模型紧密结合,从而帮助用户以交互递进形式确认不确定实例以及不可靠标注者,提高数据标注质量。

    对图像目标检测模型的输出进行可视化的方法和系统

    公开(公告)号:CN113657424A

    公开(公告)日:2021-11-16

    申请号:CN202110719824.4

    申请日:2021-06-28

    Applicant: 清华大学

    Inventor: 刘世霞 陈长建

    Abstract: 本发明提出了一种对利用图像对应的文本训练的图像目标检测模型的输出进行可视化的系统和方法,其中,系统包括:接收模块,用于接收多个训练样本的图像和文本;类别抽取模块,用于抽取图像所包含的目标的类别;目标检测模块用于训练出图像目标检测模型,并利用训练出的模型抽取无标注训练样本的图像包含的目标的位置及类别;图像和类别双聚类模块用于对多个训练样本的图像和类别进行聚类,得到训练样本的图像的聚类结果,类别的聚类结果,以及图像和类别共现聚类结果;可视化模块用于显示图像的聚类结果中每个聚类的代表性图像、所述类别的聚类结果中的每个聚类的名称、以及图像与类别共现聚类结果中的每个共现聚类。

    对图像目标检测模型的输出进行可视化的方法和系统

    公开(公告)号:CN113657424B

    公开(公告)日:2024-12-17

    申请号:CN202110719824.4

    申请日:2021-06-28

    Applicant: 清华大学

    Inventor: 刘世霞 陈长建

    Abstract: 本发明提出了一种对利用图像对应的文本训练的图像目标检测模型的输出进行可视化的系统和方法,其中,系统包括:接收模块,用于接收多个训练样本的图像和文本;类别抽取模块,用于抽取图像所包含的目标的类别;目标检测模块用于训练出图像目标检测模型,并利用训练出的模型抽取无标注训练样本的图像包含的目标的位置及类别;图像和类别双聚类模块用于对多个训练样本的图像和类别进行聚类,得到训练样本的图像的聚类结果,类别的聚类结果,以及图像和类别共现聚类结果;可视化模块用于显示图像的聚类结果中每个聚类的代表性图像、所述类别的聚类结果中的每个聚类的名称、以及图像与类别共现聚类结果中的每个共现聚类。

    对多个样本进行网格布局可视化的方法和系统

    公开(公告)号:CN110427531B

    公开(公告)日:2022-07-01

    申请号:CN201910656140.7

    申请日:2019-07-19

    Abstract: 本发明公开了一种用于对多个样本进行网格布局可视化的方法、系统和计算机可读存储介质。该方法包括:将多个样本中的每个样本投影在二维平面上,所述二维平面至少包括多个网格;获得所述多个样本中的每个样本与所述多个网格的每个网格之间的距离;根据所述获得的距离,调整所述多个样本中的每个样本与所述多个网格的每个网格之间的对应关系,使得每一个样本可放置的网格数为k,并且每个网格允许放置的样本数为k,所述k为大于等于1的整数;计算所述多个样本中的每个样本对应的唯一网格;根据计算的所述多个样本中的每个样本对应的唯一网格在所述二维平面中对所述多个样本进行可视化展示。

    检测偏离分布样本的方法和系统

    公开(公告)号:CN110443289A

    公开(公告)日:2019-11-12

    申请号:CN201910656146.4

    申请日:2019-07-19

    Abstract: 本发明提出了一种用于检测偏离分布样本的方法、系统、计算机可读存储介质。其中方法包括:利用多个训练样本的原始特征,训练出多个神经网络分类器;从多个神经网络分类器中获得多个训练样本的高层语义特征;利用多个训练样本的至少一个高层语义特征和至少一个原始特征,使用多种训练模型,训练出多个分类器,其中训练出的多个分类器用于检测偏离分布样本;将多个训练样本的至少一个高层语义特征和至少一个原始特征作为输入,获得训练出的多个分类器对多个训练样本的多个综合分类结果;利用获得的训练出的多个分类器的分类结果,确定多个分类器的每个分类器的权重,从而得到多个加权分类器。

    大规模数据集进行网格布局的可视化的系统、方法和计算机程序产品

    公开(公告)号:CN118839044A

    公开(公告)日:2024-10-25

    申请号:CN202410855806.2

    申请日:2024-06-28

    Abstract: 本发明公开了大规模数据集进行网格布局的可视化的计算机系统、方法和程序产品,方法包括:获取带有类别层次结构的大规模数据集以及在显示页面上显示的样本个数K,大规模数据集包含N个样本、类别层次结构以及样本对类别的隶属度;从N个样本中随机抽取第一组K个样本;计算第一组K个样本中每个样本对于第一类别中每个类别的隶属度;计算第一组K个样本中每个样本在显示页面上的布局位置;为第一类别中的每个类别分配一种颜色;在显示页面上显示第一组K个样本。该系统、方法和程序产品能够在对带有类别层次结构的大规模数据集进行探索的过程中保持视觉的稳定性,及将混淆样本放置在混淆聚类类别的边界处,使用户容易追踪与分析数据。

Patent Agency Ranking