对小样本学习任务生成集成分类器的可视分析系统和方法

    公开(公告)号:CN113344038B

    公开(公告)日:2024-10-15

    申请号:CN202110542475.3

    申请日:2021-05-18

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于对小样本学习任务生成集成分类器的可视分析系统和方法,其中,系统包括:接收模块用于接收多个基学习器和多个样本;基学习器选择模块用于根据多个基学习器和多个样本,选择适合小样本学习任务的基学习器;样本选择模块用于根据选择的基学习器和多个样本,选择适合小样本学习任务的有标注样本;集成分类器生成模块用于根据选择的基学习器和选择的有标注样本,生成集成分类器;可视化模块用于显示集成分类器对多个样本的分类结果。

    对关系数据进行关系分析的可视化系统和方法

    公开(公告)号:CN118656428A

    公开(公告)日:2024-09-17

    申请号:CN202410762533.7

    申请日:2024-06-13

    Applicant: 清华大学

    Abstract: 本公开提出了一种对关系数据进行关系分析的可视化系统,该系统包括:接收模块,被配置为接收维度为M×M的关系数据矩阵;处理模块,被配置为对所述关系数据矩阵应用训练的重排序模型进行重新排序,以获得重排序矩阵,使得所述重排序矩阵中突出该关系数据中的以下结构的至少之一:聚类、二分图、中心节点以及路径结构,其中所述训练的重排序模型是使用具有不同关系的多个维度为N×N的关系数据矩阵实例及其对应的最佳重排序矩阵作为训练样本进行训练的,并且其中N大于等于M;以及显示模块,被配置为在显示平面上显示所述关系数据矩阵以及所述重排序矩阵。该可视化系统能够有效地突出关系数据中存在的不同结构。

    用于视频事件定位模型的学习样本选择的方法和系统

    公开(公告)号:CN116229312A

    公开(公告)日:2023-06-06

    申请号:CN202310002699.4

    申请日:2023-01-03

    Abstract: 本发明公开了一种用于视频事件定位模型的学习样本确定的方法、系统和计算机可读存储介质。该方法包括:接收第一、第二视频,该第一、第二视频对应属于同一事件类型的第一、第二事件;获得第一视频包含的每个帧在第二视频中的对应帧;通过将第一视频中的一个帧与其在第二视频中的一个对应帧表示为一个对应关系,记录第一视频中的帧与第二视频中的帧的全部对应关系集合;选择全部对应关系集合中满足时序约束的最大对应关系集合,该最大对应关系集合为全部对应关系集合的子集;根据最大对应关系集合,从第一视频确定第三视频,从第二视频确定第四视频。第三、四视频为精确的学习样本,利用其获得的视频事件定位模型的性能更好。

    一种用于层次化聚类的方法和系统

    公开(公告)号:CN110825823B

    公开(公告)日:2023-04-07

    申请号:CN201910978112.7

    申请日:2019-10-15

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于层次化聚类的方法、系统和计算机存储介质。该方法包括:获取多个同质数据源,所述多个同质数据源包括同一性质的数据源;获取知识库中所述多个同质数据源对应的层次化结构,所述层次化结构是多个节点组成的有向无环图,每个节点表示一个类别;利用所述多个同质数据源以及所述同质数据源对应的层次化结构获取约束树,其中所述约束树利用了所述多个同质数据源的至少一部分,并可用于对所述多个同质数据源进行层次化聚类。

    检测偏离分布样本的方法和系统

    公开(公告)号:CN110443289B

    公开(公告)日:2022-02-08

    申请号:CN201910656146.4

    申请日:2019-07-19

    Abstract: 本发明提出了一种用于检测偏离分布样本的方法、系统、计算机可读存储介质。其中方法包括:利用多个训练样本的原始特征,训练出多个神经网络分类器;从多个神经网络分类器中获得多个训练样本的高层语义特征;利用多个训练样本的至少一个高层语义特征和至少一个原始特征,使用多种训练模型,训练出多个分类器,其中训练出的多个分类器用于检测偏离分布样本;将多个训练样本的至少一个高层语义特征和至少一个原始特征作为输入,获得训练出的多个分类器对多个训练样本的多个综合分类结果;利用获得的训练出的多个分类器的分类结果,确定多个分类器的每个分类器的权重,从而得到多个加权分类器。

    对小样本学习任务生成集成分类器的可视分析系统和方法

    公开(公告)号:CN113344038A

    公开(公告)日:2021-09-03

    申请号:CN202110542475.3

    申请日:2021-05-18

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于对小样本学习任务生成集成分类器的可视分析系统和方法,其中,系统包括:接收模块用于接收多个基学习器和多个样本;基学习器选择模块用于根据多个基学习器和多个样本,选择适合小样本学习任务的基学习器;样本选择模块用于根据选择的基学习器和多个样本,选择适合小样本学习任务的有标注样本;集成分类器生成模块用于根据选择的基学习器和选择的有标注样本,生成集成分类器;可视化模块用于显示集成分类器对多个样本的分类结果。

    一种样本类别标签的修正方法、装置及电子设备

    公开(公告)号:CN110457155B

    公开(公告)日:2020-09-11

    申请号:CN201910703759.9

    申请日:2019-07-31

    Abstract: 本公开关于一种样本类别标签的修正方法、装置及电子设备,用于通过可视化方法基于用户标注的数据对类标进行修正。该方法包括:获取分类数据的类标数据,并进行特征提取得到特征数据;对所述特征数据多次采样,按照采样顺序将对应得到的多层特征数据中每相邻两层特征数据按照上下级关系进行级联,构建层次结构图;将所述层次结构图的任一层至少部分区域的特征数据,及所述至少部分区域的特征数据下级级联的特征数据联合,对联合后的特征数据进行降维,对应得到一个二维平面数据;接收基于所述二维平面数据进行标注的数据,得到可信数据集;基于所述可信数据集和所述类标数据,利用双重优化类标数据的修正方法,修正获取的类标数据。

    一种用于获取数据分布的概念漂移量的方法和系统

    公开(公告)号:CN111626351A

    公开(公告)日:2020-09-04

    申请号:CN202010452947.1

    申请日:2020-05-26

    Applicant: 清华大学

    Abstract: 本发明提出了一种用于获取数据分布的概念漂移量的方法和系统。其中,该方法包括:获取包括训练数据和测试数据的全部数据;使用高斯混合模型对全部数据进行聚类,获取全部数据的多个聚类簇;分别获取多个聚类簇的每个聚类簇中包含的所有数据的数据分布的概念漂移量;利用多个聚类簇的每个聚类簇中包含的所有数据的数据分布的概念漂移量,获取全部数据的数据分布的概念漂移量。由此,能够准确地获取到数据分布的概念漂移量,以准确地判断出数据分布的变化情况,大大提高了系统的可靠性。

    一种用于构建图半监督学习模型的方法和系统

    公开(公告)号:CN111612062A

    公开(公告)日:2020-09-01

    申请号:CN202010428382.3

    申请日:2020-05-20

    Abstract: 本发明公开了一种用于构建图半监督学习模型的方法、计算机系统以及计算机可读存储介质。根据该方法,利用多个训练样本中的任意两个训练样本之间的距离,构建一个图结构,将所述图结构作为更新后的图结构;对于所述更新后的图结构,循环执行如下步骤:获得所述更新后的图结构中的一个子图结构;利用所述多个训练样本中的任意两个训练样本之间的距离,在指定的可选k值范围内,获得所述子图结构的最优k值;根据所述最优k值更新所述子图结构,从而获得再次更新后的图结构;响应于不需要获得所述再次更新后的图结构的一个子图结构,训练所述再次更新后的图结构对应的图半监督学习模型。

Patent Agency Ranking