-
公开(公告)号:CN114283351A
公开(公告)日:2022-04-05
申请号:CN202111149863.1
申请日:2021-09-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V20/40 , G06V10/26 , G06V10/74 , G06V10/762 , G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种视频场景分割方法、装置、设备及计算机可读存储介质;涉及人工智能技术,方法包括:对待处理视频进行抽帧,得到视频帧集合;并对视频帧集合中的每个视频帧进行特征提取,得到每个视频帧对应的特征向量;基于特征向量,构造帧间相似度矩阵;帧间相似度矩阵表征视频帧之间的相似程度;基于帧间相似度矩阵进行场景变化预测,从视频帧集合中确定出场景分割帧;基于场景分割帧对待处理视频进行场景分割,得到场景分割结果。通过本申请,能够提高视频场景分割的准确性。
-
公开(公告)号:CN113407778A
公开(公告)日:2021-09-17
申请号:CN202110184917.1
申请日:2021-02-10
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请提供一种标签识别方法及装置,涉及大数据技术领域。该方法包括:提取待识别视频的多模态特征,利用所述多模态特征确定所述待识别视频的第一标签;对所述待识别视频进行分类识别,以获取待识别视频的类别,基于所述待识别视频的类别识别出所述待识别视频的第二标签;通过实时更新的新热标签集合获取所述待识别视频的第三标签,结合所述第一标签、所述第二标签以及所述第三标签确定所述待识别视频的视频标签。本申请提供的技术方案能够提高标签识别的准确性。
-
公开(公告)号:CN113392317A
公开(公告)日:2021-09-14
申请号:CN202110019037.9
申请日:2021-01-07
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/9535 , G06F16/78 , G06N3/08 , G06N3/04
Abstract: 本申请实施例公开了一种人工智能领域的标签配置方法、装置、设备及存储介质,其中该方法包括:获取待配置标签的目标资源;通过特征提取模型,对目标资源的目标参考数据进行特征提取处理,得到目标参考数据对应的特征向量;通过标签分类模型,根据目标参考数据对应的特征向量,确定目标资源所属于各候选分类标签的概率,标签分类模型与特征提取模型互相独立;根据目标资源所属于各候选分类标签的概率,确定目标资源对应的目标分类标签。该方法可以使用大规模的训练样本对所使用的模型进行训练,并且所耗费的迭代训练时间较短,能够满足网络平台的实际应用需求。
-
公开(公告)号:CN115171014B
公开(公告)日:2024-02-13
申请号:CN202210772188.6
申请日:2022-06-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V20/40 , G06V10/56 , G06V10/75 , G06V10/764 , G06V10/82 , G06F16/783 , G06N3/0464
Abstract: 本申请实施例提供了一种视频处理方法、装置、电子设备及计算机可读存储介质,涉及人工智能、云技术、计算机视觉和多媒体技术领域。该方法包括:通过对待处理视频进行划分,得到至少两个待处理的子视频。基于每个子视频与样本库中的各个种子样本的相似度,确定各子视频与样本库的匹配度;基于各子视频对应的匹配度,确定出各子视频中属于目标类型的候选子视频。通过多任务学习模型,确定每个候选子视频的类型预测结果;基于各候选子视频的类型预测结果,确定出各候选子视频中目标类型的目标子视频。基于各目标子视频中目标类型的视频片段,得到待处理视频对应的目标视频片段。本申请实(56)对比文件Huayong Liu.Highlight extraction insoccer videos by using multimodalanalysis《.2017 13th InternationalConference on Natural Computation, FuzzySystems and Knowledge Discovery (ICNC-FSKD)》.2018,第2169-2173页.王晗 等.针对用户兴趣的视频精彩片段提取《.中国图象图形学报》.2018,第23卷(第05期),第748-755页.邹玲 等.基于用户兴趣的视频片段提取方法《.中国科技论文》.2018,第13卷(第02期),第202-207页.
-
公开(公告)号:CN113515994A
公开(公告)日:2021-10-19
申请号:CN202011449200.7
申请日:2020-12-09
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种视频特征提取方法、装置、设备以及存储介质,属于视频处理领域。在本申请实施例中,在提取视频特征的过程中,引入了基于监督训练得到的第一特征提取模型和基于自监督训练的第二特征提取模型,由于第一特征提取模型是基于样本视频和样本视频对应的标签训练得到的,输出的第一视觉特征的目标性较强,比较适合为目标视频添加视频标签。第二特征提取模型是基于自监督训练得到的模型,而自监督模型预测特征的目标性没有监督模型那么强,因此第二特征提取模型提取的第二视觉特征包括更加丰富的信息,第一视觉特征和第二视觉特征之间形成互补,得到的目标视觉特征也就能够更加完整的反映目标视频的特征。
-
公开(公告)号:CN115171014A
公开(公告)日:2022-10-11
申请号:CN202210772188.6
申请日:2022-06-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V20/40 , G06V10/56 , G06V10/75 , G06V10/764 , G06V10/82 , G06F16/783 , G06N3/04
Abstract: 本申请实施例提供了一种视频处理方法、装置、电子设备及计算机可读存储介质,涉及人工智能、云技术、计算机视觉和多媒体技术领域。该方法包括:通过对待处理视频进行划分,得到至少两个待处理的子视频。基于每个子视频与样本库中的各个种子样本的相似度,确定各子视频与样本库的匹配度;基于各子视频对应的匹配度,确定出各子视频中属于目标类型的候选子视频。通过多任务学习模型,确定每个候选子视频的类型预测结果;基于各候选子视频的类型预测结果,确定出各候选子视频中目标类型的目标子视频。基于各目标子视频中目标类型的视频片段,得到待处理视频对应的目标视频片段。本申请实施例可以快速、精确地确定出待处理视频中的目标视频片段。
-
公开(公告)号:CN110737801A
公开(公告)日:2020-01-31
申请号:CN201910975219.6
申请日:2019-10-14
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/75 , G06F16/783 , G06K9/00 , G10L15/08
Abstract: 本申请涉及一种内容分类方法、装置、计算机设备和存储介质,方法包括:获取待分类的目标内容对应的目标特征向量;获取已训练得到的目标分类模型,目标分类模型包括第一分类模型以及第二分类模型;将目标特征向量输入到第一分类模型中,得到目标内容对应的第一内容类别,第一内容类别为第一分类层级对应的内容类别;获取第一分类层级对应的第一类别特征信息;将第一类别特征信息以及目标特征向量输入到第二分类模型中,得到目标内容对应的第二内容类别,第二内容类别为第二分类层级对应的内容类别,第二分类层级的级别低于第一分类层级的级别;将第一内容类别以及第二内容类别作为目标内容对应的分类结果。上述方法可以提高内容分类准确度。
-
公开(公告)号:CN110737801B
公开(公告)日:2024-01-02
申请号:CN201910975219.6
申请日:2019-10-14
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/75 , G06F16/783 , G06V20/40 , G10L15/08
Abstract: 本申请涉及一种内容分类方法、装置、计算机设备和存储介质,方法包括:获取待分类的目标内容对应的目标特征向量;获取已训练得到的目标分类模型,目标分类模型包括第一分类模型以及第二分类模型;将目标特征向量输入到第一分类模型中,得到目标内容对应的第一内容类别,第一内容类别为第一分类层级对应的内容类别;获取第一分类层级对应的第一类别特征信息;将第一类别特征信息以及目标特征向量输入到第二分类模型中,得到目标内容对应的第二内容类别,第二内容类别为第二分类层级对应的内容类别,第二分类层级的级别低于第一分类层级的级别;将第一内容类别以及第二内容类别作为目标内容对应的分类结果。上述方法可以提高内容分类准确度。
-
公开(公告)号:CN113590876A
公开(公告)日:2021-11-02
申请号:CN202110085675.0
申请日:2021-01-22
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/78 , G06F16/783 , G06F16/75
Abstract: 本申请实施例公开了一种视频标签设置方法、装置、计算机设备及存储介质,本申请实施例可以提取待处理视频的音视频时序特征信息和目标文本特征信息,对音视频时序特征信息和目标文本特征信息融合得到第一融合后特征信息;根据第一融合后特征信息获取待处理视频的多模态聚合特征;提取待处理视频的音视频聚合特征信息,对音视频聚合特征信息和目标文本特征信息融合得到第二融合后特征信息;根据第二融合后特征信息确定待处理视频的类别信息;从预设的视频数据库中筛选出与类别信息匹配的视频,得到目标候选视频集;基于多模态聚合特征获取到的目标候选视频集中视频与待处理视频之间的相似度为待处理视频设置标签,提高了视频标签设置的准确性。
-
-
-
-
-
-
-
-