-
公开(公告)号:CN115119071B
公开(公告)日:2024-07-12
申请号:CN202210657734.1
申请日:2022-06-10
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04N21/8549 , H04N21/845
摘要: 本申请涉及一种视频封面生成方法、装置、电子设备及存储介质。该方法包括:获取待处理视频的第一图像;第一图像为待处理视频中处于第一时段内的一帧图像,第一时段的起始时间为待处理视频的起始时间,第一时段的时长小于第一时长阈值;对第一图像进行第一预设目标的检测处理,若第一图像包括第一预设目标,将第一图像作为待处理视频的视频封面;若第一图像不包括第一预设目标,获取待处理视频中处于第二时段内的多个第二图像;第二时段的起始时间为第一时段的终止时间;依次对多个第二图像进行第二预设目标的检测处理,将包括第二预设目标的第二图像作为视频封面。根据本申请的技术方案,可以提升视频封面的生成效率和视觉关注度。
-
公开(公告)号:CN115618271B
公开(公告)日:2023-11-17
申请号:CN202210478922.8
申请日:2022-05-05
申请人: 腾讯科技(深圳)有限公司
发明人: 刘文然
IPC分类号: G06V10/764 , G06N3/047 , G06N3/082 , G06V10/82
摘要: 本申请公开了一种对象类别识别方法、装置、设备及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,所述方法包括:获取目标对象的目标数据;基于对象分类模型对目标数据进行类别识别处理,得到目标对象的目标类别标签;对象分类模型为基于样本对象的样本数据,对剪枝分类模型进行对象类别识别训练得到,剪枝分类模型为在初始分类模型中剪除待剪除通道后的模型,待剪除通道为初始分类模型中缩放参数绝对值小于预设阈值的通道;初始分类模型为基于样本数据对预设网络进行对象类别识别训练得到;预设网络中包括设置有缩放层的注意力网络;本申请减少了对象分类模型的运算量,提高了模型的计算速度,提高了对象类别的识别速度。
-
公开(公告)号:CN117011741A
公开(公告)日:2023-11-07
申请号:CN202211328687.2
申请日:2022-10-27
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V20/40 , G06V10/82 , G06V10/40 , G06V10/74 , G06V10/774 , G06V10/80 , G06N3/0895 , G06N3/0464 , G06N3/0455 , G06Q50/18
摘要: 本申请涉及计算机领域,特别涉及人工智能领域,提供了一种视频检测模型的训练方法、装置、设备及存储介质,本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。该方法包括:多轮迭代训练视频检测模型,其中每次迭代针对各正样本视频与各负样本视频进行抽帧、特征提取和时序信息提取,获得相应的视频特征,对两个正样本视频的视频特征进行特征匹配,获得第一特征相似度,将该正样本视频与各负样本视频的视频特征进行特征匹配,获得各第二特征相似度,通过第一特征相似度与各第二特征相似度,调整模型的参数。使用正负样本视频训练模型,增强模型表征能力,提高模型泛化性与鲁棒性,且无需进行样本标注工作,降低了训练成本。
-
公开(公告)号:CN111091188A
公开(公告)日:2020-05-01
申请号:CN201911294777.2
申请日:2019-12-16
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种神经网络的前向计算方法、装置及计算机可读存储介质,神经网络中的至少一个数据处理层进行数据处理的方法包括:获取数据处理层的输入数据和权重数据;将输入数据采用第一纹理存储结构进行存储,得到第一纹理数据,将权重数据采用第二纹理存储结构进行存储,得到第二纹理数据;基于第一纹理数据和第二纹理数据进行数据处理层的数据处理,得到数据处理层的输出数据。对于神经网络的至少一个数据处理层,将输入数据和权重数据分别存储在对应的纹理存储结构中,由于纹理存储结构索引简单方便,且数据存储量大,节省了数据处理层在进行数据处理过程中读取和存储数据的时间,使得神经网络的前向计算效率大大提高。
-
公开(公告)号:CN116996739A
公开(公告)日:2023-11-03
申请号:CN202211221830.8
申请日:2022-10-08
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04N21/44 , H04N21/4402 , G06V20/40 , G06V10/80 , G06V10/774
摘要: 本申请公开了一种视频分割的方法、装置以及存储介质,可应用于视频技术、影音处理、地图或车联网领域。通过获取待处理视频以及分割对象;然后确定与待处理视频帧邻近的多个参考视频帧,以得到图片组;并将图片组输入语意分割模型,以得到目标视频帧,该语意分割模型融合了待处理视频帧与参考视频帧的特征信息;进而得到包含分割对象的目标视频。从而实现基于多视频帧的视频分割过程,由于采用相邻的参考帧作为参考信息,把参考帧信息融合到当前帧特征中,从而利用其他帧的信息对当前帧缺失的信息进行补全,提升了视频处理的准确性。
-
公开(公告)号:CN111062473A
公开(公告)日:2020-04-24
申请号:CN201911294742.9
申请日:2019-12-16
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06N3/063
摘要: 本申请提供了一种神经网络模型中的数据计算方法、图像处理方法及装置,该方法包括:将线程组进行数据计算所需的数据处理层的权重数据,读取到线程组的组共享GroupShared变量中;基于线程组的线程数对数据处理层的输入数据进行划分;对于划分后的每一组输入数据,从GroupShared变量中读取该组输入数据进行一次数据处理所对应权重数据;线程组中的线程基于每一组输入数据以及该组输入数据对应的权重数据进行数据计算,得到该组输入数据对应的计算结果。通过本申请的方案,对于同一线程组对应的输入数据,不需要每个输入数据都读取一次对应的权重数据,可减少权重数据的读取次数。
-
公开(公告)号:CN114626524B
公开(公告)日:2024-11-19
申请号:CN202210280497.1
申请日:2022-03-21
申请人: 腾讯科技(深圳)有限公司
发明人: 刘文然
-
公开(公告)号:CN114780794A
公开(公告)日:2022-07-22
申请号:CN202210273217.4
申请日:2022-03-18
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种模型训练方法、视频分类方法、装置、设备及存储介质,该方法包括获取第一视频、第一视频的分类标注和标题信息;对第一视频进行帧采样得到第一视频的至少一个视频帧;对第一视频的至少一个视频帧分别进行文字识别得到至少一个视频帧各自的文本信息;对至少一个视频帧各自的文本信息进行处理得到第一视频的第一词向量,对第一视频的标题信息进行处理,得到第一视频的第二词向量;根据第一视频的第一词向量、第二词向量和至少一个视频帧训练视频分类模型。由于文本信息可以更好的反映视频内容,从而使得经过视频帧的文本信息、视频帧和视频的标题信息训练的视频分类模型更佳,进而可以提高视频分类精度。
-
公开(公告)号:CN114626524A
公开(公告)日:2022-06-14
申请号:CN202210280497.1
申请日:2022-03-21
申请人: 腾讯科技(深圳)有限公司
发明人: 刘文然
摘要: 本申请公开一种目标业务网络确定方法、业务处理方法及装置,涉及人工智能技术,包括:获取待训练业务网络对应的对比网络、预设剪枝比例和训练业务数据集;基于预设剪枝比例对对比网络进行剪枝处理,得到目标网络;基于训练业务数据集对对比网络和目标网络分别进行训练,得到对比网络对应的第一损失信息和目标网络对应的第二损失信息;基于第一损失信息和第二损失信息,对对比网络进行更新,基于更新后的对比网络和当前的预设剪枝比例,重复剪枝迭代步骤,直至达到第一预设收敛条件;根据达到第一预设收敛条件时得到的对比网络或目标网络,确定待训练业务网络的目标业务网络。根据本申请的技术方案,可实现神经网络训练效率和精度之间的平衡。
-
公开(公告)号:CN117011156A
公开(公告)日:2023-11-07
申请号:CN202211029204.9
申请日:2022-08-26
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供一种图像处理方法、装置、设备及存储介质,对获取的目标视频帧图像包含的第一类对象进行掩膜处理,获得待处理图像,第一类对象为待修复的图像元素;对待处理图像中第一类对象进行修复处理,获得第一修复图像,基于第一修复图像中不满足图像质量的初始模糊区域,生成相应的图像初始掩膜模板;当图像初始掩膜模板包含的初始模糊像素的第一数量达到第一阈值时,对初始模糊像素对应的模糊区域进行形态学处理,获得图像目标掩膜模板;当图像目标掩膜模板包含的中间模糊像素的第二数量达到第二阈值时,在第一修复图像中,对中间模糊像素对应的像素区域进行修复处理,获得第二修复图像;基于第二修复图像,确定待处理图像对应的目标修复图像。
-
-
-
-
-
-
-
-
-