-
公开(公告)号:CN118077202A
公开(公告)日:2024-05-24
申请号:CN202280062858.3
申请日:2022-11-18
Applicant: 华为技术有限公司
Inventor: 谢拉尔·斯威塔·库马尔 , 阿玛蒂亚·慕克吉 , 西勒·尼迈什库马尔·帕特尔 , 柴瑞祥 , 刘文涛 , 于远灏 , 唐进 , 王洋
IPC: H04N19/42 , H04N19/43 , H04N19/436
Abstract: 描述了用于在压缩视频数据的解码期间提取运动矢量数据的设备和方法。在视频解码器侧,从输入缓冲器获取视频帧的经编码视频数据。对所述经编码视频数据进行解码,以获取用于经解码帧的经解码图像数据,其中,所述解码包括提取用于所述经解码帧的对应运动矢量数据。所述经解码图像数据存储在以给定索引进行索引的临时存储器中,所述对应运动矢量数据存储在以所述给定索引进行索引的相同或不同的临时存储器中。用所述经解码图像数据和所述对应运动矢量数据填充以所述给定索引进行索引的输出缓冲器,其中,所述对应运动矢量数据存储在以所述给定索引进行索引的相应临时存储器中。
-
公开(公告)号:CN116583723A
公开(公告)日:2023-08-11
申请号:CN202180076968.0
申请日:2021-10-25
Applicant: 华为技术有限公司
IPC: G01J3/50
Abstract: 提供了用于在具有环境光源(106)的环境(104)下确定目标表面(102)的表面颜色的方法(300)和系统(100)。当用可变强度、恒定颜色的光源(118)和恒定强度、恒定颜色的环境光源(106)照射目标表面(102)时采集目标表面(102)的多个图像(105),其中,所述目标表面(102)上的光源(118)强度因图像(105)采集之间的已知量而异。从图像数据中提取独立于环境光源(106)的颜色特征张量,并使用所述颜色特征张量推断目标表面(102)的表面颜色。
-
公开(公告)号:CN117957549A
公开(公告)日:2024-04-30
申请号:CN202280060482.2
申请日:2022-11-16
Applicant: 华为技术有限公司
IPC: G06N3/0985
Abstract: 本发明提供了用于元少样本类增量学习的方法和系统。根据一个方面,提供了一种方法。所述方法包括:获取第一网络的至少一个权重注意力图,并使用所述至少一个权重注意力图更新第二网络的权重,其中,所述第二网络为调制网络。所述方法还包括:基于所述第一网络的所述至少一个权重注意力图和至少一个类的输入图像集,生成所述第二网络的至少一个特征注意力图。所述方法还包括:基于所述至少一个类的所述输入图像集生成所述第一网络的至少一个特征图,并且基于所述第二网络的所述特征注意力图更新所述第一网络的所述至少一个特征图。
-
公开(公告)号:CN114866860A
公开(公告)日:2022-08-05
申请号:CN202110080633.8
申请日:2021-01-20
Applicant: 华为技术有限公司
IPC: H04N21/8549 , H04N21/431
Abstract: 本申请提供了一种播放视频的方法及电子设备,该电子设备可以包括手机、平板、电脑等包含显示屏的设备,该方法应用于视频播放过程,通过检测目标视频的片头的特定时长内使用的不同的运镜类型,并根据目标视频的运镜类型匹配相关联的开场动画,即在该目标视频的播放过程中,以相关联的展开方式展开该目标视频的播放窗口,呈现给用户不同的视觉效果。具体地,该目标视频的播放窗口可以具有动态变化效果,同时可以伴随着背景图片的尺寸大小、透明度等动态变化过程,可以进一步为用户提供一种连贯的沉浸式体验,提高了用户的视觉体验。
-
公开(公告)号:CN116982080A
公开(公告)日:2023-10-31
申请号:CN202280021262.9
申请日:2022-02-08
Applicant: 华为技术有限公司
IPC: G06T7/55
Abstract: 公开了用于预测视频帧的深度的系统、方法和计算机可读介质。一种方法可以包括以下步骤:接收多个训练数据,每个训练数据包括连续视频帧集合和所述连续视频帧的后续视频帧的深度表示;接收具有多个权重θ的预训练的神经网络模型fθ;当所述预训练的神经网络模型fθ不收敛时:基于每个连续视频帧集合,计算多个第二权重,并基于所述多个训练数据和所述多个第二权重,更新所述多个权重θ;接收具有连续时间戳的多个新的连续视频帧;基于更新的多个权重θ,预测紧随所述新的连续视频帧之后的视频帧的深度表示。
-
公开(公告)号:CN114866860B
公开(公告)日:2023-07-11
申请号:CN202110080633.8
申请日:2021-01-20
Applicant: 华为技术有限公司
IPC: H04N21/8549 , H04N21/431
Abstract: 本申请提供了一种播放视频的方法及电子设备,该电子设备可以包括手机、平板、电脑等包含显示屏的设备,该方法应用于视频播放过程,通过检测目标视频的片头的特定时长内使用的不同的运镜类型,并根据目标视频的运镜类型匹配相关联的开场动画,即在该目标视频的播放过程中,以相关联的展开方式展开该目标视频的播放窗口,呈现给用户不同的视觉效果。具体地,该目标视频的播放窗口可以具有动态变化效果,同时可以伴随着背景图片的尺寸大小、透明度等动态变化过程,可以进一步为用户提供一种连贯的沉浸式体验,提高了用户的视觉体验。
-
公开(公告)号:CN114078223A
公开(公告)日:2022-02-22
申请号:CN202011642456.X
申请日:2020-12-31
Applicant: 华为技术有限公司
IPC: G06V20/40 , G06V10/46 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06T3/40 , G06T7/246 , G06T7/269
Abstract: 本申请涉及终端人工智能领域,尤其涉及视频语义理解、视频编辑、视频拼接、视频压缩领域,具体涉及一种视频语义识别方法设备。该方法包括:获取视频的多个视频帧;提取多个视频帧的空域特征;根据多个视频帧中的N个连续视频帧的空域特征,确定N个连续视频帧中第N个视频帧的动态语义;根据多个视频帧中第一视频帧的空域特征,确定第一视频帧的静态语义;使用具有第一动态语义且连续的视频帧合成第一时序片段;使用具有第一静态语义且连续的视频帧合成第二时序片段;输出第一时序片段的动态语义和第一位置信息,以及第二时序片段的静态语义和第二位置信息。
-
公开(公告)号:CN118077177A
公开(公告)日:2024-05-24
申请号:CN202280062857.9
申请日:2022-11-29
Applicant: 华为技术有限公司
Inventor: 伊琳娜·凯泽勒 , 穆斯塔法·沙哈比内贾德 , 赛义德·沙哈贝丁·纳巴维 , 刘文涛 , 于远灏 , 柴瑞祥 , 唐进 , 王洋
IPC: H04L27/00
Abstract: 公开了用于处理压缩视频以执行推理任务的方法、设备和计算机可读介质。处理所述压缩视频可以包括选择所述压缩视频的帧编码子集,或选择帧编码的零个或多个模态(RGB、运动向量、残差),用于进一步处理以执行所述推理任务。利用所述压缩视频的帧编码中预先存在的运动向量和/或残差信息来自适应且高效地执行所述推理任务。在一些实施例中,所述推理任务是动作识别任务,例如人类动作识别任务。
-
公开(公告)号:CN116547694A
公开(公告)日:2023-08-04
申请号:CN202180076964.2
申请日:2021-11-03
Applicant: 华为技术有限公司
Abstract: 描述了一种图像去模糊的方法和系统(100)。首先,通过在主要去模糊任务和辅助重建任务上对去模糊网络(101)进行元训练,得到所述去模糊网络(101)的权重。然后,基于应用时模糊输入图像,执行所述去模糊网络(101)的应用时训练,以获得应用时训练权重的值。应用时训练包括对所述应用时模糊输入图像执行所述辅助重建任务,以及基于从所述辅助重建任务中计算的辅助损失更新所述去模糊网络(101)的权重。通过所述去模糊网络(101)中的应用时训练权重,根据所述应用时模糊输入图像,生成去模糊输出图像。
-
-
-
-
-
-
-
-