-
公开(公告)号:CN107578453A
公开(公告)日:2018-01-12
申请号:CN201710974261.7
申请日:2017-10-18
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明实施例提供了压缩图像处理方法、装置、电子设备及计算机可读介质,包括:获取格式为JPEG的原始图像,将原始图像进行熵解码和反量化处理,得到预处理的图像;再将预处理的图像进行神经网络算法训练;最后将训练得到的预处理的图像的神经网络的参数对原始图像进行推断,从而得到推断结果,可以在GPU上执行,减少训练所需要的数据解压缩的预处理时间,以及神经网络进行推断的时间。
-
公开(公告)号:CN113935888A
公开(公告)日:2022-01-14
申请号:CN202111021222.8
申请日:2021-09-01
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本公开是关于一种图像变换方法、装置、电子设备及存储介质。其中,图像变换方法,包括:获取原始图像,以及原始图像与目标图像之间的光流映射关系;确定所述原始图像的深度信息;基于所述原始图像、所述光流映射关系及所述原始图像的深度信息,确定目标图像。通过本公开可以避免因原始图像映射的像素点分布不均匀导致的目标图像中像素点的映射缺陷。
-
公开(公告)号:CN113793382A
公开(公告)日:2021-12-14
申请号:CN202110893253.6
申请日:2021-08-04
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明提供了一种视频图像的拼缝搜索方法、视频图像的拼接方法和装置,获取第一视频中每帧视频图像的能量图;针对第一帧视频图像,基于其能量图确定其拼缝搜索结果;针对其余每帧视频图像,基于前一帧视频图像的拼缝搜索结果,确定拼缝搜索区域范围;在该范围内,基于当前视频图像的能量图确定其拼缝搜索结果。该方式基于视频图像的能量图确定拼缝搜索结果,并且,对于除第一帧以外的视频图像,先基于前一帧视频图像的拼缝搜索结果确定拼缝搜索区域范围,再在该拼缝搜索区域范围内确定拼缝搜索结果,这种约束拼缝搜索区域范围的方式可以减少前后帧视频图像的拼缝区域差异,缓解拼接后的视频在播放过程中的抖动问题,进而提升全景视频的拼接效果。
-
公开(公告)号:CN105518712B
公开(公告)日:2021-05-11
申请号:CN201580000345.X
申请日:2015-05-28
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 一种基于字符识别的关键词通知方法及设备,属于信息发现与提示技术领域。所述基于字符识别的关键词通知方法包括:拍摄待识别图像;在所述待识别图像中进行字符识别;以及在从所述待识别图像中识别出的字符与预设关键词匹配的情况下,产生并输出匹配通知消息。通过预先设定目标关键词,并且基于目标关键词来筛选字符识别结果,从而能够在字符识别结果与目标关键词匹配时向用户提示发现了目标关键词。
-
公开(公告)号:CN107402905B
公开(公告)日:2021-04-09
申请号:CN201610340203.4
申请日:2016-05-19
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明的实施例提供了基于神经网络的计算方法和装置。该方法包括:将输入数据输入至第一神经网络,其至少一个权重系数矩阵的至少一行内包括相同参数;基于第一神经网络对输入数据进行计算,其中在涉及权重系数矩阵的至少一行的矩阵乘法操作中,将矩阵乘法操作所涉及的输入矢量中的、与相同参数对应的元素相加,以获得元素和;将元素和与相同参数的值相乘,以获得数据积;根据数据积的加和计算涉及权重系数矩阵的至少一行的乘法计算结果;以及根据权重系数矩阵的所有行的乘法计算结果,计算并输出第一神经网络的计算结果。上述方法和装置能够显著减少基于神经网络的计算的计算量。
-
公开(公告)号:CN108875919B
公开(公告)日:2021-04-02
申请号:CN201710602148.6
申请日:2017-07-21
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06N3/06
Abstract: 一种数据处理装置、数据处理方法和存储介质产品。该数据处理方法包括至少一次重复执行如下操作:接收最初的输入数据或上一次执行下述操作的输出数据;将多个神经元划分为至少一个神经元子集并对于每个神经元子集执行如下操作:通过处理所接收的数据依次获取神经元子集中的神经元输出的数据,将神经元输出的数据转换为二值数据。在最大值优先的情况下,当确定二值数据的值为第一值时,则不再处理神经元子集中剩余的神经元且将第一值作为神经元子集的输出数据,或者,在最小值优先的情况下,当确定二值数据的值为第二值时,则不再处理神经元子集中剩余的神经元且将第二值作为神经元子集的输出数据。该数据处理方法降低了数据处理量。
-
公开(公告)号:CN106203425B
公开(公告)日:2020-02-04
申请号:CN201610515118.7
申请日:2016-07-01
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06K9/32
Abstract: 本发明的实施例提供了一种字符识别方法及装置。所述字符识别方法包括:获取待识别字符区域的至少两帧图像;对所述至少两帧图像中的每一帧进行字符识别,以生成每一帧图像的字符识别结果;以及对所述至少两帧图像的字符识别结果进行融合,以生成所述待识别字符区域的最佳字符识别结果。根据本发明实施例的字符识别方法及装置利用图像的时空冗余和互补特性,基于至少两帧图像的融合进行字符识别,与基于单帧图像的字符识别相比,可以取得更高的识别精度,且在存在噪声、模糊以及光照不佳等情况下,具有更好的适应性。
-
公开(公告)号:CN106251338B
公开(公告)日:2019-04-30
申请号:CN201610578817.6
申请日:2016-07-20
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06T7/13
Abstract: 本发明的实施例提供了目标完整性检测方法和装置。该方法包括:将包括目标的原始图像输入至神经网络,以获得所述原始图像的热力图,其中所述热力图的像素值表示了所述原始图像中相应位置的像素属于所述目标的概率;根据所述热力图确定所述目标在所述原始图像中的边缘;以及根据所述边缘确定所述目标在所述原始图像中是否完整。上述方法和装置在检测原始图像中目标的完整性时,能够对原始图像中的杂乱背景等干扰信号鲁棒。此外,在神经网络得到热力图的前提下,后续只需要几步相对简单的图像处理操作,从而提高了整个方案的易用性。
-
公开(公告)号:CN105447501B
公开(公告)日:2019-03-01
申请号:CN201510736192.7
申请日:2015-11-02
Applicant: 徐州旷视数据科技有限公司 , 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06K9/62
Abstract: 本发明提供了一种基于聚类的证照图像阴影检测方法及装置。所述证照图像阴影检测方法包括:从待测图像中随机采集多个不同尺度的图像块;计算所述图像块的图像特征;基于所述图像特征对所述图像块进行聚类;以及计算聚类后每一类别所包括的图像块的平均亮度,并基于最小平均亮度与预定阈值的比较结果确定所述待测图像中是否包含阴影。本发明提供的基于聚类的证照图像阴影检测方法及装置通过图像特性自动判断图像中是否存在阴影,避免人工查看和判断的过程,可以极大提高处理效率。
-
公开(公告)号:CN108932456A
公开(公告)日:2018-12-04
申请号:CN201710370126.1
申请日:2017-05-23
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06K9/00
Abstract: 本发明的实施例提供了一种人脸识别方法、装置和系统及存储介质。该方法包括:获取第一人脸图像和第二人脸图像;计算第一人脸图像中的至少两个人脸部位中的每个人脸部位与第二人脸图像中的对应人脸部位之间的匹配分数,以获得至少两个部位匹配分数;检测第一人脸图像中的至少两个人脸部位中的至少部分人脸部位中的每个人脸部位的遮挡情况;根据第一人脸图像中的至少两个人脸部位中的每个人脸部位的遮挡情况,分别确定每个人脸部位所对应的部位匹配分数的权重;以及至少基于所确定的权重对部位匹配分数进行加权平均,以获得总匹配分数,其中,总匹配分数为第一人脸图像与第二人脸图像之间的匹配分数。本发明便于减小遮挡对人脸识别结果的影响。
-
-
-
-
-
-
-
-
-