-
公开(公告)号:CN108875919A
公开(公告)日:2018-11-23
申请号:CN201710602148.6
申请日:2017-07-21
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06N3/06
Abstract: 一种数据处理装置、数据处理方法和存储介质产品。该数据处理方法包括至少一次重复执行如下操作:接收最初的输入数据或上一次执行下述操作的输出数据;将多个神经元划分为至少一个神经元子集并对于每个神经元子集执行如下操作:通过处理所接收的数据依次获取神经元子集中的神经元输出的数据,将神经元输出的数据转换为二值数据。在最大值优先的情况下,当确定二值数据的值为第一值时,则不再处理神经元子集中剩余的神经元且将第一值作为神经元子集的输出数据,或者,在最小值优先的情况下,当确定二值数据的值为第二值时,则不再处理神经元子集中剩余的神经元且将第二值作为神经元子集的输出数据。该数据处理方法降低了数据处理量。
-
公开(公告)号:CN104966109B
公开(公告)日:2018-08-14
申请号:CN201510425315.5
申请日:2015-07-17
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明提供了一种医疗化验单图像分类方法及装置。所述医疗化验单图像分类方法包括:计算给定医疗化验单图像的图像特征;以及基于所计算的图像特征利用训练好的分类模型确定所述给定医疗化验单图像所对应的医疗化验单的类型和格式。本发明提供的医疗化验单图像分类方法及装置通过图像特性自动判断医疗化验单的类型和格式,免去人工鉴别医疗化验单的类型和格式的过程,提高医疗化验单识别的效率。
-
公开(公告)号:CN107402905A
公开(公告)日:2017-11-28
申请号:CN201610340203.4
申请日:2016-05-19
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明的实施例提供了基于神经网络的计算方法和装置。该方法包括:将输入数据输入至第一神经网络,其至少一个权重系数矩阵的至少一行内包括相同参数;基于第一神经网络对输入数据进行计算,其中在涉及权重系数矩阵的至少一行的矩阵乘法操作中,将矩阵乘法操作所涉及的输入矢量中的、与相同参数对应的元素相加,以获得元素和;将元素和与相同参数的值相乘,以获得数据积;根据数据积的加和计算涉及权重系数矩阵的至少一行的乘法计算结果;以及根据权重系数矩阵的所有行的乘法计算结果,计算并输出第一神经网络的计算结果。上述方法和装置能够显著减少基于神经网络的计算的计算量。
-
公开(公告)号:CN117392400A
公开(公告)日:2024-01-12
申请号:CN202311255571.5
申请日:2023-09-26
Applicant: 北京迈格威科技有限公司
Abstract: 本申请提供了一种目标对象检测方法、电子设备及存储介质,包括:获取从不同视角所采集的目标对象所在3D空间的多个图像;对多个图像进行特征提取,得到不同视角下的多个2D图像特征;针对每个2D图像特征,将2D图像特征变换到3D空间,得到N个变换3D特征,以及,对2D图像特征进行处理,得到N个3D体素在3D空间中的深度分布信息;将变换3D特征和深度分布信息进行融合,得到3D空间的3D占用体素信息;基于3D占用体素信息对3D空间进行目标对象检测,得到目标对象的检测结果。基于该方法,不需要3D信号输入,有效地利用不同视角的多个图像中隐含的深度信息来生成高精度的3D占用体素信息,实现目标对象检测。
-
公开(公告)号:CN116485943A
公开(公告)日:2023-07-25
申请号:CN202310286679.4
申请日:2023-03-22
Applicant: 北京迈格威科技有限公司
IPC: G06T11/60 , G06V10/75 , G06F16/583
Abstract: 本申请实施例提供了一种图像生成方法、电子设备及存储介质,该方法包括:生成与提示文本对应的至少一张图像;生成每张图像的初始文字说明;提取提示文本中的实体词,并确定每个实体词所表征的物体在每张图像中的目标检测结果;根据每张图像的目标检测结果和初始文字说明,生成每张图像的目标文字说明;针对每张图像,将提示文本与图像的目标文字说明进行匹配,得到匹配结果;在不存在满足目标条件的匹配结果时,根据目标文字说明对提示文本进行更新,并基于更新后的提示文本,迭代执行上述各步骤,直至存在满足所述目标条件的匹配结果;从匹配结果满足所述目标条件的至少一张图像中确定目标图像。本申请实施例可以提高图像的生成效率。
-
公开(公告)号:CN111680544B
公开(公告)日:2023-07-21
申请号:CN202010334793.6
申请日:2020-04-24
Applicant: 北京迈格威科技有限公司
IPC: G06V40/16 , G06V10/40 , G06V10/56 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0475 , G06N3/08
Abstract: 本发明实施例提供了一种人脸识别方法、装置、系统、设备及介质,所示方法包括:获取待识别的人脸图像;根据所述人脸图像,生成与所述人脸图像对应的颜色特征图和位置特征图;其中,所述颜色特征图中的像素点的像素值表征该像素点在所述人脸图像中的颜色,所述位置特征图中的像素点的像素值表征该像素点在所述人脸图像中的位置;根据所述颜色特征图和所述位置特征图,对所述人脸图像进行识别。采用本发明的技术方案,可以提高人脸识别的准确度。
-
公开(公告)号:CN115984093A
公开(公告)日:2023-04-18
申请号:CN202211397790.2
申请日:2022-11-09
Applicant: 北京迈格威科技有限公司
IPC: G06T3/00 , G06T7/50 , G06N3/0464 , G06N3/088
Abstract: 本申请实施例提供一种基于红外图像的深度估计方法、电子设备以及存储介质。该方法包括:获取待处理红外图像;将待处理红外图像输入目标深度估计模型,获得对应的第一深度估计结果,第一深度估计结果是与待处理红外图像中的每个像素的深度相关的信息;基于第一深度估计结果,确定待处理红外图像所对应的第一深度信息;其中,目标深度估计模型利用合成红外训练数据训练获得,合成红外训练数据包括合成红外图像和标注深度信息,合成红外图像基于标注RGB图像生成,标注深度信息是标注RGB图像所对应的深度信息。目标深度估计模型由于利用合成红外图像训练获得,因此可用的训练数据较为充足,获得的目标深度估计模型性能也较为鲁棒。
-
公开(公告)号:CN112104830B
公开(公告)日:2022-09-27
申请号:CN202010815538.3
申请日:2020-08-13
Applicant: 北京迈格威科技有限公司
Abstract: 本申请涉及视频处理技术领域,提供一种视频插帧方法、模型训练方法及对应装置。其中,视频插帧方法包括:获取第一视频帧和第二视频帧;基于第一视频帧和第二视频帧,利用第一神经网络计算出第一视频帧与第一中间视频帧之间的光流和/或第二视频帧与第一中间视频帧之间的光流;利用第一视频帧与第一中间视频帧之间的光流对第一视频帧进行后向映射,获得第一映射视频帧,和/或,利用第二视频帧与第一中间视频帧之间的光流对第二视频帧进行后向映射,获得第二映射视频帧;根据第一映射视频帧和/或第二映射视频帧确定第一中间视频帧。该方法计算中间帧光流的准确性较高,因此最终获得的第一中间视频帧图像质量较好,且使用该方法插帧效率较高。
-
公开(公告)号:CN110428394B
公开(公告)日:2022-04-26
申请号:CN201910516879.8
申请日:2019-06-14
Applicant: 北京迈格威科技有限公司
Abstract: 提供了一种用于目标移动侦测的方法、装置及计算机存储介质。所述方法包括:获取关键帧图像;通过全卷积检测网络,得到所述关键帧图像中的像素为目标像素点的概率值;判断所述概率值是否满足背景条件;如果所述概率值满足所述背景条件,则将所述像素标记为背景,否则标记为前景。如此可见,本发明实施例中,可以通过判断像素为目标像素点的概率值是否满足背景条件,进而确定像素是否为背景,能够快速地实现移动目标侦测,缩短侦测所需的时间,提高移动侦测的速度。
-
公开(公告)号:CN111246091B
公开(公告)日:2021-09-03
申请号:CN202010045175.X
申请日:2020-01-16
Applicant: 北京迈格威科技有限公司
Abstract: 本发明提供了一种动态自动曝光控制方法和装置及电子设备和存储介质,方法包括:获取摄像设备拍摄的当前帧图像;对当前帧图像进行目标检测和识别;自动曝光神经网络进行曝光预测:将所述当前帧图像、所述当前帧图像的目标检测和识别结果输入经过预训练的自动曝光神经网络,得到输出的预测值;根据所述自动曝光神经网络输出的预测值,控制所述摄像设备下一帧图像拍摄时的曝光值。从而可以摄像机根据工作环境的变化和目标的状态动态的自动调整曝光策略,在宽动态场景获得理想的目标检出和识别效果。
-
-
-
-
-
-
-
-
-