-
公开(公告)号:CN116363392A
公开(公告)日:2023-06-30
申请号:CN202211567234.5
申请日:2022-12-07
Applicant: 科大讯飞股份有限公司
IPC: G06V10/74 , G06V10/80 , G06V10/46 , G06V10/82 , G06F16/583 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种目标检测方法、装置、电子设备和存储介质,属于图像处理技术领域,所述目标检测方法包括:获取待检测图像,对所述待检测图像进行目标检测,得到目标检测结果;对所述目标检测结果进行负例过滤,得到目标用户对应的检测结果,所述目标用户对应的图像检索特征库是通过对所述目标用户确定的负例图像进行预处理和特征提取得到的。本发明通过无需单独针对目标用户定制目标检测模型,只需要根据目标用户对应的图像检索特征库对目标检测结果进行负例过滤,即可实现针对目标用户定义的目标检测事件得到检测结果,可提高目标检测的效率并降低实现成本。
-
公开(公告)号:CN115761213A
公开(公告)日:2023-03-07
申请号:CN202211379775.5
申请日:2022-11-04
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种目标检测方法及相关装置、电子设备、存储介质,其中,目标检测方法包括:在待检测图像检测主目标,得到主目标的第一候选框,并在待检测图像分别检测若干辅目标,得到各个辅目标的第二候选框;其中,若干辅目标属于主目标;并将主目标的任一第一候选框分别与各个辅目标的任一第二候选框进行组合,得到候选框组合;再对于各个候选框组合,基于第一候选框分别与各个第二候选框之间的交集,分析是否剔除候选框组合;将保留的候选框组合中第一候选框,作为主目标的目标检测框。上述方案,能够在降低检测成本、提高检测适应性的同时,提升目标检测的准确率。
-
公开(公告)号:CN115661721A
公开(公告)日:2023-01-31
申请号:CN202211418483.8
申请日:2022-11-14
Applicant: 科大讯飞股份有限公司
IPC: G06V20/40 , G06V10/764 , G06V10/26 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本发明提供了一种积水情况检测方法、装置、设备及存储介质,方法包括:获取指定视频点位下的目标视频段;识别目标视频段包含的各视频帧中的积水区域,作为初步积水区域;获取目标视频帧集包含的各视频帧分别对应的深度图,目标视频帧集包含的视频帧为识别到积水区域的视频帧;根据目标视频帧集包含的各视频帧中的初步积水区域以及各视频帧分别对应的深度图,定位出目标视频帧中的目标积水区域,目标视频帧为目标视频帧集中的一视频帧;将目标视频帧对应的深度图中与目标积水区域对应的区域的像素值确定为目标积水区域的深度信息。本发明能够从视频段包含的视频帧中定位出准确的积水区域,在此基础上可进一步确定出积水区域的深度信息。
-
公开(公告)号:CN115480511A
公开(公告)日:2022-12-16
申请号:CN202211129098.1
申请日:2022-09-16
Applicant: 科大讯飞股份有限公司
IPC: G05B19/042 , G06V40/18
Abstract: 本申请公开了一种机器人交互方法、装置、存储介质及设备,该方法包括:首先获取目标用户的人脸图像,然后,利用该目标用户的人脸图像,确定目标用户的视线角度;接着根据目标用户的人脸图像和视线角度,确定目标机器人移动的终点位置信息;进而可以控制目标机器人移动到终点位置。可见,由于本申请是根据用户的视线移动,确定出机器人移动的终点位置,再控制机器人移动到该终点位置,从而能够实现更加精准、便捷的机器人交互,进而提高了交互效果和用户的交互体验。
-
公开(公告)号:CN115457650A
公开(公告)日:2022-12-09
申请号:CN202210957515.5
申请日:2022-08-10
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种手势识别方法、模型构建方法、设备及存储介质,该识别方法包括:将待识别图像输入至预先构建好的手势识别模型,得到第一识别结果;手势识别模型中,第一识别模型包括第一特征提取模块、第二特征提取模块、特征融合模块和第一识别层,第一特征提取模块逐层提取待识别图像的图像特征,得到浅层特征;特征融合模块根据浅层特征,确定用户手势的位置特征,将浅层特征与位置特征融合并输入至第二特征提取模块;第二特征提取模块用于特征提取;第一识别层对第二特征提取模块提取的图像特征进行识别,得到第一识别结果。本申请能够将待识别图像的关键点特征与浅层特征融合,加强了手部区域特征,从而使识别结果更加准确。
-
公开(公告)号:CN115223194A
公开(公告)日:2022-10-21
申请号:CN202210702458.6
申请日:2022-06-20
Applicant: 科大讯飞股份有限公司
IPC: G06V40/10 , G06V10/40 , G06V10/764 , G06F3/01
Abstract: 本申请公开了一种手势识别方法、手势交互方法及相关装置、设备和介质,其中,手势识别方法包括:提取拍摄视频中目标图像的目标图像特征,并提取拍摄视频中位于目标图像之前参考图像的参考图像特征;基于目标图像特征和参考图像特征进行预测,得到若干预设类别的预测图像;基于各个预测图像进行分析,得到目标图像的手势识别结果;其中,手势识别结果至少包括:目标图像中是否存在手势,及在目标图像中存在手势的情况下,各个手势的手势类别。上述方案,能够在确保适用于多人手势交互的情况下,进一步提升手势识别的准确性,并尽可能地降低手势识别的计算负荷,以及提升在远距离使用场景下的适用性。
-
公开(公告)号:CN114529791A
公开(公告)日:2022-05-24
申请号:CN202210032569.0
申请日:2022-01-12
Applicant: 科大讯飞股份有限公司
IPC: G06V10/80 , G06V10/774 , G06K9/62
Abstract: 本申请公开了一种目标检测方法及相关装置、电子设备、存储介质,其中,目标检测方法包括:获取待检测图像的特征图中各像素位置的第一特征表示,并获取若干预设对象的第二特征表示和若干预设类别的第三特征表示;将预设对象的第二特征表示和预设类别的第三特征表示进行融合,得到融合特征表示;基于第一特征表示和融合特征表示进行预测,得到目标对象关于目标类别的检测结果;其中,目标对象和目标类别分别表征融合特征表示对应的预设对象和预设类别。上述方案,能够将多分类任务转换为二分类任务,进而即使类别再繁多,也能够准确检测,有利于提升目标检测精度。
-
公开(公告)号:CN114187917A
公开(公告)日:2022-03-15
申请号:CN202111530309.8
申请日:2021-12-14
Applicant: 科大讯飞股份有限公司
IPC: G10L17/02 , G10L21/0216 , G10L21/0272 , G06V40/10
Abstract: 本发明提供一种话者分离方法、装置、电子设备和存储介质,所述方法包括:对视频帧进行人员检测,得到视频帧中人员的人员位置;对视频帧对应的音频段进行声源定位,得到声源位置;基于人员位置和声源位置之间的相对位置关系,对音频段进行话者分离。本发明提供的话者分离方法、装置、电子设备和存储介质,可以避免环境噪声和不同角色话者声纹特征差异程度的影响,进而可以基于人员位置和声源位置之间的相对位置关系,准确对音频段进行话者分离。
-
公开(公告)号:CN113743258A
公开(公告)日:2021-12-03
申请号:CN202110963118.4
申请日:2021-08-20
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种目标识别方法、装置、电子设备以及计算机可读存储介质,其中目标识别方法包括:基于参考帧中的待识别目标的参考特征信息对当前帧中的所述待识别目标进行特征提取,以得到所述当前帧中所述待识别目标的特征信息;所述参考帧为所述当前帧的上一帧;对所述待识别目标的所述特征信息进行识别。本申请的方法能够减少背景干扰,提高目标识别的准确率。
-
公开(公告)号:CN113240666A
公开(公告)日:2021-08-10
申请号:CN202110625389.9
申请日:2021-06-04
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种医学影像预处理方法、装置、设备及存储介质,其中,方法包括:在获得待处理医学影像后,首先从待处理医学影像中获取候选感兴趣影像块,然后基于预先建立的影像转换模型将候选感兴趣影像块转换为无设备信息的影像块。由于影像转换模型采用对抗生成网络中的生成网络,以使对抗生成网络中的判别网络无法判别训练样本对应的转换后样本所属的域为训练目标训练得到,因此,基于训练得到的影像转换模型能够将从待处理医学影像中获取的候选感兴趣影响块转换为无设备信息的影像块,进而使得后续对无设备信息的候选感兴趣影像块进行感兴趣影像块/非感兴趣影像块的分类时,因无设备信息的影响,能够获得比较准确的分类结果。
-
-
-
-
-
-
-
-
-