-
公开(公告)号:CN118172547B
公开(公告)日:2024-07-30
申请号:CN202410605736.5
申请日:2024-05-16
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V10/25 , G06V10/28 , G06V10/771 , G06V10/74
Abstract: 本公开的实施例公开了图像目标识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对输入图像中的各个前景目标进行标记处理;对前景目标矩形框区域进行特征提取,生成前景目标图像特征;执行以下步骤:将前景目标图像特征与待检测目标图像特征之间的相似度确定为初始特征相似度;对各个待检测目标图像特征进行排序;选择初始特征作为第一筛选特征集合;执行以下步骤:生成第二筛选特征集合;生成前景目标图像特征和初始特征的相似度;生成对应前景目标图像特征的图像目标信息。该实施方式在针对新的图像目标检测需求信息可以不需要重新采集图像数据,节约了计算资源,缩短了图像目标检测的时间。
-
公开(公告)号:CN111401175B
公开(公告)日:2024-07-26
申请号:CN202010155763.9
申请日:2020-03-09
Applicant: 北京航空航天大学
IPC: G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种可同时识别面部多种属性特征的方法,包括步骤:构建人脸图像样本集;将所述人脸图像样本集划分为训练集、验证集和测试集三个部分;计算训练集中所有图像的通道均值;构建、训练、验证和测试人脸表情分类模型;构建、训练、验证和测试人脸身份分类模型;基于完成训练的人脸表情分类模型和人脸身份分类模型,分别提取正面人脸图像的表情属性和身份属性。本发明通过对静态正面人脸图像样本集分别建立人脸表情分类模型和人脸身份分类模型,达到同时识别图像表情与身份的目的,提高了提取人脸多属性的速度与效率。
-
公开(公告)号:CN114154587B
公开(公告)日:2024-07-05
申请号:CN202111503622.2
申请日:2021-12-10
Applicant: 北京航空航天大学
IPC: G06V10/774 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/042 , G06N3/08 , G06F16/35 , G06F16/55
Abstract: 本发明涉及多模态处理技术领域,提供了一种基于互补内容感知的多模态事件检测方法。该方法包括:将经过预处理的包括图像和文本的多模态数据集,随机划分成训练集和验证集;采用图像编码器和文本编码器提取图像和文本的特征,构建多模态图结构;基于多模态图结构,构建多模态事件检测模型;通过多模态事件检测模型损失函数和反向传播算法训练多模态事件检测;将多模态图结构输入至目标多模态事件检测模型,获得多模态事件检测结果。本发明的方案,拓展了多模态事件检测的思路,提高了事件检测的效果,弥补了复杂多模态关系建模不充分的缺陷。
-
公开(公告)号:CN117636100B
公开(公告)日:2024-04-30
申请号:CN202410101911.7
申请日:2024-01-25
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06V10/774 , G06V10/762 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/045 , G06N3/084
Abstract: 本公开的实施例公开了预训练任务模型调整处理方法、装置、电子设备和介质。该方法的一具体实施方式包括:根据未标注图像集合,生成标注图像组集合;生成标注特征向量组集合;根据标注图像组集合,确定聚类类别信息;生成未标注特征向量集合;对未标注特征向量集合进行聚类处理;生成聚类中心信息集合;生成标注图像中心信息集合;根据聚类中心信息集合和标注图像中心信息集合,确定校准中心信息集合;根据校准中心信息集合,生成特征向量组集合;确定伪标签特征向量组集合;确定扩展标签图像组集合;对预训练任务模型进行调整处理。该实施方式可以减少计算机处理器资源的浪费,缩减所选择数据的类别分布与总体样本的类别分布偏差。
-
公开(公告)号:CN117574930B
公开(公告)日:2024-04-12
申请号:CN202410052300.8
申请日:2024-01-15
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了立体条形码信息生成方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:将双线平行激光束投射至目标立体条形码图案上;对目标立体条形码图案进行图像采集;对立体条形码图像进行条形码图像分割处理,以生成上行条形码图像和下行条形码图像;对上行条形码图像进行激光线细化处理;对下行条形码图像进行激光线细化处理;对激光线细化上行条形码像素点进行直线拟合处理;对激光线细化下行条形码像素点进行直线拟合处理;生成上行像素距离集合;生成下行像素距离集合;将上行条形码图像对应的待解码字符串和下行条形码图像对应的待解码字符串进行组合处理;生成立体条形码信息。该实施方式提高了条形码的解码准确率。
-
公开(公告)号:CN117574930A
公开(公告)日:2024-02-20
申请号:CN202410052300.8
申请日:2024-01-15
Applicant: 北京航空航天大学杭州创新研究院
Abstract: 本公开的实施例公开了立体条形码信息生成方法、装置、电子设备和可读介质。该方法的一具体实施方式包括:将双线平行激光束投射至目标立体条形码图案上;对目标立体条形码图案进行图像采集;对立体条形码图像进行条形码图像分割处理,以生成上行条形码图像和下行条形码图像;对上行条形码图像进行激光线细化处理;对下行条形码图像进行激光线细化处理;对激光线细化上行条形码像素点进行直线拟合处理;对激光线细化下行条形码像素点进行直线拟合处理;生成上行像素距离集合;生成下行像素距离集合;将上行条形码图像对应的待解码字符串和下行条形码图像对应的待解码字符串进行组合处理;生成立体条形码信息。该实施方式提高了条形码的解码准确率。
-
公开(公告)号:CN117333560A
公开(公告)日:2024-01-02
申请号:CN202311631211.0
申请日:2023-12-01
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06T9/00 , G06T7/41 , G06V10/764
Abstract: 本公开的实施例公开了场景自适应的条纹结构光解码方法、装置、设备和介质。该方法的一具体实施方式包括:获取对应目标物体的全局照明图像和反射图像序列;对反射图像序列进行分类,得到第一反射图像子序列、第二反射图像子序列和第三反射图像子序列;根据全局照明图像、第一反射图像子序列和第二反射图像子序列,生成各个归一化像素值组;确定各个条纹宽度信息组;对各个归一化像素值组进行亚像素定位,以确定各个亚像素位置信息;对第三反射图像子序列中的各个第三反射图像进行解码,以生成各个解码信息;生成对应目标物体的各个点云信息。该实施方式可以提高条纹亚像素定位的精度,从而可以提高所获取的点云信息准确率且减少点云信息的缺失。
-
公开(公告)号:CN117292182A
公开(公告)日:2023-12-26
申请号:CN202311222095.7
申请日:2023-09-21
Applicant: 北京航空航天大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/082
Abstract: 本发明涉及一种基于多粒度重要性度量的图像表征模型剪枝方法,属于模型压缩技术领域,本方法通过结合信息损失与冗余度准则构建多粒度重要性度量的模型通道剪枝方法,弥补了现有算法重要性度量单一、性能不稳定的不足,并通过保持剪枝通道分布的均衡性和多样性提升剪枝后模型的微调性能,拓展了基于重要性度量的模型剪枝思路。
-
公开(公告)号:CN117217282A
公开(公告)日:2023-12-12
申请号:CN202311235935.3
申请日:2023-09-22
Applicant: 北京航空航天大学
IPC: G06N3/082 , G06N3/0985 , G06V20/52 , G06V40/10 , G06V10/82 , G06V10/764 , G06N3/0464
Abstract: 本发明属于模型压缩技术领域,涉及一种面向深度行人搜索模型的结构化剪枝方法,包括:S1、准备图像数据集,完成数据预处理,进行数据集划分,构建待剪枝的行人搜索模型;S2、预训练待剪枝的所述行人搜索模型,直至所述行人搜索模型收敛;S3、初始化剪枝模块,设定目标压缩规模,进行耦合层分组和初始化;S4、对所述模型进行剪枝:计算通道重要性度量,结合卷积层位置和压缩规模确定可剪枝网络层;S5、微调剪枝后的模型,根据掩码删除通道对应的网络结构,训练剪枝后模型直至收敛;S6、将查询行人图像和候选图像输入到微调后的剪枝模型中,模型输出即为最终的推理结果。本发明提升了压缩后深度行人搜索模型的性能,降低精度损失。
-
公开(公告)号:CN116468725B
公开(公告)日:2023-09-05
申请号:CN202310691667.X
申请日:2023-06-13
Applicant: 北京航空航天大学杭州创新研究院
IPC: G06T7/00 , G06F18/25 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明涉及基于预训练模型的工业缺陷检测方法、装置及存储介质,应用于工业缺陷检测技术领域,包括:通过获取工业缺陷检测图像数据集来训练视觉语言模型,针对每种场景下的每种工业缺陷设置语言文本,通过语言文本描述目标缺陷的特征,将待检测图像和目标缺陷所对应的语言文本一并输入到预训练的视觉语言模型中,这样预训练的视觉语言模型就可以结合待检测图像以及目标缺陷的语言文本,通过在待检测图像上寻找与语言文本相关联的物体区域,从而实现目标缺陷的检测;本申请中,针对每一种缺陷设置不同的语言文本,而不是针对每一种缺陷单独训练模型,从而节省模型训练过程中花费的时间,节约成本,同时还能实现工业检测上多种缺陷的识别检测。
-
-
-
-
-
-
-
-
-