场景文本信息识别方法、装置、电子设备和介质

    公开(公告)号:CN119904849A

    公开(公告)日:2025-04-29

    申请号:CN202311413494.1

    申请日:2023-10-26

    Abstract: 本公开的实施例公开了场景文本信息识别方法、装置、电子设备和介质。该方法的一具体实施方式包括:对待识别场景图像进行预处理,并对预处理后的场景图像进行区域图像分割,得到场景子图像集;对场景子图像集进行视觉编码,以及对编码得到的视觉特征向量集进行前景增强处理,得到视觉增强特征向量集;对视觉增强特征向量集进行文本识别,并对识别得到的文本特征向量集进行文本矫正处理,得到矫正后文本特征向量集;将矫正后文本特征向量集与视觉特征向量集进行融合处理,得到融合后特征向量集;将融合后特征向量集输入至预测层,得到文本信息。该实施方式可以提高复杂场景下的文本识别准确率,以及模型的通用性和鲁棒性。

    人体动作识别计数方法
    33.
    发明授权

    公开(公告)号:CN114360060B

    公开(公告)日:2024-04-09

    申请号:CN202111671031.6

    申请日:2021-12-31

    Abstract: 本发明公开了一种人体动作识别计数方法,包括以下步骤:将人体动作分解为冠状面和矢状面两个平面内的动作,采集人体平面内动作实时视频图像,将所述实时视频图像进行分帧和预处理后,输入人体关键骨骼点检测网络模型,输出每帧图像上的人体关键骨骼点检测结果;将得到的所述人体关键骨骼点检测结果输入预先配置的动作状态特征机,所述动作状态特征机按照所述人体关键骨骼点的置信度约束条件和特征点约束条件,确定用户是否完成对应动作。本发明采用一个通用模型匹配不同动作状态特征机,代码复用率高且计算量小,占用存储空间小,特征表达强,在保证计数准确的同时,具有更快的系统响应速度。

    待标注图像分割方法、装置、电子设备和计算机可读介质

    公开(公告)号:CN117636353A

    公开(公告)日:2024-03-01

    申请号:CN202311704761.0

    申请日:2023-12-11

    Abstract: 本公开的实施例公开了待标注图像分割方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取待标注图像;将待标注图像输入至预先训练好的物体标签预测模型,得到目标物体标签;将待标注图像与目标物体标签输入至预先训练好的视觉语义检索模型,得到相似度图,其中,相似度图表征待标注图像中各个带标注图像像素点与目标物体标签的各个相似度;将相似度图中满足预设条件的各个相似度像素点确定为初始采样像素点集;将待标注图像与初始采样像素点集输入至预先训练好的分割模型,以生成各个预测分割图像;对各个预测分割图像进行迭代修正处理,以生成对应待标注图像的分割图像。该实施方式提高了分割图像的分割准确率。

    预训练任务模型调整处理方法、装置、电子设备和介质

    公开(公告)号:CN117636100A

    公开(公告)日:2024-03-01

    申请号:CN202410101911.7

    申请日:2024-01-25

    Abstract: 本公开的实施例公开了预训练任务模型调整处理方法、装置、电子设备和介质。该方法的一具体实施方式包括:根据未标注图像集合,生成标注图像组集合;生成标注特征向量组集合;根据标注图像组集合,确定聚类类别信息;生成未标注特征向量集合;对未标注特征向量集合进行聚类处理;生成聚类中心信息集合;生成标注图像中心信息集合;根据聚类中心信息集合和标注图像中心信息集合,确定校准中心信息集合;根据校准中心信息集合,生成特征向量组集合;确定伪标签特征向量组集合;确定扩展标签图像组集合;对预训练任务模型进行调整处理。该实施方式可以减少计算机处理器资源的浪费,缩减所选择数据的类别分布与总体样本的类别分布偏差。

    场景自适应的条纹结构光解码方法、装置、设备和介质

    公开(公告)号:CN117333560B

    公开(公告)日:2024-02-20

    申请号:CN202311631211.0

    申请日:2023-12-01

    Abstract: 本公开的实施例公开了场景自适应的条纹结构光解码方法、装置、设备和介质。该方法的一具体实施方式包括:获取对应目标物体的全局照明图像和反射图像序列;对反射图像序列进行分类,得到第一反射图像子序列、第二反射图像子序列和第三反射图像子序列;根据全局照明图像、第一反射图像子序列和第二反射图像子序列,生成各个归一化像素值组;确定各个条纹宽度信息组;对各个归一化像素值组进行亚像素定位,以确定各个亚像素位置信息;对第三反射图像子序列中的各个第三反射图像进行解码,以生成各个解码信息;生成对应目标物体的各个点云信息。该实施方式可以提高条纹亚像素定位的精度,从而可以提高所获取的点云信息准确率且减少点云信息的缺失。

    全色-多光谱图像建筑物检测方法和注意力特征融合网络

    公开(公告)号:CN117011206A

    公开(公告)日:2023-11-07

    申请号:CN202310904450.2

    申请日:2023-07-21

    Abstract: 本发明涉及一种全色‑多光谱图像建筑物检测方法和注意力特征融合网络,属于图像处理技术领域,解决了现有技术中特征融合方法检测性能不佳、对卫星图像的利用效率较低和检测精度较低的问题。本发明的注意力特征融合网络采用了启发式注意力特征融合模块,采用了双流的结构,能够处理全色‑多光谱图像对;利用多个基于注意力的特征融合模块,能够更有效地进行特征融合,从而获得更高的检测性能;能够直接对全色图像和多光谱图像进行特征提取,能够更有效地利用全色图像和多光谱图像的信息,对卫星图像的利用效率高;检测精度高。

    物料表面毛球点云采集装置和物料表面毛球数据采集方法

    公开(公告)号:CN116577350A

    公开(公告)日:2023-08-11

    申请号:CN202310856924.0

    申请日:2023-07-13

    Abstract: 本公开的实施例公开了物料表面毛球点云采集装置和物料表面毛球数据采集方法。该方法的一具体实施方式包括:响应于确定目标物料与3D相机之间的距离不满足预设距离条件,控制竖直位移组件移动,以使目标物料与3D相机的距离满足预设距离条件;根据预设扫描路径,控制水平位移组件移动,以及控制点云采集组件采集目标物料的各个表面毛球子数据;响应于检测到水平位移组件按照预设扫描路径完成位移,控制水平位移组件停止移动;根据预设扫描路径,拼接点云采集组件采集到的目标物料的各个表面毛球子数据,得到目标物料的表面毛球数据。该实施方式提升了物料起毛起球质量等级检测的准确率。

    一种基于位置分布的大规模场景目标感知方法

    公开(公告)号:CN115661620A

    公开(公告)日:2023-01-31

    申请号:CN202211118645.6

    申请日:2022-09-14

    Abstract: 一种基于位置分布的大规模场景目标感知方法,包括步骤:将给定的大规模场景输入到主干网络中进行特征提取;将经过主干网络中进行特征提取后的场景数据输入至多重卷积层进行处理;基于多重卷积层进行处理后的数据,计算输出预测的定位图,目标偏移和目标边界框的宽和高;基于定位图,设置局部放缩模块LSM自适应的搜索定位图图像中的聚集区域,并对其进行适量的放缩以适合检测器的容量;修改原始数据的一部分损失函数,使得能够更容易的进行训练,该方法可以实现对密集小目标的检测,并且能够缓解目标分布不均匀的问题。

Patent Agency Ranking