图片中仪表角度校正变换函数获取方法及装置、角度校正方法及装置、读数方法及装置

    公开(公告)号:CN116092089A

    公开(公告)日:2023-05-09

    申请号:CN202211391022.6

    申请日:2022-11-07

    Abstract: 图片中仪表角度校正变换函数获取方法及装置、角度校正方法及装置、读数方法及装置,涉及计算机视觉领域。针对现有技术中存在的,在仪表内容识别阶段时,需要借助外部系统对仪表数字进行识别,造成效率的低下,另外一些方法设计了统一的流程对上述问题进行解决,在低质量图像上的识别率较低的问题,本发明提供的技术方案为:图片中仪表角度校正变换函数获取方法,方法包括:采集图片中仪表内轮廓标注;根据标注确认仪表内轮廓并将内轮廓所在的椭圆圆周上的四个顶点作为变换前基准点;拉长椭圆短轴,使椭圆变换,与椭圆的最小外接圆重合;根据变换过程得到变换矩阵;根据变换矩阵得到变换函数。适合应用于仪表读数识别工作。

    基于深度无关数据集的图像去雾方法、计算机设备、介质和电子设备

    公开(公告)号:CN117635481A

    公开(公告)日:2024-03-01

    申请号:CN202311399539.4

    申请日:2023-10-26

    Abstract: 基于深度无关数据集的图像去雾方法、计算机设备、介质和电子设备,属于图像处理技术领域,解决图像去雾处理能力低且无法同时保证去雾效果和计算速度问题。本发明的方法包括:在数据集方面,解耦雾的浓度和场景深度之间的关系,从而生成一个与深度无关的数据集,将雾的浓度和场景深度关系解耦,使图像中雾的浓度与场景完全无关,来引导模型学习雾的浓度来恢复图像;提出了一种全新的卷积跳跃连接,通过为相加的特征融合方法引入一个单独的卷积层,对编码器特征进行卷积,并将卷积后的结果于解码器的特征相加,来提高相加特征融合方法的特征表示能力,进而在几乎不增加计算复杂度的同时提高模型的去雾表现。本发明适用于图像去雾。

    一种学习实例内部语义增强的场景文字检测器和方法

    公开(公告)号:CN117576672A

    公开(公告)日:2024-02-20

    申请号:CN202311461019.1

    申请日:2023-11-06

    Abstract: 一种学习实例内部语义增强的场景文字检测器和方法,属于场景文本识别技术领域,解决未考虑语义关系以及未考虑边框和中心的一致性而导致检测不准确问题。本发明的检测器包括:文本领域注意力机制TAM和边界融合模块BAG;所述文本领域注意力机制使用连通域分析的方法得到独立的文本区域,使用RoIAlign操作提取RoI特征,然后通过线性层压缩并投影为Troi∈RN×C,其中N是RoI的数量,是C通道数;将Troi和类别令牌Tcls连接起来,添加位置嵌入以形成原始ViT编码器的输入标记;所述边界融合模块根据所述文本领域注意力机制输出的特征图生成高维嵌入的卷积层。本发明适用于自动驾驶、场景文本翻译和场景理解。

    一种融合视频画面和场景文本信息的跨模态视频正能量评价方法、系统及计算机存储介质

    公开(公告)号:CN117036885A

    公开(公告)日:2023-11-10

    申请号:CN202311018030.0

    申请日:2023-08-14

    Abstract: 一种融合视频画面和场景文本信息的跨模态视频正能量评价方法、系统及计算机存储介质,涉及视频敏感内容分析领域。解决现有基于回归的方法仅考虑了视频中的视觉特征,而忽略了视频中的场景文字信息的问题。本发明提供以下方案,获取视频片段,使用预先训练好的R3D模型对视频片段进行特征选取,得到多个特征向量;对获得的多个特征向量进行全局平均池化操作,并通过全连接获得视频画面特征;提取视频画面特征中的场景文本特征,即删除重复的场景文本特征或句子;文本编辑器用于提取场景文本特征,同时对BERT组件输出的标记嵌入进行均值池化操作,以获得每个句子的特征向量;将获得的视频画面特征和获得的场景文本特征同时输入特征融合模块中,分别使用视觉编码器和场景文本编码器并聚合跨模态融合令牌对两种模态信息进行联合编码;将特征融合模块的输出作为MLP模块的输入,通过MLP模快的处理获得视频的正能量分数。还适用于视频画面信息与场景文本信息提取领域。

Patent Agency Ranking