-
公开(公告)号:CN116630881A
公开(公告)日:2023-08-22
申请号:CN202310512640.X
申请日:2023-05-09
Applicant: 南昌大学
IPC: G06V20/52 , G10L25/03 , G10L21/0208 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多方位音频辅助的人群计数方法,所述计数方法包括以下步骤:VCC模块结合多种尺寸卷积核的空洞卷积,从图像中提取人群特征;通过自适应将多级上下文信息编码到VCC模块产生的特征中,提取视觉特征;ACC模块对原始的多段多方向音频进行初步融合和特征提取;将VCC模块的多通道视觉特征和ACC模块的多方向音频特征融合,再进行单个卷积操作生成密度图。本发明提出的框架,解决了透视问题、低照度场景以及不同位置对音频特征提取的影响,同时这是人群计数领域第一次尝试使用多段多方向音频辅助人群计数。
-
公开(公告)号:CN116189087A
公开(公告)日:2023-05-30
申请号:CN202310117231.X
申请日:2023-02-15
Applicant: 南昌大学
IPC: G06V20/52 , G06V10/82 , G06N3/08 , G06T7/00 , G06N3/0464
Abstract: 本发明公开了一种基于视角自适应的复杂场景下人群计数方法,所述计数方法包括以下步骤:NOOMP框架通过少样本学习方法拟合自然世界;NOOMP框架通过元学习训练使视角适应多头并行网络作为NOOMP框架的主干;视角适应多头并行网络用于估计人群的密度图;视角适应多头并行网络在多个不同的场景中进行训练,并将子损失进行汇总。本发明提出一种新的标记方法,绝对几何高斯生成方法,该方法只需对图像中的每个人增加一个点,便能获得较好的精度。
-
公开(公告)号:CN117058379A
公开(公告)日:2023-11-14
申请号:CN202311021945.7
申请日:2023-08-15
Applicant: 南昌大学
Abstract: 本发明公开了基于新型神经辐射场卷积的大规模点云语义分割方法,涉及语义分割技术领域,所述分割方法包括以下步骤:将点云场景表示为#imgabs0#其中N是输入点云的数量,3表示点的X,Y,Z坐标,D表示输入特征的维度;初始特征包含颜色信息;质心使用半径法或KNN算法过滤质心K邻域,以确定质心局部邻域;质心每个相邻点携带坐标和语义特征信息fij。本发明提出了一种新的局部点云表示方法,称为神经辐射场七维,其中首创的局部点云和方向角满足绕XYZ轴的旋转而不变形,并且可以更接近点云数据来学习点云旋转变形。
-
公开(公告)号:CN119206612A
公开(公告)日:2024-12-27
申请号:CN202411263405.4
申请日:2024-09-10
Applicant: 南昌大学
IPC: G06V20/52 , G06V10/766 , G06V10/82 , G06T7/73 , G06N3/0895 , G06V40/10
Abstract: 本发明公开了一种基于交叉型窗口自注意力机制的弱监督人群计数方法,包括:1)采用交叉型窗口自注意力机制对目标图片进行特征提取;2)引入基于全局平均池化和回归Token的CSWinCrowd结构;3)设计基于可学习位置编码模块的CSWinCrowd‑Token方案;4)结合步骤S1‑S3,提出一种基于CSWinTransformer的人群计数模型,用于目标图片的人群计数。本发明方法能够较好地捕捉序列中不同位置之间的依赖关系,解决了当前Transformer模型在人群密度变化较大时,计数效果不佳的问题。
-
公开(公告)号:CN115909377A
公开(公告)日:2023-04-04
申请号:CN202211392147.0
申请日:2022-11-08
Applicant: 南昌大学
IPC: G06V30/41 , G06V30/14 , G06V30/148 , G06V30/162 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于轻量化空洞网络的高效率文档版面分析方法,包括两个阶段:分割阶段和分类阶段;步骤A:在分割阶段,通过Otsu算法和RLSA将一个文档页面分割成多个内容块;步骤B:在分类阶段,提出一种轻量级扩张网络LD‑Net,LD‑Net将所有区块分类为图像、表格、文本和公式;每个单独的块及其分类标签在OCR系统的下一个过程中被处理。本发明提出了一种用LD‑Net进行布局分析的内存效率方法,当在低内存设备上使用时,它在精度和内存占用方面优于现有方法;LD‑Net是根据深度可分离卷积和剩余连接设计的,这两种结构使得网络高效且轻巧;扩张卷积在LD‑Net中被采用,它可以节省空间信息,这对提高所提方法的准确性很重要。
-
-
-
-