-
公开(公告)号:CN110288508B
公开(公告)日:2023-02-24
申请号:CN201910561585.7
申请日:2019-06-26
Applicant: 复旦大学
IPC: G06T1/20
Abstract: 本发明提供一种面向均匀分布的超高分辨率图像局部稀疏加速处理方法,用于进行局部采样的加速处理从而显著增加对超高分辨率图像的处理速度,其特征在于,包括如下步骤:步骤S1,通过对超高分辨率图像Fgl进行全局处理,得到全局适用的处理参数Wgl;步骤S2,将超高分辨率图像Fgl均匀切分为N份,对图像信息进行局部稀疏采样得到局部采样图Flo;步骤S3,将处理参数Wgl应用于局部采样图Flo,进行图像处理得到局部采样图Flo的局部处理结果Rlo;步骤S4,将局部处理结果Rlo与切分个数N进行协同推理,得到全局处理结果Rgl。
-
公开(公告)号:CN112989977B
公开(公告)日:2022-09-06
申请号:CN202110235810.5
申请日:2021-03-03
Applicant: 复旦大学
Abstract: 本发明提供了一种基于跨模态注意力机制的视听事件定位方法及装置,用于对目标音视频中的事件进行识别与定位,其特征在于,包括如下步骤:对目标音视频进行预处理得到图像特征以及音频特征;基于图像特征以及音频特征利用预先训练好的基于跨模态注意力机制的神经网络模型进行识别与定位,从而得出目标音视频中每一个时刻的事件类别。其中,神经网络模型包括跨模态注意力机制模块、单模态自注意力机制模块、循环神经网络模块以及分类模块。跨模态注意力机制模块用于获取视频模态与音频模态间的信息,并使用一个模态的信息处理另一模态的信息,实现模态间的信息交互。单模态自注意力机制模块以及循环神经网络模块用于捕捉模态内的长距离依赖关系。
-
公开(公告)号:CN114519844A
公开(公告)日:2022-05-20
申请号:CN202210133298.8
申请日:2022-02-09
Applicant: 复旦大学
Abstract: 本发明公开了一种基于视觉转化器的人群密度估计方法,具有这样的特征,包括:步骤1,对待测图像进行预处理获得预处理图像,然后搭建编码解码层;步骤2,搭建基于视觉转化器的神经网络模型;步骤3,把训练数据输入基于视觉转化器的神经网络模型进行模型训练,得到训练完成的基于视觉转化器机制神经网络模型;步骤4,将预处理图像输入训练完成的基于视觉转化器机制神经网络模型,分别得出各个预处理图像中的人群密度结果并进行输出,其中,基于视觉转化器的神经网络模型包括前端以卷积神经网络为基础的局部信息提取模块和后端以视觉转化器为基础的全局信息提取模块。本发明还公开基于视觉转化器的人群密度估计系统,包括预处理部和密度预测部。
-
公开(公告)号:CN114511818A
公开(公告)日:2022-05-17
申请号:CN202210093445.3
申请日:2022-01-26
Applicant: 复旦大学
Abstract: 本发明公开了一种基于多尺度注意力机制的人群密度估计方法,具有这样的特征,包括以下步骤:步骤1,对待测图像进行预处理获得预处理图像;步骤2,搭建基于多尺度注意力机制的卷积神经网络模型;步骤3,把包含多张训练图像的训练集输入基于多尺度注意力机制的卷积神经网络模型进行模型训练,得到训练完成的基于多尺度注意力机制的卷积神经网络模型;步骤4,将预处理图像输入训练完成的基于多尺度注意力机制的卷积神经网络模型,从而得出各个预处理图像中的人群密度结果并进行输出,其中,卷积神经网络模型包括密度图预测模块、局部计数图预测模块以及注意力图预测模块。本发明还公开了一种基于多尺度注意力机制的人群密度估计系统。
-
公开(公告)号:CN114494296A
公开(公告)日:2022-05-13
申请号:CN202210102371.5
申请日:2022-01-27
Applicant: 复旦大学
Abstract: 本发明公开了一种基于Unet和Transformer相融合的脑部胶质瘤分割方法,具有这样的特征,包括以下步骤:步骤1,对待测图像进行预处理获得预处理图像;步骤2,将预处理图像输入到基于U‑Net和Transformer的脑部胶质瘤分割模型中得到整个肿瘤区域、肿瘤增强区域以及肿瘤核心区域。其中,步骤1中,待测图像为多张脑部胶质瘤图像。步骤2中,基于U‑Net和Transformer的脑部胶质瘤分割模型为通过如下训练步骤获得:步骤2‑1,将预处理图像的展平成一系列2D的片序列并进行位置编码;步骤2‑2,将预处理图像作为训练集分别输入到卷积神经网络、Transformer网络以及U‑Net网络中;步骤2‑3,采用随机梯度下降法,基于最小化损失函数训练网络结构,得到训练后的基于U‑Net和Transformer的脑部胶质瘤分割模型。
-
公开(公告)号:CN114428914A
公开(公告)日:2022-05-03
申请号:CN202210102364.5
申请日:2022-01-27
Applicant: 复旦大学
IPC: G06F16/9536 , G06F16/35 , G06F16/335 , G06F16/33 , G06F40/284 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于图注意网络的灾难信息过滤方法,具有这样的特征,使用图注意网络理解帖子的单词和相应信息类型之间的相关性,过滤得到可执行的信息,包括以下步骤:步骤1,对数据集中的帖子进行预处理,得到预处理后的数据;步骤2,搭建信息过滤网络模型;步骤3,把预处理后的数据输入信息过滤网络模型中进行训练,得到训练完成的信息过滤网络模型;步骤4,将待分类的帖子输入训练完成的信息过滤网络模型,得到分类结果。其中,信息过滤网络包括BERT编码器、图注意网络以及关系网络。本发明还公开了一种基于图注意网络的灾难信息过滤系统,包括预处理部和信息过滤部。
-
公开(公告)号:CN114422828A
公开(公告)日:2022-04-29
申请号:CN202210093486.2
申请日:2022-01-26
Applicant: 复旦大学
IPC: H04N21/234 , H04N21/258 , H04N5/225 , H04N7/18
Abstract: 本发明公开了一种基于高清摄像头的实时定位和轨迹重构方法,具有这样的特征,包括以下步骤:步骤1,搭建摄像头系统并捕捉视频,根据摄像头系统的摄像头与道路之间的关系获得摄像头的信息;步骤2,将摄像头捕捉到的视频进行目标检测分析,若发现目标人员则向后台管理系统通信,后台管理系统记录下摄像头的位置信息和人员信息;步骤3,后台管理系统利用位置信息,并结合高德地图提供的JSapi进行实时展示;步骤4,对人员信息进行信息提取,找出某特定的人经过摄像头的顺序和时间,进而得出人员轨迹。
-
公开(公告)号:CN112818917B
公开(公告)日:2022-03-22
申请号:CN202110208326.3
申请日:2021-02-24
Applicant: 复旦大学
Abstract: 本发明提供了一种实时行人检测与重识别方法及装置,用于对多路行人视频流中的特定行人进行实时监测,其特征在于,包括如下步骤:利用目标检测模型对每路行人视频流进行人脸检测,得到行人人脸;利用相似度判别模型对行人人脸与特定行人人脸库人脸相似度计算得到人脸相似度值;当人脸相似度值大于特定人脸阈值时,该行人人脸为特定行人人脸;从行人视频流中裁剪出特定行人截图,并与对应的ID对应存储得到特定行人库;利用目标检测模型进行行人检测得到待识别行人,并裁剪出待识别行人截图;基于待识别行人截图以及特定行人库通过相似度判别模型计算得到行人相似度值;当行人相似度值大于预定的特定行人阈值时,该待识别行人为特定行人。
-
公开(公告)号:CN109995965B
公开(公告)日:2021-12-03
申请号:CN201910276412.0
申请日:2019-04-08
Applicant: 复旦大学
IPC: H04N5/14 , H04N7/20 , H04N21/845 , H04N17/00
Abstract: 本发明提供了一种基于FPGA的超高清视频图像实时校准方法,用于通过FPGA对超高清视频图像进行实时校准,其特征在于,包括如下步骤:步骤S1,建立原始图像数据接收通道,直接将超高清视频图像的原始图像数据输送至FPGA;步骤S2,对原始图像数据进行校准处理,得到结果校准数据;步骤S3,建立校准结果输出通道,将结果校准数据从FPGA返回,其中,步骤S2包括如下子步骤:步骤S2‑1,建立图像数据帧缓存区,并对原始图像数据进行预处理得到预处理图像数据;步骤S2‑2,通过图像校准算法对预处理图像数据进行处理并得到ΔX,ΔY,Δθ;步骤S2‑3,建立结果内存缓存区,将得到的ΔX,ΔY,Δθ进行整理,得到最终的校准结果数据。
-
公开(公告)号:CN111225280B
公开(公告)日:2021-10-01
申请号:CN202010074352.7
申请日:2020-01-22
Applicant: 复旦大学
IPC: H04N21/443 , H04N21/234 , H04N21/44 , H04N21/254
Abstract: 本发明提供一种基于嵌入式平台的轻量级视频分析系统,用于对流媒体数据进行轻量化处理从而获得视频分析结果并输出,其特征在于,包括:流媒体模块,用于获取流媒体数据并对该流媒体数据进行预处理得到预处理数据,流媒体数据至少包括视频流式数据;视频分析模块,用于持续接收预处理数据并根据预设的视频分析流程进行分析得到视频分析结果;数据持久化模块,用于对视频分析结果进行持久化处理并作为动态数据进行存储,其中,流媒体模块、视频分析模块以及数据持久化模块通过容器虚拟化技术部署在边缘节点上,使得流媒体模块、视频分析模块以及数据持久化模块利用边缘节点的计算资源完成视频分析处理。
-
-
-
-
-
-
-
-
-