一种弱光环境下的人脸表情捕捉方法及装置

    公开(公告)号:CN114519883B

    公开(公告)日:2025-02-18

    申请号:CN202210142311.6

    申请日:2022-02-16

    Applicant: 复旦大学

    Inventor: 张峰 赵瑞玮 冯瑞

    Abstract: 本发明提供一种弱光环境下的人脸表情捕捉方法及装置,能够在复杂环境的视频流中对不同的尺度的座位实现精确框定,并基于此框定结果检测提取脸部特征用于识别表情。其特征在于,包括以下步骤:步骤S1,获取待测影院内的俯视角度的视频流;步骤S2,基于影院座椅定位模型对视频流进行检测,得到待测影院内所有座椅最新位置的标注框;步骤S3,使用表情识别分类模型对所有标注框进行人脸定位和表情识别,从而得到待测影院内的观众的人脸表情类别。其中,影院座椅定位模型以ResNet50和FPN结合的网络作为Backbone,并加入CBAM模块以构建影院座椅定位初始网络并对该初始网络进行训练得到,表情识别分类模型基于构建并训练改进VGGNet和改进Focal Loss结合的人脸表情识别算法得到。

    一种弱光环境下的人脸表情捕捉方法及装置

    公开(公告)号:CN114519883A

    公开(公告)日:2022-05-20

    申请号:CN202210142311.6

    申请日:2022-02-16

    Applicant: 复旦大学

    Inventor: 张峰 赵瑞玮 冯瑞

    Abstract: 本发明提供一种弱光环境下的人脸表情捕捉方法及装置,能够在复杂环境的视频流中对不同的尺度的座位实现精确框定,并基于此框定结果检测提取脸部特征用于识别表情。其特征在于,包括以下步骤:步骤S1,获取待测影院内的俯视角度的视频流;步骤S2,基于影院座椅定位模型对视频流进行检测,得到待测影院内所有座椅最新位置的标注框;步骤S3,使用表情识别分类模型对所有标注框进行人脸定位和表情识别,从而得到待测影院内的观众的人脸表情类别。其中,影院座椅定位模型以ResNet50和FPN结合的网络作为Backbone,并加入CBAM模块以构建影院座椅定位初始网络并对该初始网络进行训练得到,表情识别分类模型基于构建并训练改进VGGNet和改进Focal Loss结合的人脸表情识别算法得到。

    一种医学影像数据的图像分割方法

    公开(公告)号:CN113205521A

    公开(公告)日:2021-08-03

    申请号:CN202110441410.X

    申请日:2021-04-23

    Inventor: 杨格 赵瑞玮 冯瑞

    Abstract: 本发明提供了一种医学影像数据的图像分割方法,用于针对存在领域偏移的第一医学影像数据与第二医学影像数据进行图像分割,其特征在于,包括如下步骤:利用第一医学影像数据对U‑Net神经网络进行训练,从而得到训练好的U‑Net分割模型;基于第一医学影像数据以及第二医学影像数据训练生成式对抗神经网络,从而得到训练好的GAN模型;将第二医学影像数据输入GAN模型,该GAN模型中的生成器将第二医学影像数据转化为图像风格与第一医学影像数据类似的修正医学影像数据;利用U‑Net分割模型对修正医学影像数据进行图像分割,从而得到与第二医学影像数据对应的分割结果。本发明的医学影像数据的图像分割方法,能够对来自不同设备或研究机构的医学影像数据进行图像分割。

    基于姿态追踪的行人异常行为识别方法及装置

    公开(公告)号:CN118968622A

    公开(公告)日:2024-11-15

    申请号:CN202411042568.X

    申请日:2024-07-31

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于姿态追踪的行人异常行为识别方法及装置,具有这样的特征,行人异常行为识别模型包括:特征提取模块,用于对每个预处理图像,从该预处理图像中提取三个层级的特征;特征融合模块,用于将三个层级的特征进行融合,得到三个融合特征;行人姿态追踪模块,用于根据三个融合特征得到行人姿态估计数据;异常姿态分类模块,用于根据所有连续帧对应的行人姿态估计数据中各个行人的姿态估计图,得到对应的行人的行人异常行为识别结果。总之,本方法具有较好的泛化性和行人异常行为识别精确度。

    一种基于Unet和Transformer相融合的脑部胶质瘤分割方法与系统

    公开(公告)号:CN114494296A

    公开(公告)日:2022-05-13

    申请号:CN202210102371.5

    申请日:2022-01-27

    Applicant: 复旦大学

    Abstract: 本发明公开了一种基于Unet和Transformer相融合的脑部胶质瘤分割方法,具有这样的特征,包括以下步骤:步骤1,对待测图像进行预处理获得预处理图像;步骤2,将预处理图像输入到基于U‑Net和Transformer的脑部胶质瘤分割模型中得到整个肿瘤区域、肿瘤增强区域以及肿瘤核心区域。其中,步骤1中,待测图像为多张脑部胶质瘤图像。步骤2中,基于U‑Net和Transformer的脑部胶质瘤分割模型为通过如下训练步骤获得:步骤2‑1,将预处理图像的展平成一系列2D的片序列并进行位置编码;步骤2‑2,将预处理图像作为训练集分别输入到卷积神经网络、Transformer网络以及U‑Net网络中;步骤2‑3,采用随机梯度下降法,基于最小化损失函数训练网络结构,得到训练后的基于U‑Net和Transformer的脑部胶质瘤分割模型。

    基于图像对齐与检测网络模型的轨道塞钉故障检测方法与系统

    公开(公告)号:CN107292870B

    公开(公告)日:2020-11-20

    申请号:CN201710424243.1

    申请日:2017-06-07

    Applicant: 复旦大学

    Abstract: 本发明属于计算机故障检测技术领域,具体为一种基于图像对齐与检测网络模型的轨道塞钉故障检测方法与系统。本发明中,由铁轨巡检车记录正常的塞钉图像作为基准图像;工作人员在例行的铁轨巡检过程中,利用巡检车拍摄最新的铁轨状况,得到铁轨状况图像作为待检测图像,对当前待检测图像和基准图像进行对比分析处理,检测出铁轨中问题塞钉部件位置,从而进行及时更换问题塞钉,确保铁轨运行的安全;具体步骤包括:基于深度网络模型与显著区域的高铁轨道图像精确对齐,基于深度网络模型与环境变化补偿的轨道塞钉的故障检测。本发明基于深度网络模型进行图像对齐与环境变化补偿,具有更精确的识别性能与可靠性。

    基于图像对齐与检测网络模型的轨道塞钉故障检测方法与系统

    公开(公告)号:CN107292870A

    公开(公告)日:2017-10-24

    申请号:CN201710424243.1

    申请日:2017-06-07

    Applicant: 复旦大学

    Abstract: 本发明属于计算机故障检测技术领域,具体为一种基于图像对齐与检测网络模型的轨道塞钉故障检测方法与系统。本发明中,由铁轨巡检车记录正常的塞钉图像作为基准图像;工作人员在例行的铁轨巡检过程中,利用巡检车拍摄最新的铁轨状况,得到铁轨状况图像作为待检测图像,对当前待检测图像和基准图像进行对比分析处理,检测出铁轨中问题塞钉部件位置,从而进行及时更换问题塞钉,确保铁轨运行的安全;具体步骤包括:基于深度网络模型与显著区域的高铁轨道图像精确对齐,基于深度网络模型与环境变化补偿的轨道塞钉的故障检测。本发明基于深度网络模型进行图像对齐与环境变化补偿,具有更精确的识别性能与可靠性。

    基于通道注意力机制的行人检测方法及装置

    公开(公告)号:CN118942119A

    公开(公告)日:2024-11-12

    申请号:CN202411042570.7

    申请日:2024-07-31

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于通道注意力机制的行人检测方法及装置,具有这样的特征,包括以下步骤:步骤S1,对视频序列进行预处理,得到预处理图像;步骤S2,将预处理图像输入行人检测模型,得到行人外观特征向量;步骤S3,对行人外观特征向量进行计算,得到行人检测结果,行人检测模型包括:特征提取模块,用于对预处理图像进行深度特征提取,得到特征图;通道注意力模块,用于通过通道注意力机制对特征图进行处理,得到预测注意力图;目标检测模块,用于对预测注意力图进行上采样和卷积处理,得到行人外观特征向量总之,本方法能够准确识别视频序列中的行人。

    基于双框匹配的监控图像密集行人检测方法及装置

    公开(公告)号:CN118942118A

    公开(公告)日:2024-11-12

    申请号:CN202411042566.0

    申请日:2024-07-31

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于双框匹配的监控图像密集行人检测方法及装置,具有这样的特征,密集行人检测模型包括:特征提取模块,用于对归一化图像进行特征提取,得到三个不同尺度的特征;特征融合模块,用于将三个不同尺度的特征进行特征融合和卷积处理,得到三个融合特征;双分支检测头模块,用于对三个融合特征进行处理,在归一化图像的每个网格内生成两个行人检测框及对应的概率值;预测框提纯模块,用于对各个行人检测框进行位置修正,得到对应的修正行人检测框,行人检测结果为概率值大于预设的阈值的所有修正行人检测框。总之,本方法能够高效准确地识别监控图像中的密集行人,并具有强泛化性。

Patent Agency Ranking