-
公开(公告)号:CN118942118A
公开(公告)日:2024-11-12
申请号:CN202411042566.0
申请日:2024-07-31
Applicant: 复旦大学
Abstract: 本发明提供了一种基于双框匹配的监控图像密集行人检测方法及装置,具有这样的特征,密集行人检测模型包括:特征提取模块,用于对归一化图像进行特征提取,得到三个不同尺度的特征;特征融合模块,用于将三个不同尺度的特征进行特征融合和卷积处理,得到三个融合特征;双分支检测头模块,用于对三个融合特征进行处理,在归一化图像的每个网格内生成两个行人检测框及对应的概率值;预测框提纯模块,用于对各个行人检测框进行位置修正,得到对应的修正行人检测框,行人检测结果为概率值大于预设的阈值的所有修正行人检测框。总之,本方法能够高效准确地识别监控图像中的密集行人,并具有强泛化性。
-
公开(公告)号:CN118711225A
公开(公告)日:2024-09-27
申请号:CN202410735945.1
申请日:2024-06-07
Applicant: 复旦大学
IPC: G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种基于变分自编码器的因果解耦表征学习方法,具有这样的特征,包括:将输入图像输入因果解耦表征模型,得到重建图像,因果解耦表征模型包括:编码模块,包括编码器,用于对输入图像进行编码,得到包含独立表征∈s和其他信息∈r的外生变量∈;反事实干预模块,包括因果效应矩阵,用于将独立表征∈s转换为线性因果表征zl;非线性因果模块,包括神经网络f,用于将线性因果表征zl转换为非线性因果表征zs;解码模块,包括解码器,用于对包含非线性因果表征zs和其他信息∈r的潜在表征z进行解码,得到重建图像。总之,本方法能够对偏置进行有效处理,实现准确的因果解耦。
-
公开(公告)号:CN116823777A
公开(公告)日:2023-09-29
申请号:CN202310794993.3
申请日:2023-06-30
Applicant: 复旦大学
IPC: G06T7/00 , G06T5/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本发明提供了一种基于形变校正一致性的颅脑磁共振影像模态转换方法,具有这样的特征,包括以下步骤:步骤S1,对源模态影像进行预处理操作,得到预处理源模态影像;步骤S2,构建生成对抗网络,再根据现有的多张以加权方式A成像的颅脑磁共振影像和对应的以加权方式B成像的颅脑磁共振影像构建训练集对生成对抗网络进行训练,再根据训练好的生成对抗网络构建模态转换模型;步骤S3,将预处理源模态影像输入模态转换模型,得到目标模态影像。总之,本方法能够生成具有更高精度的模态转换影像。
-
公开(公告)号:CN110991444B
公开(公告)日:2023-08-29
申请号:CN201911133792.9
申请日:2019-11-19
Applicant: 复旦大学
IPC: G06V20/62 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种面向复杂场景的车牌识别方法,用于对复杂场景下的待测图像进行车牌识别从而识别出车牌的字符识别结果,其特征在于,包括:步骤S1,对待测图像进行预处理得到预处理图像集;步骤S2,搭建YOLOv3车牌检测模型;步骤S3,训练车牌检测训练集对YOLOv3车牌检测模型;步骤S4,搭建端到端的车牌识别卷积神经模型;步骤S5,训练端到端的车牌识别卷积神经模型;步骤S6,将预处理图像集输入训练完成的YOLOv3目标检测模型进行车牌目标检测从而得到车牌位置;步骤S7,依次根据车牌位置对相应的待测图像进行处理从而得到车牌图像集;步骤S8,将车牌图像集输入训练完成的端到端的车牌识别卷积神经模型得到车牌的字符识别结果。
-
公开(公告)号:CN115470989A
公开(公告)日:2022-12-13
申请号:CN202211118219.2
申请日:2022-09-14
Applicant: 复旦大学附属儿科医院
Abstract: 本发明公开了基于机器学习的预测早产儿支气管肺发育不良风险的方法,包括步骤一:选择相关历史病历及数据,通过数据集成、结构化、预处理等进行数据处理;步骤二:在医学逻辑监督下提取医学变量;步骤三:通过机器学习的方法训练出效果最佳的多因素预测模型;步骤四:独立验证集中验证、检定模型的性能及阈值;步骤五:与临床辅助决策系统结合,在相应的应用场景中使用模型,传递给用户。本发明利用医院电子病历信息库,结合机器学习的方法,建立BPD风险预测模型,在院内数据部署软件后,对来院住院的患儿进行实时运算,对早产儿人群中BPD患儿进行提示,供医生进一步进行评估及早期干预,延缓病情进展,改善患者预后。
-
公开(公告)号:CN112989952B
公开(公告)日:2022-10-18
申请号:CN202110191225.X
申请日:2021-02-20
Applicant: 复旦大学
Abstract: 本发明提供了一种基于遮罩引导的人群密度估计方法,属于深度学习领域,其特征在于,包括如下步骤:步骤S1,对待测图像进行预处理获得预处理图像;步骤S2,搭建基于遮罩引导机制卷积神经网络模型;步骤S3,将包含多张训练图像的训练集输入步骤S2搭建的卷积神经网络模型,对该卷积神经网络模型进行训练得到训练完成的卷积神经网络模型;步骤S4,将预处理图像输入步骤S3训练完成的卷积神经网络模型,得到各个预处理图像中的人群密度结果并进行输出,其中,卷积神经网络模型包括遮罩引导模块以及分块预测模块,遮罩引导模块将预处理图像根据人群密度的稠密程度进行分层,再将多个图层分别对应输入分块预测模块中的多个与稠密程度相对应的预测网络层。
-
公开(公告)号:CN113269230B
公开(公告)日:2022-09-06
申请号:CN202110440925.8
申请日:2021-04-23
IPC: G06V10/764 , G06V10/80 , G06V10/30 , G06V10/82 , G06V10/62 , G06N3/04 , G06N3/08 , G06T7/11 , G06T7/136 , G16H30/20
Abstract: 本发明提供了一种基于时序高维特征提取的多肺炎CT分类方法及装置,用于针对疑似患者CT影像进行分类,从而得到分类结果,其特征在于,对疑似患者CT影像进行预处理得到预处理影像,并利用肺炎分类模型对进行推断得到分类结果。其中,肺炎分类模型包括一阶段单张切片特征提取网络以及二阶段跨切片特征提取网络,一阶段单张切片特征提取网络对预处理影像进行特征提取,得到预处理影像中每张切片对应的特征图作为单张切片特征图,二阶段跨切片特征提取网络先从所有单张切片特征图中提取得到时序上下文融合特征,然后进行感受野增强,从而得到跨切片特征图,最后基于该跨切片特征图进行推断得到CAM激活图结果以及分类概率预测值。
-
公开(公告)号:CN112863538B
公开(公告)日:2022-06-14
申请号:CN202110208096.0
申请日:2021-02-24
Applicant: 复旦大学
IPC: G10L21/0272 , G10L21/0208 , G10L25/57 , G10L25/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于视听网络的多模态语音分离方法及装置,用于从待分离音视频中分离出画面中说话人的语音,其特征在于,包括如下步骤:利用第一预处理方法对第一音视频训练数据处理得到第一预处理数据;构建多模态网络模型;将第一预处理数据输入多模态网络模型训练,得到音视频对齐判断模型;利用第二预处理方法对第二音视频训练数据处理得到第二预处理数据;搭建Wave‑U‑Net分割模型,并与音视频对齐判断模型构成视听模型;将第二预处理数据输入视听模型训练,得到视音频分割模型;将待分离音视频输入视音频分割模型得到画面中说话人的语音。其中,将第二预处理数据中的各个子集按照说话人个数由小到大的顺序逐步输入视听模型进行训练。
-
公开(公告)号:CN110852383B
公开(公告)日:2022-06-14
申请号:CN201911100964.2
申请日:2019-11-12
Applicant: 复旦大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于注意力机制深度学习网络的目标检测方法,其特征在于,通过含有注意力机制模块的目标检测模型对待检测图像进行特征图提取并从中检测出目标的位置和类别,注意力机制模块包括:至少一个注意力模块M1,用于根据特征图生成相同大小注意力权重矩阵并作用于该特征图;至少一个注意力感受野模块M2,用于对特征图进行特征提取;以及至少一个注意力特征融合模块M3,用于对网络不同层次的特征进行融合。该目标检测方法在具有高检测准确率的基础上还保证了高检测速度,同时模型的结构简洁且计算量小。
-
公开(公告)号:CN110852267B
公开(公告)日:2022-06-14
申请号:CN201911095764.2
申请日:2019-11-11
Applicant: 复旦大学
Abstract: 本发明的目的在于提供一种能够减小图像模糊带来的不良影响、减小人群群体特征干扰信息的人群密度估计方案,具体提供了一种基于光流融合型深度神经网络的人群密度估计方法及装置。其中,光流融合型深度神经网络模型包括空洞卷积子网络以及注意力子网络,空洞卷积子网络以及注意力子网络各含有多个卷积层,位于空洞卷积子网络中的多个卷积层以及位于注意力子网络中的至少一个卷积层相互配合形成不同的融合模块,模型中包含多个与融合模块分别对应的连接层,用于将各个融合模块中的注意力子网络数据流经归一化后矩阵加权到空洞卷积子网络数据流后得到的特征空间。
-
-
-
-
-
-
-
-
-