-
公开(公告)号:CN110837803A
公开(公告)日:2020-02-25
申请号:CN201911079788.9
申请日:2019-11-07
Applicant: 复旦大学
Abstract: 本发明提供一种基于深度图网络的糖尿病视网膜病变分级方法,能够有效模拟眼科医生对糖尿病视网膜病变的实际诊断过程,对患者单只眼睛的多张图像进行患病特征的信息传递与整合,从而得到更加准确的诊断结果,其特征在于,包括如下步骤:步骤S1,对患者的双眼的多张待测眼底图像进行至少包括图像质量检测以及左右眼分类识别的预处理从而得到预处理眼底图像;步骤S2,分别根据与患者的单眼对应的多张预处理眼底图像构建逻辑图数据,该逻辑图数据包含一个由多张预处理眼底图像作为节点的全连接图;步骤S3,将逻辑图数据输入预先训练完成的糖尿病视网膜病变分级模型从而得到患者的糖尿病视网膜病变等级信息。
-
公开(公告)号:CN110910891A
公开(公告)日:2020-03-24
申请号:CN201911118136.1
申请日:2019-11-15
Applicant: 复旦大学
Abstract: 本发明提供一种基于长短时记忆神经网络的说话人分段标注方法及装置,其特征在于,采用基于长短时记忆深度神经网络的说话人识别样本标注模型从待测音频中检测出每个说话人语音出现和持续的时间,包括:步骤S1,对待测音频进行预处理获得音频帧级特征f1和音频帧级特征f2;步骤S2,搭建基于长短时记忆深度神经网络的说话人识别样本标注模型,该说话人样本标注模型包括说话人转换检测子模型以及说话人特征建模子模型;步骤S3,分别训练说话人转换检测子模型以及说话人特征建模子模型;步骤S4,将音频帧级特征f1以及音频帧级特征f2输入基于长短时记忆深度神经网络的说话人识别样本标注模型从而完成待测音频中各个说话人的说话时间段的分类记录。
-
公开(公告)号:CN110782872A
公开(公告)日:2020-02-11
申请号:CN201911093837.4
申请日:2019-11-11
Applicant: 复旦大学
Abstract: 本发明提供一种基于深度卷积循环神经网络的语种识别方法及装置,用于对待测音频序列进行识别从而识别出对应的语种,该方法不需要音频领域的专家知识即可实现高准确率的语种识别功能,其特征在于,包括如下步骤:步骤S1,将待测音频序列分成多个时间长度为2s的音频段;步骤S2,依次将各个音频段进行短时傅里叶变换转化为对应的频谱图;步骤S3,依次将频谱图输入预先训练的卷积循环神经网络模型从而获取对应每个音频段的音频类别判断概率;步骤S4,根据每个音频数据的相应所有音频段的音频类别判断概率得出各个对应音频数据的语种类别。
-
公开(公告)号:CN110659724A
公开(公告)日:2020-01-07
申请号:CN201910866933.1
申请日:2019-09-12
Applicant: 复旦大学
Abstract: 本发明提供一种基于目标尺度的目标检测深度卷积神经网络构建方法,用于在检测某一尺度范围的目标的应用场景下,能够灵活多变、针对不同尺度的目标实现良好适应性的深度卷积神经网,其特征在于,包括:步骤S1,分析图像样本数据集中的所有图像的目标对象,确定目标尺度下限;步骤S2,根据用于目标检测的深度卷积神经网络的主干网结构,得到单个目标对象最终所需的特征数据量,并分析主干网结构的下采样倍数以及最佳下采样倍数;步骤S3,通过深度模型重构方法重构深度卷积神经网络,保证单个目标对象在执行分类运算之前保留充分的特征数据量;步骤S4,使用图像样本数据集对深度卷积神经网络进行训练直至准确率达到要求。
-
公开(公告)号:CN110659653A
公开(公告)日:2020-01-07
申请号:CN201910865573.3
申请日:2019-09-12
Applicant: 复旦大学
Abstract: 目前深度卷积神经网络的主干网都起源于最初的图像分类网络,在应用于目标检测、语义分割、目标分割等领域时,传统骨干网不断抛弃特征信息的做法导致后期分析时信息量不足。为了解决上述问题,本发明提供了一种可充分保留图像特征的特征提取模型,用于对任意分辨率的输入图像进行无损的特征提取操作,其特征在于,包括:多个卷积操作层,由通道分离卷积和1×1卷积构成;多个池化操作层,该池化操作层中池化的步长为1,边界填充以0和1像素交替执行,其中,池化操作层的数量为偶数个。
-
公开(公告)号:CN107239735A
公开(公告)日:2017-10-10
申请号:CN201710270344.8
申请日:2017-04-24
Applicant: 复旦大学
IPC: G06K9/00
CPC classification number: G06K9/00718 , G06K9/00228 , G06K9/00335 , G06K9/00906
Abstract: 本发明属于数字图像处理、人工智能技术领域,具体为一种基于视频分析的活体检测方法和系统。主要应用在人脸识别领域中,用以排查照片人脸与视频人脸的攻击。本发明的活体检测方法包括如下步骤:采用摄像头获取视频流;进行系统环境背景更新;提取人脸环境图像与系统背景图像;对比背景图像差异性;进行人眼定位;判断人眼的张合状态;所述分析张合状态序列,判断是否有眨眼动作。本发明使用基于视频分析的活体检测技术,相比于指纹、虹膜识别技术,成本较低,而且眨眼检测与背景分析法中,不需要待测用户的交互动作,用户体验友好。检测算法中的感知Hash、区域增长等算法对光照要求低,光照敏感度不高,鲁棒性高,对于照片攻击与视频攻击能够起到有效的检测作用。
-
公开(公告)号:CN110619387B
公开(公告)日:2023-06-20
申请号:CN201910865549.X
申请日:2019-09-12
Applicant: 复旦大学
IPC: G06N3/0464 , G06F18/213
Abstract: 本发明提供一种基于卷积神经网络的通道扩展方法,用于替换卷积神经网络中通用的卷积扩展通道和池化操作,从而保证有效数据不损失的情况下减少卷积神经网络在中间运算的冗余数据,其特征在于,包括如下步骤:步骤S1,根据在卷积池化前后特征图的分辨率变化率计算特征图数据的分辨率及通道数;步骤S2,将4个维度的特征图数据中对应高和宽的通道进行维度拆分,形成6个维度;步骤S3,将拆分后的特征图数据进行维度调转:第3、5维度调换为第5、6维度;步骤S4,将调换后的特征图数据中第2、3、4维度进行维度合并,重新整合为4个维度。
-
公开(公告)号:CN112330645A
公开(公告)日:2021-02-05
申请号:CN202011253926.3
申请日:2020-11-11
Applicant: 复旦大学
IPC: G06T7/00
Abstract: 本发明提供了一种基于注意力机制的胶质瘤分级方法以及装置,用于对胶质瘤患者的待分级核磁共振影像进行分析得到胶质瘤分级结果从而为医师提供参考依据,其特征在于,包括如下步骤:步骤S1,获取待训练核磁共振影像并进行预处理;步骤S2,构建基于ResNet的分类网络并输入预处理数据;步骤S3,获取注意力图并与特征图进行像素相乘;步骤S4,建立由输出分类与真实分类构成的损失函数;步骤S5,更新分类网络直到达到收敛条件得到收敛的分类网络作为输出模型;步骤S6,将待分级核磁共振影像输入输出模型得到胶质瘤分级结果。其中,分类网络包括由3×3×1二维卷积核以及1×1×3二维卷积核组成的伪三维卷积核、激活层以及归一化层。
-
公开(公告)号:CN110866487A
公开(公告)日:2020-03-06
申请号:CN201911102007.3
申请日:2019-11-12
Applicant: 复旦大学
Abstract: 本发明提供一种大规模行人检测与重识别样本集构建方法,用于对需要标注的原始视频进行预识别,并在识别后让用户根据预识别目标对原始视频完成人工标注从而形成符合标注规范的样本集,其特征在于,包括如下步骤:步骤S1,对原始视频进行预处理从而得到预处理视频帧;步骤S2,搭建一个基于特征融合的特征提取网络以及一个目标检测网络;步骤S3,使用行人检测数据集训练特征提取网络,并使用训练时特征提取网络提取出的特征图训练目标检测网络;步骤S4,将预处理视频帧输入特征提取网络以及目标检测网络从而得到预识别目标;步骤S5,将预处理视频帧以及相应的预识别目标传输给预设的标注工具中让用户进行人为标注。
-
公开(公告)号:CN110826470A
公开(公告)日:2020-02-21
申请号:CN201911060368.6
申请日:2019-11-01
Applicant: 复旦大学
IPC: G06K9/00
Abstract: 本发明提供一种基于深度主动学习的眼底图像左右眼识别方法,能够针对主视野眼底图像以及识别难度相对较大的非主视野眼底图像完成精确的左右眼识别,其特征在于,包括如下步骤:步骤S1,对待测图像进行预处理;步骤S2,将预处理后的图像输入眼底图像左右眼识别模型从而得到待测图像的左右眼分类结果,眼底图像左右眼识别模型通过如下方法训练:步骤T1,构建初始眼底图像识别模型;步骤T2,将训练集输入初始眼底图像识别模型训练得到主视野眼底图像识别模型;步骤T3,利用主视野眼底图像识别模型从多张眼底图像中选出非主视野眼底图像作为难样本;步骤T4,将难样本作为增加的训练集对主视野眼底图像识别模型进行训练得到眼底图像左右眼识别模型。
-
-
-
-
-
-
-
-
-