-
公开(公告)号:CN101923855A
公开(公告)日:2010-12-22
申请号:CN200910053201.7
申请日:2009-06-17
Applicant: 复旦大学
Abstract: 本发明属语音信号处理领域,涉及一种文本无关的声纹识别方法和系统,首先使用语音采集设备采集用户客人语音信号作为系统的输入,并为该客人的声音特征建立一种较精确的声学模型,模型将被存储在语音特征库中;当待识别人进行声纹识别时,系统将使用采集到的语音信号作为输入,在语音特征库中进行声学模型的匹配计算,最终将与之最为匹配的模型编号返回,以此来确定说话人的具体身份。其文本无关和语言无关性,具有良好的易用性和推广价值;且识别效率高,结果准确。
-
公开(公告)号:CN101783100A
公开(公告)日:2010-07-21
申请号:CN201010121874.4
申请日:2010-03-11
Applicant: 复旦大学
Abstract: 本发明属于LED显示以及机器人技术领域,具体为一种吉祥物造型的LED立体显示装置。该LED立体显示系统主要由标准LED矩形模块、多边形LED模块、梯形LED模块和三角形LED模块组成,能生动地表现吉祥物等各类卡通造型,可以全方位显示数字图文等内容,实现多种交互方式与互动内容,色彩丰富,形式多变,突破传统显示概念。
-
公开(公告)号:CN101428653A
公开(公告)日:2009-05-13
申请号:CN200810203948.1
申请日:2008-12-04
Applicant: 复旦大学
IPC: B62D57/00
Abstract: 本发明涉及一种三轮式的机器人移动平台的驱动和换向机构,该机构包括一个本体、一个主动轮和两个集随动与转向于一体的从动轮;其中,第一伺服电机通过传动装置控制主动轮的运动;第二伺服电机带动从动轮支撑轴转动,该从动轮支撑轴带动连接在四连杆机构上的从动轮随动和换向;从动轮支撑轴与四连杆机构中的一条连杆铰接,四连杆机构由首尾相互铰接的四条连杆构成;本发明还包括一控制系统,该控制系统对两伺服电机进行同步控制,合成本体的前后移动和各个角度方向上的运动。利用本发明设计的移动本体具有运动灵活、控制精度高、成本低廉的特点,可广泛应用于机器人研究以及场馆导游、家庭助理等服务机器人的驱动等领域。
-
公开(公告)号:CN117934398A
公开(公告)日:2024-04-26
申请号:CN202410045903.5
申请日:2024-01-12
Applicant: 复旦大学附属儿科医院
IPC: G06T7/00 , G06V10/52 , G06N3/0464 , G06N3/084
Abstract: 本发明提供一种基于多尺度特征的无参考CT图像质量评估方法,包括如下步骤:步骤S1,从Mayo Clinic数据集生成不同质量的CT图像训练集。步骤S2,基于卷积神经网络,构建无参考的CT质量评估网络。步骤S3,将步骤S1的训练集输入到CT质量评估网络中,训练网络直到网络收敛。步骤S4,将待测CT图像输入训练好的CT质量评估网络中,获取CT图像的质量评分。本发明结合多尺度特征提取、结构评价分支、特征评价分支和质量系数分支的CT质量评估网络,能针对CT图像中的细节和整体结构,产生精确的质量评估分数,从而实现对CT图像质量的量化评估。
-
公开(公告)号:CN117574069A
公开(公告)日:2024-02-20
申请号:CN202311571468.1
申请日:2023-11-23
Applicant: 复旦大学附属儿科医院
IPC: G06F18/15 , G06F18/214 , G06F18/2411 , G06N20/10
Abstract: 本发明提供一种评价平行设计随机对照研究偏倚风险的机器学习系统及方法,由2个子系统(C系统和R系统)实现功能,通过建立数据集,数据预处理,检索到的期刊发表的RCT文章上传至C系统,由C系统自动生成CONSORT查检清单,将已获取的该RCT文章的结构化内容进入R系统,由R系统根据ROB 2.0中算法流程图回答五个领域相应信号问题,最后形成对RCT文章的偏倚风险评估报告和最终评估结果。本申请通过机器学习系统可以实现自动生成平行设计随机对照研究偏倚风险评估报告及评估结果,评价结果较为全面和准确,极大地提高了数据分析的有效性,能提供更为确切、同质化的RCT偏倚风险评估结果。
-
公开(公告)号:CN110619387B
公开(公告)日:2023-06-20
申请号:CN201910865549.X
申请日:2019-09-12
Applicant: 复旦大学
IPC: G06N3/0464 , G06F18/213
Abstract: 本发明提供一种基于卷积神经网络的通道扩展方法,用于替换卷积神经网络中通用的卷积扩展通道和池化操作,从而保证有效数据不损失的情况下减少卷积神经网络在中间运算的冗余数据,其特征在于,包括如下步骤:步骤S1,根据在卷积池化前后特征图的分辨率变化率计算特征图数据的分辨率及通道数;步骤S2,将4个维度的特征图数据中对应高和宽的通道进行维度拆分,形成6个维度;步骤S3,将拆分后的特征图数据进行维度调转:第3、5维度调换为第5、6维度;步骤S4,将调换后的特征图数据中第2、3、4维度进行维度合并,重新整合为4个维度。
-
公开(公告)号:CN112926681B
公开(公告)日:2022-11-29
申请号:CN202110333413.1
申请日:2021-03-29
Applicant: 复旦大学
IPC: G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于深度卷积神经网络的目标检测方法及装置,基于整张待测图像的特征预测该待测图像中所有目标物体的边界框以及种类,其特征在于,包括如下步骤:对待测图像预处理得到预处理图像;将预处理图像输入预先训练好的深度卷积网络模型,得到所有目标物体的边界框以及种类。其中,深度卷积网络模型的训练过程包括:对训练集预处理得到预处理数据集;搭建包括主网络以及辅助网络深度卷积神经网络,主网络为全卷积神经网络;利用主网络获取第一特征图,从而进行边界框预测得到预测边界框置信度分数;利用辅助网络获取第二特征图,进而得到物体边界框以及物体类别,进而训练更新得到训练好的深度卷积网络模型。
-
公开(公告)号:CN109727276B
公开(公告)日:2022-11-29
申请号:CN201811450114.0
申请日:2018-11-30
Applicant: 复旦大学
IPC: G06T7/30
Abstract: 本发明提供一种超高清视频图像分析加速方法以及基于该超高清视频图像分析加速方法的超高清视频图像分析加速系统,用于采用含有多个图像计算单元的分析平台对超高分辨率的视频图像进行实时处理和分析,其特征在于,包括如下步骤:步骤S1,建立用于获取视频图像的数据传输通道,连续获取视频图像的图像帧并直接进行存储;步骤S2,按获取顺序为获取的图像帧依次设定顺序标记;步骤S3,分析图像计算单元的计算性能,进一步确定各个图像计算单元的处理顺序并生成对应的处理方案;步骤S4,根据处理方案控制相应的图像计算单元对图像帧进行图像分析计算从而获取分析结果;步骤S5,根据顺序标记依次将相应的分析结果进行存储。
-
公开(公告)号:CN112992155B
公开(公告)日:2022-10-14
申请号:CN202110231097.7
申请日:2021-03-02
Applicant: 复旦大学
Abstract: 本发明提供了一种基于残差神经网络的远场语音说话人识别方法及装置,用于在嘈杂混响且有多个说话人的环境下,对短时的待测音频进行远场语音说话人识别从而确定该待测音频对应的说话人,其特征在于,包括如下步骤:对待测音频进行预处理得到预处理短时语音;利用语音活动检测模型对预处理短时语音进行语音分割得到分割结果,并从滤除了噪声以及静音的分割结果中提取得到语音向量特征;基于语音向量特征利用预先训练好的残差神经网络模型进行说话人特征提取得到说话人嵌入向量;基于预定的声音特征库对说话人嵌入向量进行相似度计算得到语音相似度值,根据该语音相似度值确定待测音频对应的说话人。
-
公开(公告)号:CN113095199B
公开(公告)日:2022-06-14
申请号:CN202110367156.3
申请日:2021-04-06
Applicant: 复旦大学
IPC: G06V40/10 , G06V10/762 , G06V10/764 , G06V40/16 , G06V20/52 , G06V10/82 , G06K9/62 , G06N3/08
Abstract: 本发明提供一种能够快速识别行人身份并捕捉该行人全身像图的高速行人身份识别方法及装置,其特征在于,高速行人身份识别方法包括以下步骤:步骤S1,获取摄像头的识别号以及各个摄像头的道路连通关系;步骤S2,识别出目标行人的人脸图像以及全身图像作为目标行人信息进行存储;步骤S3,获取与识别出目标行人的摄像头具有对应的道路连通关系的摄像头作为待识别摄像头,步骤S4,从待识别摄像头中获取图像帧;步骤S5,将图像帧输入行人检测算法模型;步骤S6,对图像帧进行目标行人识别;步骤S7,根据行人识别结果获取待匹配人脸图像并进行人脸识别;步骤S8,将目标行人的全身图像与相应的识别号对应存入输出缓存队列;步骤S9,重复步骤S3至步骤S7。
-
-
-
-
-
-
-
-
-