-
公开(公告)号:CN105095857B
公开(公告)日:2018-11-16
申请号:CN201510363031.8
申请日:2015-06-26
Applicant: 上海交通大学
IPC: G06K9/00
Abstract: 本发明公开一种基于关键点扰动技术的人脸数据增强方法,该方法利用首先采用基于人脸关键点技术的人脸对齐方法,然后对关键点位置进行扰动,再分别用线性变换、仿射变换、分块仿射变换得到新的人脸图片。本发明基于人脸关键点技术的人脸对齐方法,以线性变换、仿射变换、分块仿射变换进行人脸对齐,并对关键点位置进行扰动,使一张人脸图片能够生成多张人脸图片。本发明是一种能够解决人脸识别训练过程中数据不足的方法,通过一张人脸图片生成多张图片,从而增加训练量,提高人脸识别的准确率。
-
公开(公告)号:CN108012157A
公开(公告)日:2018-05-08
申请号:CN201711207766.7
申请日:2017-11-27
Applicant: 上海交通大学
IPC: H04N19/80 , H04N19/117 , H04N19/625 , H04N19/132 , H04N19/587 , H04N19/503 , G06N3/04
Abstract: 本发明提供一种用于视频编码分数像素插值的卷积神经网络的构建方法,包括:收集不同内容、分辨率的图像,形成包含不同类型、编码复杂度的数据的原始训练数据集;对原始训练数据集进行预处理操作,得到符合视频编码帧间预测分数像素插值特性的训练数据;搭建深度卷积神经网络,得到适用于视频编码帧间预测分数像素插值的卷积神经网络结构;使用预处理得到的数据输入搭建好的卷积神经网络,同时将原始训练数据集作为对应的真值,训练搭建的卷积神经网络。本发明保证了卷积神经网络可顺利训练,且使用训练好的卷积神经网络插值得到的分数像素满足视频编码分数像素插值特性需求,使用本发明进行分数像素插值可实现视频编码效率的提升。
-
公开(公告)号:CN106580294A
公开(公告)日:2017-04-26
申请号:CN201611270849.6
申请日:2016-12-30
Applicant: 上海交通大学
IPC: A61B5/0205 , A61B5/1455 , A61B5/00
Abstract: 本发明提供了一种基于多模态成像技术的生理信号远程监控系统及应用,包括集成成像模块、高光谱成像模块和控制终端,所述高光谱成像模块设置于集成成像模块的上方,所述集成成像模块和高光谱成像模块分别与控制终端通信连接。本发明整合了高光谱、可见光、近红外、远红外、激光生物散斑5种成像模式,可以实现高精度的生理信号提取和分析。同时,本发明可以进行多模态设备间的协作数据获取和数据间的协同处理分析,以满足睡眠监控和病猪筛选等不同的应用需求。
-
公开(公告)号:CN104112272B
公开(公告)日:2017-04-12
申请号:CN201410317455.6
申请日:2014-07-04
Applicant: 上海交通大学
IPC: G06T7/11
Abstract: 本发明提供了一种基于结构降化模型的半参考图像质量评价方法,该方法主要考虑到对于图像在不同失真类型、不同失真程度上的响应空间频率响应的区别,并结合利用结构相似指数(SSIM)来提取图像特征,从而实现一种半参考的图像质量评价方法。根据在现有的LIVE数据库的测试结果来看优于大部分主流图像质量评价方法。本发明所述的评价方法仅依赖于结构相似性指数的计算函数,而无需引入其他复杂算法,不仅拥有卓越评价准确度,并且兼具了计算复杂度低、执行效率高的特点;本发明只需要四个数值作为特征值,这相比于图像本身的大小是可以忽略不计的。
-
公开(公告)号:CN104063864B
公开(公告)日:2017-04-12
申请号:CN201410298499.9
申请日:2014-06-26
Applicant: 上海交通大学
IPC: G06T7/00
Abstract: 本发明公开一种基于四元相位叠合模型的图像模糊度评估方法,该方法利用了基于四元数矩阵的彩色图像表示,以矢量信号的形式来整体处理彩色图像并计算四元相位叠合图,并与传统的复数相位叠合图组合,构成一种可以描述图像结构轮廓清晰程度的显著图——混合相位叠合图。本发明同时对计算出的显著性图进行直方图分析,取相位叠合的加权平均值作为衡量图像清晰程度的指标,最后计算出图像的模糊系数。本发明是一种能够体现彩色图像的轮廓结构信息的显著性方法,通过有效地利用彩色通道之间的相关性以及人眼视觉特性,提高对彩色图像模糊度估计的准确率。
-
公开(公告)号:CN105095857A
公开(公告)日:2015-11-25
申请号:CN201510363031.8
申请日:2015-06-26
Applicant: 上海交通大学
IPC: G06K9/00
CPC classification number: G06K9/00221 , G06K9/00281
Abstract: 本发明公开一种基于关键点扰动技术的人脸数据增强方法,该方法利用首先采用基于人脸关键点技术的人脸对齐方法,然后对关键点位置进行扰动,再分别用线性变换、仿射变换、分块仿射变换得到新的人脸图片。本发明基于人脸关键点技术的人脸对齐方法,以线性变换、仿射变换、分块仿射变换进行人脸对齐,并对关键点位置进行扰动,使一张人脸图片能够生成多张人脸图片。本发明是一种能够解决人脸识别训练过程中数据不足的方法,通过一张人脸图片生成多张图片,从而增加训练量,提高人脸识别的准确率。
-
公开(公告)号:CN104983511A
公开(公告)日:2015-10-21
申请号:CN201510253836.7
申请日:2015-05-18
Applicant: 上海交通大学
IPC: A61F9/08
Abstract: 本发明提供了一种针对全盲视觉障碍者的语音帮助智能眼镜系统,包括:眼镜支架;高清摄像采集设备;用于检测外部环境的各传感器;数据处理中心;本发明能实时地采集现实场景,并传到服务器端,服务器端采用图像处理算法对现场的场景进行实时处理、建模,识别盲人周围环境,结果通过蓝牙骨传导耳机给盲人语音指示,同时根据障碍物的距离远近给出不同强度的震动;使用机器学习算法,使得系统自动学习,将物体存入数据库中;同时本发明还对采集的书本和报纸上的文字识别并转化为语音,通过耳机朗读给盲人听,帮助盲人能够无障碍阅读;同实现时WiFi语音上网、蓝牙连接手机;本发明体积小,更具有便捷性,轻便,实用性,也更能够被盲人接受。
-
公开(公告)号:CN104539954A
公开(公告)日:2015-04-22
申请号:CN201410719598.X
申请日:2014-12-01
Applicant: 上海交通大学
IPC: H04N19/13 , H04N19/176 , H04N19/103
Abstract: 本发明公开一种加速HEVC编码速度的级联方法,该方法首先使用H.264/AVC对当前帧和HEVC的重建帧进行预编码,从预编码结果中提取出视频的宏块划分结果;然后通过模式映射将H.264的宏块划分结果映射为HEVC的可能模式集;最后在该集合中使用率失真优化搜索HEVC的最佳模式。与现有技术相比,本发明创新性地提出了一个级联编码器的方法来加速HEVC编码过程,能够极大地简化了HEVC的模式搜索过程,具有很好的应用前景。
-
公开(公告)号:CN104485008A
公开(公告)日:2015-04-01
申请号:CN201410736822.6
申请日:2014-12-04
Applicant: 上海交通大学
IPC: G08G1/0962 , H04N13/02 , H04N13/04
CPC classification number: H04N9/64
Abstract: 本发明提供了一种针对色盲患者的头戴式辅助驾驶系统,包括:用于安装连接系统各个部件以及方便用户佩戴的头戴式眼镜支架;用于显示图像的显示面板;以人眼视角采集图像的图像采集设备;用于语音控制的语音模块;用于检测外部环境及眼镜状态的各类传感器;用于该系统的总体控制的数据处理中心;数据处理中心配套有针对色盲患者设计的图像色彩分辨力增强程序、针对色盲患者在驾驶状态下设计的交通指示灯标定,交通状况、患者疲劳状态及驾驶状态检测等程序。本发明能够实时地采集现实场景,将采集到的图像进行色彩转换或标定后显示,并能进行交通状况、患者疲劳状态及驾驶状态检测,在驾驶及日常生活中达到辅助视觉的目的。
-
公开(公告)号:CN104473717A
公开(公告)日:2015-04-01
申请号:CN201410736802.9
申请日:2014-12-04
Applicant: 上海交通大学
IPC: A61F9/08
Abstract: 本发明提供了一种针对全盲人群的可穿戴式引导设备,包括用于安装及连接该系统的各个部件以及方便用户佩戴的头戴式眼镜支架;用于检测周边环境的传感器;用于记录周边画面的图像采集设备;用于语音交互的语音模块;用于提醒佩戴者相关信息的信息输出装置;以及用于系统的总体控制的数据处理中心。本发明所述系统能够实时地全方位采集现实场景,利用传感器全方位检测周边环境,将分析后的数据经过无线传输给远程监护设备,达到导盲、远程监护的功能。
-
-
-
-
-
-
-
-
-