-
公开(公告)号:CN111931579B
公开(公告)日:2023-10-31
申请号:CN202010654972.8
申请日:2020-07-09
Applicant: 上海交通大学
Abstract: 本发明公开一种利用眼动追踪和手势识别技术的自动驾驶辅助系统及方法,包括:平视显示器,将控制车辆的操作可视化为虚拟按钮的形式,将所述虚拟按钮显示给驾驶员,驾驶员用目光注视和/或手势指示所述平视显示器要做的动作;车载摄像头,用于捕捉驾驶员的面部及手部图像;数据处理中心,接收所述车载摄像头捕捉的图像,通过机器学习算法对驾驶员的视线和手势信息进行眼动追踪、手势识别,得到驾驶员目光注视和/或手势指向的方向,从而确定驾驶员要做动作对应的虚拟按钮,根据该虚拟按钮对车辆进行相应的操作。本发明能够实时地检测到车内驾驶员的目光注视方向和手势动作,并对眼神和手势进行理解,从而帮助驾驶员实现他们的意图。
-
公开(公告)号:CN120013760A
公开(公告)日:2025-05-16
申请号:CN202510085938.6
申请日:2025-01-20
Applicant: 上海交通大学
IPC: G06T3/4053 , G06T3/4046 , G06T5/50 , G06T5/60 , G06T7/269 , G06N3/0464 , G06N3/0455 , H04N21/4402
Abstract: 本发明提供一种基于预测辅助的显微镜视频流帧超分辨率方法和系统,包括:对历史帧进行光流计算,得到初始光流,基于所述初始光流推断当前帧与未来帧之间的运动,获得当前帧和未来帧之间的扭曲光流和传播光流;计算当前帧的图像中像素的运动矢量场,获得当前帧和未来帧之间的估计光流;结合不同来源的所述扭曲光流、所述传播光流和所述估计光流,获得当前帧和未来帧之间的融合光流场;基于所述融合光流场,通过反向传播将当前帧的图像信息传播到未来帧,通过帧合成生成目标超分辨率帧。本发明解决了因带宽限制、网络延迟或图像质量下降而导致的显微镜视频帧丢失、卡顿或冻结现象。
-
公开(公告)号:CN109635705A
公开(公告)日:2019-04-16
申请号:CN201811483176.1
申请日:2018-12-05
Applicant: 上海交通大学
CPC classification number: G06K9/00664 , G06K7/10881 , G06N3/0454
Abstract: 本发明公开了一种基于二维码和深度学习的商品识别方法及装置,该方法包括:编码制作二维码标签,并给部分商品贴上二维码标签;对未贴二维码标签的特定商品进行拍摄,得到特定商品的图片,利用深度神经网络对特定商品的图片进行训练得到神经网络模型;利用训练得到的神经网络模型对商品进行检测,识别出特定商品信息;利用二维码标签识别出贴有二维码标签的商品信息。该装置包括:摄像机、神经网络识别装置以及二维码识别装置。本发明的基于二维码和深度学习的商品识别方法及装置,通过二维码和深度学习相组合的方案,提高了商品识别效率、降低了成本。
-
公开(公告)号:CN119991649A
公开(公告)日:2025-05-13
申请号:CN202510169091.X
申请日:2025-02-17
Applicant: 上海交通大学
IPC: G06T7/00 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/28 , G06F40/126
Abstract: 本发明提供一种基于多模态大模型的图像质量评价系统和方法,包括:输入模块:用于接收输入图像和文本描述;视觉编码器:将所述输入图像转换为视觉特征编码;文本编码器:将所述文本描述转换为文本嵌入特征;多尺度特征抽象器:从所述视觉特征编码提取出多尺度特征,并与所述文本嵌入特征合并;任务处理模块:根据任务类型,完成质量分数量化、质量描述、质量标注区域的一种或者多种;输出模块:将所述任务处理模块的处理结果输出。本发明构建统一的多模态框架:将图像的质量分数量化,质量损失描述以及质量损失区域标注任务整合到一个统一的多模态大模型中,实现多任务的协同处理。
-
公开(公告)号:CN109635705B
公开(公告)日:2021-04-27
申请号:CN201811483176.1
申请日:2018-12-05
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于二维码和深度学习的商品识别方法及装置,该方法包括:编码制作二维码标签,并给部分商品贴上二维码标签;对未贴二维码标签的特定商品进行拍摄,得到特定商品的图片,利用深度神经网络对特定商品的图片进行训练得到神经网络模型;利用训练得到的神经网络模型对商品进行检测,识别出特定商品信息;利用二维码标签识别出贴有二维码标签的商品信息。该装置包括:摄像机、神经网络识别装置以及二维码识别装置。本发明的基于二维码和深度学习的商品识别方法及装置,通过二维码和深度学习相组合的方案,提高了商品识别效率、降低了成本。
-
公开(公告)号:CN114863113A
公开(公告)日:2022-08-05
申请号:CN202210652583.0
申请日:2022-06-09
Applicant: 上海交通大学医学院附属第九人民医院
IPC: G06V10/26 , G06V10/764 , G06V10/74 , G06V10/44 , G06V10/30 , G06V10/32 , G06V10/82 , G06V10/774 , G06K9/62 , G16H50/80 , G16H10/60 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种两阶段新冠肺炎抗原检测结果判别的方法与设备,涉及图像处理领域,尤其涉及图像处理技术在新冠肺炎COVID‑19疫情防控领域的应用,所述方法包括以下步骤:步骤1、从目标图片中获取若干记录有检测结果的四边形区域,并使用透视变换方法对所述四边形区域进行视角调整,得到对应数量的矩形区域;步骤2、使用基于深度度量学习的分类网络对所述矩形区域进行识别,得到检测结果。本发明使用基于对的深度度量学习方法,将样本组对,度量样本之间的相似性,促使同类样本相互靠近,不同类别样本相互分离,从实例级别对细粒度图像进行处理。通过在细粒度图像检索算法中加入记忆存储模块进行优化帮助提升尾类样本的识别准确率。
-
公开(公告)号:CN120013757A
公开(公告)日:2025-05-16
申请号:CN202510085937.1
申请日:2025-01-20
Applicant: 上海交通大学
IPC: G06T3/4038 , G06T3/4046 , G06T5/90 , G06V10/46 , G06V10/75 , G06V10/82
Abstract: 本公开提供一种基于关键点和单应性估计的图像拼接方法及系统,其中,方法,包括:获取同一物体的第一视角图像和第二视角图像;采用增量搜索策略确定增量搜索窗口;在增量搜索窗口确定正确匹配的关键点对集合;对正确匹配的关键点对集合进行离群点消除处理,确定第一阶段的单应性矩阵;采用预设的深度神经网络对增量搜索窗口对应的第一视角图像的图像区域和第二视角图像的图像区域进行单应性估计处理,确定第二阶段的单应性矩阵;根据第一阶段的单应性矩阵和第二阶段的单应性矩阵,确定拼接图像;对拼接图像进行色彩校正优化,确定目标拼接图像。通过本公开,从粗到细地确定两相邻视角图像的重叠区域的单应性关系,提高图像拼接的精度和鲁棒性。
-
公开(公告)号:CN118333081A
公开(公告)日:2024-07-12
申请号:CN202410014563.X
申请日:2024-01-04
Applicant: 上海交通大学
IPC: G06K19/06
Abstract: 本发明提供一种基于提示词的美化二维码生成方法、系统、终端及介质,包括:输入第一生成图像与二维码;根据所述第一生成图像与二维码,采用二维码美学蓝图模块生成二维码蓝图;利用所述二维码蓝图进行二次生成,得到包含二维码信息和第一生成图像信息的第二生成图像;采用扫描增强模块增强所述第二生成图像的二维码的可扫性;其中,所述第一生成图像为用户喜好的图像,并记录有用户喜好对应的提示词;所述第二生成图像基于所述提示词生成。本发明实施例实现了更全面、稳定且高度用户定制性的美观二维码生成方法,克服了现有技术存在的个性化与稳健性平衡、一体化生成与信息一致性、用户定制性、生成图像特征保持和扫描鲁棒性等问题。
-
公开(公告)号:CN111931579A
公开(公告)日:2020-11-13
申请号:CN202010654972.8
申请日:2020-07-09
Applicant: 上海交通大学
Abstract: 本发明公开一种利用眼动追踪和手势识别技术的自动驾驶辅助系统及方法,包括:平视显示器,将控制车辆的操作可视化为虚拟按钮的形式,将所述虚拟按钮显示给驾驶员,驾驶员用目光注视和/或手势指示所述平视显示器要做的动作;车载摄像头,用于捕捉驾驶员的面部及手部图像;数据处理中心,接收所述车载摄像头捕捉的图像,通过机器学习算法对驾驶员的视线和手势信息进行眼动追踪、手势识别,得到驾驶员目光注视和/或手势指向的方向,从而确定驾驶员要做动作对应的虚拟按钮,根据该虚拟按钮对车辆进行相应的操作。本发明能够实时地检测到车内驾驶员的目光注视方向和手势动作,并对眼神和手势进行理解,从而帮助驾驶员实现他们的意图。
-
-
-
-
-
-
-
-