-
公开(公告)号:CN117670833A
公开(公告)日:2024-03-08
申请号:CN202311670033.2
申请日:2023-12-07
Applicant: 上海交通大学
IPC: G06T7/00 , G06T7/70 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本公开提供一种三维车道线检测方法、系统、介质及电子设备,其中,三维车道线检测方法,包括:获取包含有目标车道线的图像数据集;将图像数据集中的图像样本输入虚拟相机中进行图像参数预处理,确定经过图像参数预处理后的图像样本;将经过图像参数预处理后的图像样本输入预设的主干网络中,确定前视图特征;将前视图特征输入内嵌注意力机制的空间转换模型中,确定鸟瞰图总特征;将鸟瞰图总特征输入检测头网络中,确定目标车道线。通过本公开,实现采用虚拟相机统一图像样本的内外参数,提高三维车道线的检测精度,采用内嵌注意力机制,简化了空间特征转换模型的结构,提高获取高层次全局特征信息的提取能力,提高三维车道线的检测速度。
-
公开(公告)号:CN117612211A
公开(公告)日:2024-02-27
申请号:CN202311674817.2
申请日:2023-12-07
Applicant: 上海交通大学
IPC: G06V40/10 , G06V10/82 , G06V10/74 , G06V10/764 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种具有高泛化能力的行人搜索方法及系统,包括:对行人搜索基础模型进行训练,获得具有高泛化能力的行人搜索模型;将待检索图像输入行人搜索模型,得到跨境场景下的目标行人;其中:在一次训练迭代中,计算行人搜索基础模型的检测分支的分类和回归损失函数以及行人搜索基础模型的识别分支的OIM损失和triplet损失函数,自动分配权重并反向传播后,对行人搜索基础模型的特征参数进行更新;重复训练过程,直至完成对行人搜索基础模型的训练过程,获得具有高泛化能力的行人搜索模型。本发明能够以较高的性能泛化至全新的行人搜索场景上;可以在任意新场景下不经过采集训练数据和重新训练,而直接推理,并取得可观的性能。
-
公开(公告)号:CN117474592A
公开(公告)日:2024-01-30
申请号:CN202311309521.0
申请日:2023-10-10
Applicant: 浙江网商银行股份有限公司 , 上海交通大学
IPC: G06Q30/0207 , G06Q30/0202 , G06N3/044 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种投放转化处理方法、装置、存储介质及电子设备,其中,方法包括:确定信息投放场景对应的投放渠道组合序列数据,获取目标信息投放对象的用户特征数据和针对目标信息投放对象的投放渠道组合用户特征数据,将投放渠道组合序列数据、用户特征数据和投放渠道组合用户特征数据输入投放转化预测模型,输出针对目标信息投放对象的渠道组合用户转化率。
-
公开(公告)号:CN111931579B
公开(公告)日:2023-10-31
申请号:CN202010654972.8
申请日:2020-07-09
Applicant: 上海交通大学
Abstract: 本发明公开一种利用眼动追踪和手势识别技术的自动驾驶辅助系统及方法,包括:平视显示器,将控制车辆的操作可视化为虚拟按钮的形式,将所述虚拟按钮显示给驾驶员,驾驶员用目光注视和/或手势指示所述平视显示器要做的动作;车载摄像头,用于捕捉驾驶员的面部及手部图像;数据处理中心,接收所述车载摄像头捕捉的图像,通过机器学习算法对驾驶员的视线和手势信息进行眼动追踪、手势识别,得到驾驶员目光注视和/或手势指向的方向,从而确定驾驶员要做动作对应的虚拟按钮,根据该虚拟按钮对车辆进行相应的操作。本发明能够实时地检测到车内驾驶员的目光注视方向和手势动作,并对眼神和手势进行理解,从而帮助驾驶员实现他们的意图。
-
公开(公告)号:CN110910344B
公开(公告)日:2022-09-13
申请号:CN201910966446.2
申请日:2019-10-12
Applicant: 上海交通大学
IPC: G06T7/00 , G06V10/77 , G06V10/80 , G06V10/82 , G06V10/766
Abstract: 本发明提供了一种全景图片无参考质量评价方法,包括:将失真图片D从等距柱状投影图映射到立方体投影图;采用单通道混合卷积神经网络通道提取单个立方体投影视图的特征值,将立方体投影图的六个视图分别通过对应的单通道混合卷积神经网络,然后通过串联的方式将六个通道提取的特征值融合在一起;使用一个全连接层将多通道卷积网络提取的特征回归到图像质量分数。本发明同时提供了一种全景图片无参考质量评价系统。本发明利用了立方体投影的方式解决了全景图片失真的问题,使用混合卷积神经网络有效地提取了有利于质量评价的特征。
-
公开(公告)号:CN111479106B
公开(公告)日:2021-06-29
申请号:CN202010171586.3
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/233 , H04N21/44 , H04N21/439 , H04N21/475
Abstract: 本发明提供了一种一二维质量描述子融合的音视频联合质量评价方法及终端,通过对现有的适用于二维图像信号的视觉质量描述子进行有针对性的推广和降维操作,得到适用于一维音频信号的听觉质量描述子,然后融合上述二维图像质量描述子和一维音频质量描述子,从而构建音视频联合质量评价模型。包括:选取适用于视觉信号的二维图像质量描述子,通过将二维图像质量描述子中所有二维操作推广并降维至一维操作来设计适用于听觉信号的一维音频质量描述子,融合二维图像质量描述子和一维音频质量描述子得到音视频联合质量评价模型。本发明可有效地评价音频和视频的总体体验质量。
-
公开(公告)号:CN111385567B
公开(公告)日:2021-01-05
申请号:CN202010172376.6
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/44
Abstract: 本发明公开一种超高清视频质量评价方法及装置,方法包括:将超高清视频序列逐帧提取出图像序列,将图像从彩色图转变成灰度图;对转变后的每一帧灰度图进行分块,并计算每一分块的局部方差,选取局部方差最大的一个分块作为后续处理的子图,并记录该局部方差为图像复杂度特征;对所述子图进行离散余弦变换,计算所述离散余弦变换下的频域能量特征;计算所述子图的自然统计学特征;将上述图像复杂度特征、频域能量特征、自然统计学特征采用支持向量机方法融合,得到最终的视频质量评价质量分数。本发明可以有效地用于辨别真伪4K超高清图像视频序列,评价超高清图像的质量。
-
公开(公告)号:CN111539914A
公开(公告)日:2020-08-14
申请号:CN202010211227.6
申请日:2020-03-24
Applicant: 上海交通大学
Abstract: 本发明提供一种手机照片质量比较评价方法、系统及终端,方法包括:对同一场景下的两幅照片进行调整,使所述两幅照片的内容对齐;移除对齐后的所述两幅照片的画面中运动物体,减少画面内容的差异部分;将移除运动物体后的所述两幅照片分别划分为多个区域,逐一比对所述两幅照片中相对应的区域,提取出所述两幅照片中相似度最低的区域;对提取到的所述相似度最低的区域进行清晰度、噪声进行分析,得到综合评价结果。系统包括:图像调整对齐模块、运动物体移除模块、差异最大区域提取模块和综合质量评价模块。本发明可以实现照片客观质量评价,不需要主观评价者的参与,节省人力,可操作性高。
-
公开(公告)号:CN111539913A
公开(公告)日:2020-08-14
申请号:CN202010211195.X
申请日:2020-03-24
Applicant: 上海交通大学
Abstract: 本发明提供了一种移动设备拍照清晰度质量评价方法、系统和终端,方法首先选取图像纹理最为丰富的区域作为表征待评价图像清晰度质量的块状区域,然后计算该块状区域在空间域、频域和小波域上的纹理特征,最后利用机器学习的方法把块状区域的特征向量回归到主观的清晰度质量分数。本发明只选取图像纹理最为丰富的区域作为待评价的对象,可以有效的排除图像无关位置的影响,分别从空间域、频域和小波域上提取纹理特征,可以高效的表征图像清晰度的特征信息。
-
公开(公告)号:CN111479107A
公开(公告)日:2020-07-31
申请号:CN202010171587.8
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/233 , H04N21/44 , H04N21/439 , H04N21/475
Abstract: 本发明提供了的一种基于自然音视频统计的无参考音视频联合质量评价方法,该方法通过将相关的自然视频统计模型推广至自然音频统计,并进一步构建自然音频及视频联合统计模型,从而实现基于自然音频及视频统计的无参考音视频联合质量评价;包括:构建自然视频统计模型,将自然视频统计模型推广至自然音频统计,利用自然视频统计模型及自然音频统计模型构建自然音频及视频联合统计模型,提取基于自然音频统计、自然视频统计、及自然音视频联合统计的音视频质量特征,特征回归得到最终的音视频联合质量估计;本发明提供的无参考音视频联合质量评价方法,可有效地在原始音频及视频信号未知的情况下估计待测的音视频信号联合质量。
-
-
-
-
-
-
-
-
-