-
公开(公告)号:CN118790240A
公开(公告)日:2024-10-18
申请号:CN202310381120.X
申请日:2023-04-11
Applicant: 上海大学
IPC: B60W30/095 , G06V20/62 , G06V20/56 , G06T7/70 , G06T7/80
Abstract: 一种基于车牌识别的前向碰撞预警场景下的车辆车道定位方法,当远车刹车时广播的改进的紧急警告信息由主车接收到时,由主车通过车牌检测识别算法判断紧急警告信息中车牌信息是否在当前摄像头视野内以及远车与主车是否在同一车道内,并当与远车在同一车道时进行减速。本发明使用车牌检测识别技术以及改进的车辆广播紧急警告信息对车道上车辆进行检测识别,通过视野范围内的车牌来判断远车是否为碰撞预警场景下的远车,再由主车决定是否实现避险。引入车道判别器,通过判断主车中心线和远车车牌位置的夹角是否在一定范围内,来确认当远车辆所属车道,实现车道级定位。
-
公开(公告)号:CN113657587B
公开(公告)日:2023-09-26
申请号:CN202110945782.6
申请日:2021-08-17
Applicant: 上海大学
Abstract: 一种基于FPGA的可变形卷积加速方法及装置,包括:数据选择模块、双线性插值模块和数据匹配模块,数据选择模块使用多个多路选择器,按照偏移量选择出待计算的像素并输出至双线性插值模块,双线性插值模块使用六个乘法器计算每一个像素点,再将其与权重配置好数据流,数据选择模块进行可变形卷积中对于像素添加偏移的操作并输出对应的数据。本发明在人脸检测,摄像头识别物体等方面有着出色的应用,并且让可变形卷积更适应于FPGA上的实现,可以替代所有的普通卷积,达到精度的提升。
-
公开(公告)号:CN112818722B
公开(公告)日:2023-08-18
申请号:CN201911118295.1
申请日:2019-11-15
Applicant: 上海大学
IPC: G06V40/40 , G06V40/16 , G06V10/143 , G06V10/80 , G06V10/82
Abstract: 一种模块化动态可配置的活体人脸识别系统,包括:图像输入模块、传输模块、采用融合特征卷积网络实现的活体检测模块、采用人脸特征提取卷积神经网络实现的人脸检测模块、人脸识别模块和结果输出模块,本发明融合多重人脸的特征,在应对不同光照强度下,获得更加高的人脸识别结果,在应对无光、弱光,正常光源下,特征融合网络具有高鲁棒性和高准确率。
-
公开(公告)号:CN111259790B
公开(公告)日:2023-06-20
申请号:CN202010042072.8
申请日:2020-01-15
IPC: G06V20/40 , G06V40/20 , G06V10/82 , G06V10/77 , G06N3/0455 , G06N3/0464
Abstract: 一种用于中短时视频的从粗到细的行为快速检测与分类方法及系统,通过对原视频重采样后进行时空联合的特征提取,在此基础上进行时域定位;然后根据时域定位得到的采样特征信息进行目标分类以及粗略定位,根据目标分类得到的行为类别以及行为轨迹的描述参数对粗略定位得到的行为轨迹在关键帧上依次进行修正,得到行为检测结果,从而实现行为目标的快速检测。本发明在有效提升分类精度以及定位精度的同时,还能够确保行为检测的运行效率,目标检测的准确率可以达到79.30%,同时平均每一帧的处理时间仅为7.6毫秒。
-
公开(公告)号:CN110135565B
公开(公告)日:2023-03-24
申请号:CN201910416804.2
申请日:2019-05-20
Applicant: 上海大学
IPC: G06F30/33 , G06N3/0464 , G06N3/063
Abstract: 一种针对神经网络在集成电路上实现时的性能评估系统,包括:输入配置模块和功能函数模块,通过配置待测神经网络的参数,通过输入配置模块进行数据流组织方式解析以及硬件框架参数配置,再通过功能函数模块对延时、资源使用、不同存储器访问次数进行评估。本发明针对于神经网络的拓扑结构以及具体网络参数,通过硬件可调参数的配置,在多种数据流组织方式下,完成对该神经网络硬件实现性能的评估,包括各个层级的延时,硬件资源的使用,不同等级存储器的访问情况等。
-
-
公开(公告)号:CN115116465A
公开(公告)日:2022-09-27
申请号:CN202210567042.8
申请日:2022-05-23
Applicant: 佛山智优人科技有限公司 , 上海大学
IPC: G10L21/0272 , G10L21/0216 , G10L21/028
Abstract: 本发明公开了一种声源分离的方法及声源分离装置,其方法包括:基于麦克风阵列采集空间声场中的声音,将空气中声波在麦克风阵列中不同麦克风位置产生的机械能转化为对应多通道电信号进行输出;对多通道电信号进行声源分离处理,得到分离后的各声源信号;基于扬声器阵列对分离后的各声源信号进行回放。本发明基于空间声场特性推演的声源分离主体框架,利用深度神经网络的直接式估计来取代对空间声场特性的迭代式估计,降低计算复杂度。
-
公开(公告)号:CN113554030B
公开(公告)日:2022-08-16
申请号:CN202110851186.1
申请日:2021-07-27
Applicant: 上海大学
Abstract: 一种基于单字符注意力的多类型车牌识别方法及系统,首先使用多尺度特征提取骨干网络对车牌图像进行多种尺度特征提取和融合,然后对得到的全局特征进行基于单字符注意力的下、上采样得到多通道的掩码图像,再基于掩码图像对全局特征进行单字符特征软分割获得独立的单字符特征向量,最后通过单字符分类器对多个单字符特征向量进行单字符预测分类并将分类结果按次序拼接成字符串并输出。本发明采用在全局特征空间进行单字符软分割后再独立识别单字符的策略,实现多种类型车牌的同时识别,不需要提前进行额外的车牌分类调用不同识别算法。
-
公开(公告)号:CN114863441A
公开(公告)日:2022-08-05
申请号:CN202210426530.7
申请日:2022-04-22
Applicant: 佛山智优人科技有限公司 , 上海大学
IPC: G06V30/19 , G06V10/774
Abstract: 本发明公开了一种基于文字属性引导的文本图像编辑方法及系统,其方法包括:通过文本图像合成方法合成训练所需的成对文本图像数据;训练前景变换网络,将待编辑文本图像与新文本内容作为输入,生成新文本内容的前景;训练背景修复网络,将待编辑的原始图像作为输入,得到纯背景图像结果;训练前背景融合网络,得到最终的编辑结果;编辑结果图会和标签图一起输入字体字符分类网络,通过交叉熵损失与感知损失对编辑网络模型参数正则化;在各子网络分别训练优化过后,将整个编辑网络进行端到端的训练微调优化。本发明提出使用合成成对文本图像数据集,解决文本图像编辑任务数据难以获取的问题,降低了文本图像编辑任务数据获取的难度。
-
公开(公告)号:CN112988229B
公开(公告)日:2022-08-05
申请号:CN201911293482.3
申请日:2019-12-12
Applicant: 上海大学
Abstract: 一种基于异构计算的卷积神经网络资源优化配置方法,针对卷积神经网络的卷积层、偏置层、池化层、relu层和全连接层进行逐层计算复杂度分析和数据复杂度分析,得到计算通信比,基于计算通信比的排序在异构计算平台上以运算速度和效率作为优化目标进行资源配置,即将计算通信比高的部分配置于FPGA上进行计算,其余部分配置于ARM上进行计算。本发明同时兼顾了FPGA的高度并行计算的能力和ARM端的高主频,多级缓存以及单指令多数据等特点,显著加速卷积层等计算密集型部分的运算和数据密集的全连接层运算,从而对整个卷积神经网络达到最有效的加速。
-
-
-
-
-
-
-
-
-