-
-
公开(公告)号:CN106504190A
公开(公告)日:2017-03-15
申请号:CN201611243656.1
申请日:2016-12-29
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于3D卷积神经网络的立体视频生成方法,能将现有的2D视频源转换成能在3D立体显示设备上播放的立体视频。包括以下步骤:准备足够数量非动画3D电影作为训练数据,将3D视频源分离成左眼图像序列和右眼图像序列,删去片头、片尾及空白帧后,用模糊C均值聚类法对左眼图像序列进行镜头分割,并以镜头为单位组织训练文件,计算所有左眼图像序列的均值并将这些图像减去该均值,以右眼图像序列作为训练的目标。用这些训练数据训练所构造的3D卷积神经网络直到收敛。将需要转换成立体视频的2D视频源进行镜头分割并减去训练图像均值后输入到训练得到的3D卷积神经网络,将得到该2D视频的右眼视频图像序列,最终将两者合并成立体视频。
-
公开(公告)号:CN104616032A
公开(公告)日:2015-05-13
申请号:CN201510047118.4
申请日:2015-01-30
Applicant: 浙江工商大学
Abstract: 一种基于深度卷积神经网络的多摄像机间的目标匹配方法。本发明基于局部保护投影方法初始化多个卷积核,基于最大值池化方法对图像进行下采样,通过逐层特征变换,提取更加鲁棒、更加具有代表性的直方图特征;再利用多类支持向量机SVM分类器进行分类识别。当目标从一个摄像机视野域进入另外一个摄像机视野域时,对其提取特征并标注对应的目标标签,实现在多摄像机协作监控领域对目标进行准确的识别,以用于目标交接及跟踪等。
-
公开(公告)号:CN119784699A
公开(公告)日:2025-04-08
申请号:CN202411846450.2
申请日:2024-12-16
Applicant: 浙江工商大学
IPC: G06T7/00 , G06V10/52 , G06V10/42 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于多模态和差异增强的胆管癌淋巴结钙化点检测方法。本发明针对超声图像下胆管癌淋巴结转移钙化点的特点,通过对YOLO‑World网络中的图像文本融合模块进行改进,在该模块中增加差异增强算法,实现了在不影响检测速度的前提下提高对钙化点检测的准确率。本发明用于胆管癌淋巴结转移超声图像钙化点目标检测,具有更早期检测、检测精确度更高和定位更精准等优点。
-
公开(公告)号:CN111144209B
公开(公告)日:2024-07-02
申请号:CN201911168427.1
申请日:2019-11-25
Applicant: 浙江工商大学
IPC: G06V40/10 , G06V20/52 , G06V10/25 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种基于异构多分支深度卷积神经网络的监控视频人头检测方法,可应用于视频监控领域中的各种小目标检测。为了提高目标检测算法的检测精度,对YOLOv3结构进行改造,将其主干网络修改为双主干网络结构,其中一个分支以DenseNet121网络为主干网络,去掉其最后的FC层,然后将其基础结构由CBL修改为BRC结构;另外一个分支采用Darknet53为主干网络,去掉其最后FC层,该分支的BRC结构不作修改。本发明设计的双主干结构网络模型取名为Dense_YOLO网络,通过两个不同结构的主干网络提取的特征进行特征融合,提高了检测效果,减少了误检和漏检,适用于小目标检测,效果优于以Darknet53作为主干网络的YOLOv3模型。
-
公开(公告)号:CN116612419A
公开(公告)日:2023-08-18
申请号:CN202310743415.7
申请日:2023-06-21
Applicant: 浙江工商大学
IPC: G06V20/40 , G06V10/22 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于多尺度信息融合和动态特征提取的网球小目标检测方法。本发明首先读取网球比赛图像,然后将图像输入到网络模型中进行推理,从而获得网球比赛图像中的网球目标并进行定位。本发明通过对Yolov7中的Neck部分进行改进,通过增加基于多尺度信息融合和动态特征提取的DA(Dynamic Attention)模块,将位于浅层网络的底层特征通过DA模块融合到高层特征图,从而能够让模型利用更多的位置和形状信息进行预测,提高网球小目标的检出率。本发明用于网球小目标检测,可以在保证速度的同时,提高对网球小目标的检测效果,满足体育竞赛中对网球小目标的实际检测需求。
-
公开(公告)号:CN112233090B
公开(公告)日:2023-05-30
申请号:CN202011100208.2
申请日:2020-10-15
Applicant: 浙江工商大学 , 浙江小芃科技有限公司
IPC: G06T7/00 , G06N3/0464 , G06N3/08
-
公开(公告)号:CN111079516B
公开(公告)日:2022-12-20
申请号:CN201911050215.3
申请日:2019-10-31
Applicant: 浙江工商大学
Abstract: 本发明针对行人步态分割时对双腿间的“O型”形状难以分割以及腿型分割不够精细的问题,提出一种基于深度神经网络的行人步态分割方法。本发明通过设计空洞卷积残差卷积网络和添加边缘检测器分支两步实现对行人步态的精细分割;利用空洞卷积替换resnet最后阶段的普通卷积来提高浅层网络的感受野,得到更多信息的特征传入到下个阶段,最后得到的mask再输入至由边缘检测算子组成的边缘检测器中,很好地解决了行人步态中步态边缘不拟合的问题,从而得到更加精确的行人步态边缘,提高了腿部分割的精细度。
-
公开(公告)号:CN109886160B
公开(公告)日:2021-03-09
申请号:CN201910091792.0
申请日:2019-01-30
Applicant: 浙江工商大学
Inventor: 王慧燕
Abstract: 本发明提供一种非限定条件下的人脸识别方法,包括如下步骤:S1)图像预处理;S2)人脸特征提取;S3)SVD权值分解操作;S4)人脸识别网络前向传播;S5)人脸识别。本发明的优点为:算法中适当地增加inception结构,可增加网络的宽度和深度,使模型可以提取到不同尺度的、更丰富、更鲁棒的人脸特征。本发明的算法可以使用小规模的数据训练达到大规模数据下训练得到的模型的相差无几的识别效果。
-
公开(公告)号:CN106504190B
公开(公告)日:2019-09-13
申请号:CN201611243656.1
申请日:2016-12-29
Applicant: 浙江工商大学
Abstract: 本发明公开了一种基于3D卷积神经网络的立体视频生成方法,能将现有的2D视频源转换成能在3D立体显示设备上播放的立体视频。包括以下步骤:准备足够数量非动画3D电影作为训练数据,将3D视频源分离成左眼图像序列和右眼图像序列,删去片头、片尾及空白帧后,用模糊C均值聚类法对左眼图像序列进行镜头分割,并以镜头为单位组织训练文件,计算所有左眼图像序列的均值并将这些图像减去该均值,以右眼图像序列作为训练的目标。用这些训练数据训练所构造的3D卷积神经网络直到收敛。将需要转换成立体视频的2D视频源进行镜头分割并减去训练图像均值后输入到训练得到的3D卷积神经网络,将得到该2D视频的右眼视频图像序列,最终将两者合并成立体视频。
-
-
-
-
-
-
-
-
-