-
公开(公告)号:CN104077577A
公开(公告)日:2014-10-01
申请号:CN201410314802.X
申请日:2014-07-03
Applicant: 浙江大学
Abstract: 本发明公开了了一种基于卷积神经网络的商标检测方法。本发明首先收集多种类别的商标图片以及不包含商标的图片,并对包含商标的图片进行标注。然后初始化卷积神经网络,使用商标样本与非商标样本训练卷积神经网络。在测试图片过程中,首先使用目标区域选择方法选取测试图片中可能包含商标的候选窗口,并对候选窗口进行颜色空间转换和尺度缩放处理。然后将候选窗口输入到卷积神经网络中进行识别,并将识别为商标的候选窗口在测试图片中标示出来。本发明通过卷积神经网络将目标区域特征提取与识别相结合,避免特征设计带来的不确定性,并且对于旋转、平移、尺度变化有很好的不变性,基于分割的目标区域选择在提高检测速度的同时降低了误检率。
-
公开(公告)号:CN103826117A
公开(公告)日:2014-05-28
申请号:CN201410024087.6
申请日:2014-01-17
Applicant: 浙江大学
Abstract: 本发明公开了测量手机视频通讯应用端到端延时的方法。本发明首先在LCD显示器上生成并显示一段视觉编码时间戳序列视频。其次发送方手机和接收方手机通过视频通讯应用建立视频连接,然后发送方拍摄产生的视觉编码时间戳序列视频并发送给接收方,接收方在屏幕上显示包含视觉编码时间戳序列视频的通话内容。然后利用高清摄像机同时拍摄LCD显示器和接收方屏幕。最后将采集到的包含视觉编码时间戳的视频数据送入延时分析系统,识别每一帧上的时间戳并计算时间戳之间的时差,得到端到端延时。本发明从计算机视觉的角度出发,把延时测量问题转化成时间戳识别问题,操作流程简单,且避免了传统方法中不同时钟同步的难题,提高了延时检测的精确度。
-
公开(公告)号:CN102737122A
公开(公告)日:2012-10-17
申请号:CN201210192428.1
申请日:2012-06-08
Applicant: 浙江大学
Abstract: 本发明提供了一种提取网页中验证码图片的方法。由于验证码图片在网页中并没有一个固定的网址链接,并且图片随机生成,对其进行刷新或者保存操作会改变图片内容,因此提取验证码图片是很多需要验证码图片的软件应用的一个关键难题。在该方法中,利用光标位置、验证码输入框位置、图片位置、图片大小、图片视觉与内容特征、图片关键字、图片长宽比例等信息将网页中的验证码图片提取出来。
-
公开(公告)号:CN102509017A
公开(公告)日:2012-06-20
申请号:CN201110355293.1
申请日:2011-11-10
Applicant: 浙江大学
Abstract: 本发明公开了一种用计算机预测刨花板强度的方法。现有技术估计刨花板强度的方法是由经验丰富的工人通过观察板材表面碎木块的走向对板材进行检测,但这是个繁琐而又主观的过程。本发明通过对刨花板表面图像进行分析估计其静力弯曲强度,提供了一种计算机辅助的刨花板强度估计方法。本发明的方法由三个有效步骤组成:首先对刨花板的表面图像进行边缘检测,得到刨花碎料的边缘;其次对边缘图像进行霍夫线检测,得到直线边缘;最后对刨花板表面直线的长度和走向进行分析,从而估计刨花板的强度。本发明与通常的人工检测相比,能有效地提高生产效率,并提高对刨花板强度估计的精度,有效地降低了人工估计的主观不稳定性,同时大大减少了人工工作量。
-
公开(公告)号:CN100456326C
公开(公告)日:2009-01-28
申请号:CN200610053531.2
申请日:2006-09-22
Applicant: 浙江大学
Abstract: 本发明公开了一种人脸变老的图像处理方法。对人脸图像进行重采样,实现对老年人人脸的重建,并将年轻人重建的年老人图像由RGB空间转换到YUV空间;对人脸皱纹进行拉普拉斯建模;将建模结果应用于年轻人脸,并将结果由YUV空间转换为RGB空间。本方法通过拉普拉斯梯度场映射对皱纹建模,提取年长人脸的皱纹特征,较方便的实现逼真的年轻人脸变老处理,不受光照或图像亮度的影响。另外,本发明不需要一个人由年轻到年老的变化照片,数据获取方便。因此,通过本发明获得变老的人脸图像是一种低成本,快速的方法。
-
公开(公告)号:CN101000688A
公开(公告)日:2007-07-18
申请号:CN200710066716.1
申请日:2007-01-15
Applicant: 浙江大学
Abstract: 本发明公开了一种多张人脸照片自动合成方法。本发明的方法是通过特征点跟踪自动定位人脸的轮廓和五官,并依此将多张照片合成为一张。本发明在无人工辅助的情况下,对于每张输入照片,首先初步定位人脸在照片中的位置,再利用定位后的人脸全局和局部信息的多重约束,精确标记外轮廓和五官。在此基础上再对每张照片自动进行颜色调整,统一色彩。再通过变形算法和各像素颜色的插值合成,得到一张具有各输入照片特征,并且清晰、真实的人脸照片。本发明具有成功率高,硬件要求低,结果清晰自然等特点,可以满足在普通硬件上的应用要求。
-
公开(公告)号:CN101000687A
公开(公告)日:2007-07-18
申请号:CN200710066718.0
申请日:2007-01-15
Applicant: 浙江大学
IPC: G06T5/00
Abstract: 本发明公开了图像处理中一种基调平移和削弱图像噪声的快速处理方法。本发明的方法由三个步骤组成:首先对图像主区域进行基调向量的提取;其次根据目标基调向量和规约强度构建出规约函数;最后根据规约函数构建对应的偏移映射表,通过对原图像像素经查表偏移替换得到新的图像。通过对像素和平均基调的差异大小进行合理的划分,对不同段进行不同强度的规约,实现不同像素差异的分级,使此方法能够适应于不同强度噪声的削弱。根据映射函数构建对应的偏移映射表,使得指数函数的运算不需要实时重复进行,只需实时查表即可,处理速度达到常数级别。运用空间代价换取时间代价的原则,实现基调平移和削弱图像噪声的快速处理。
-
公开(公告)号:CN114330554B
公开(公告)日:2025-04-08
申请号:CN202111639661.5
申请日:2021-12-29
Applicant: 浙江大学
Abstract: 一种面向智能安防的视觉深度模型知识重组方法,首先,收集安防边缘测的视觉数据,明确模型任务,收集数据进行标注,训练目标任务模型。然后,利用归因图计算目标模型和不同预训练模型之间的可迁移分数,将归一化的可迁移分数作为模型选择的概率,可放回地采样形成模型集合;在联邦学习范式的基础上,将目标模型分发到不同的节点,利用表征蒸馏迁移预训练模型的特征提取能力,在目标模型学习和迁移完成后,通过平均的方式在中心节点进行知识重组,重组过后的模型再次分发到选择的模型节点进一步迭代。最后,再利用目标数据集进行微调目标模型,从而学习得到一个在智能安防领域的目标任务上表现良好的视觉深度模型,并且保护了数据隐私和模型隐私。
-
公开(公告)号:CN119446335A
公开(公告)日:2025-02-14
申请号:CN202411416119.7
申请日:2024-10-11
Applicant: 浙江大学
Abstract: 基于三元比较专业知识决策的药物‑靶标相互作用机制预测方法和系统,其方法包括:首先,对初始药物靶标作用机制数据进行预处理,得到药物分子、靶标蛋白的完整信息并筛选头部类和尾部类;然后,将原始的多分类长尾问题分解为多个简单的子任务,每个子任务包含两个原始类别及设计的通用类别#imgabs0#提出一训练策略,使用两个不同的编码器分别对药物分子和靶标蛋白进行编码,得到各自的嵌入向量;采用多个线性层构建预测模型,将得到的药物及蛋白质嵌入向量作为预测模型的输入,对于预测类别概率分数使用交叉熵分类损失函数进行自适应学习率优化算法优化模型参数,提出基于类别平衡的决策投票模块;最后通过训练得到药物‑靶标相互作用机制预测模型,用该模型对真实场景下药物‑靶标对进行相互作用机制预测任务。本发明能有效地解决呈现长尾分布的药物靶标作用机制预测问题。
-
公开(公告)号:CN119295841A
公开(公告)日:2025-01-10
申请号:CN202411818625.9
申请日:2024-12-11
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06V10/774 , G06N3/0464
Abstract: 基于时空分布变化的伪造图片鉴别方法和装置,其方法包括:步骤1:获取任务训练数据,将其划分为训练集和验证集;采用所述训练数据,使用去噪扩散隐式模型去噪采样过程获得相邻噪声图的时序变化数据;获得每个候选判别因子DFactor和时间序列数据#imgabs0#之间的距离,基于KL散度的损失函数从候选DFactor的集合#imgabs1#中获得固定长度为#imgabs2#的最佳DFactor判别因子;采用最佳DFactor判别因子将时序变化数据构建成有向加权的演化图#imgabs3#;采用有向加权的演化图,学习所述时间序列的特征表示;将特征表示与对应的真假标签作为输入,训练分类器,实现伪造图片鉴别。本发明在图片伪造鉴别领域引入时序信息,不依赖于预训练加噪模型,在实际应用场景中有很好的泛化能力。
-
-
-
-
-
-
-
-
-