-
公开(公告)号:CN115761453A
公开(公告)日:2023-03-07
申请号:CN202211285599.9
申请日:2022-10-20
Applicant: 浙江大学
IPC: G06V20/00 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N5/04
Abstract: 一种面向电力巡检场景的基于特征匹配的轻量化单样本目标检测方法,包括下列步骤:1)基于掩码的基类别目标检测模型训练;2)新类别标注样本的数据增强;3)新类别标注样本的特征提取;4)模型在测试数据上的初步推理;5)使用传统特征修正推理结果。通过上述步骤,本发明实现了在每个类别标注样本极其稀少情况下(1个)的目标检测,并克服了传统单样本目标检测中依赖于测试图像类别先验知识的问题,同时还使用神经架构搜索,在尽量保持模型性能的同时减少模型的参数量。
-
公开(公告)号:CN114827142B
公开(公告)日:2023-02-28
申请号:CN202210374826.9
申请日:2022-04-11
Applicant: 浙江大学
IPC: H04L67/10 , H04L67/1074 , H04L67/61 , H04L67/63
Abstract: 一种确保容器化边缘服务请求实时性的调度方法,包括:(1)构建以减少服务的截止期错过率和有限开销为条件的最优化问题;(2)建立一个离线模型;(3)提出一种基于的轻量级在线调度算法,以快速提供请求级的执行计划;(4)提出一种瓶颈资源感知的渐进资源分配机制,提高自动扩展周期中的资源效率;(5)提出一个提供解决方案的算法,利用启发式算法在短时间内给出了一个次优但可接受的解决方案。本发明显著降低了请求截止期错失率,同时产生的开销是可接受的。
-
公开(公告)号:CN112069199B
公开(公告)日:2022-08-05
申请号:CN202010842798.X
申请日:2020-08-20
Applicant: 浙江大学
IPC: G06F16/242 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于中间语法树的多轮自然语言转SQL方法。为解决传统端到端方法存在自然语言和SQL间的语义代沟,忽略了SQL内在的语法逻辑等问题,本发明设计了一种类SQL的中间语法树文法,以非端到端的方式,采用编码‑解码架构的语法神经网络,在轮次维度上迭代,按照语法树逻辑由粗到细的两阶段生成每一轮的中间语法树,并在后处理阶段推理生成SQL。应对多轮会话间语义依赖导致生成SQL局部重叠现象,本发明提出了对历史生成SQL的复用策略,进一步地提高了转化准确率。本发明在智能数据库系统等场景中具有广泛的应用前景。
-
公开(公告)号:CN114359908A
公开(公告)日:2022-04-15
申请号:CN202111550512.1
申请日:2021-12-17
Applicant: 浙江大学
IPC: G06V30/148 , G06V30/16
Abstract: 本发明涉及基于像素点级注意力机制的商品图片可读文字甄别方法,包括:通过OCR技术获取商品图片的文字块坐标及文字内容;通过像素点级注意力机制获取文字块的可读置信度;通过自适应阈值和各文字块的可读置信度进行可读文字筛选,改进了现有技术中,利用预训练语言模型对文字块进行筛选时,受到语料库限制造成的矫正结果单一的问题,从而提高了筛选的准确度。
-
公开(公告)号:CN110097084B
公开(公告)日:2021-08-31
申请号:CN201910264911.8
申请日:2019-04-03
Applicant: 浙江大学
Abstract: 通过投射特征训练多任务学生网络的知识融合方法,由以下步骤组成:首先初始化TargetNet(目标学生网络)的结构与教师网络相同,通过通道编码,将TargetNet中融合的特征图投射为对应任务的特征图;逐个训练TargetNet中与教师网络对应的block,得到融合的特征图;确定TargetNet中不同任务开始分支的各自位置;将教师网络中的对应block加入学生网络,作为不同任务的分支,并移除TargetNet中末端的block,得到TargetNet最终结构;最后调优学生网络。本方法能够使用无标签数据集,融合多个不同任务的教师网络,得到性能优越的轻量级学生网络。
-
公开(公告)号:CN111160124A
公开(公告)日:2020-05-15
申请号:CN201911265084.0
申请日:2019-12-11
Applicant: 浙江大学
Abstract: 一种基于知识重组的深度模型定制方法,包括:1)收集已有训练好的深度人脸属性识别模型,构建人脸属性识别模型库,将各类模型进行分组归类;2)根据当前对人脸属性识别的任务需求,将目标任务分解为一系列识别不同人脸属性的“组件任务”,并从深度模型库中选择相关的模型;3)对选中的人脸属性识别模型,进行知识过滤,将多个深度模型中,与“组件任务”相关的知识合并到“组件网络”中;4)对“组件网络”进行组合,得到最终的“目标网络”。本发明利用现有深度模型的知识,逐过程指导新模型的学习,有效减少对数据标注、数据量的依赖,降低训练新深度模型耗费的周期和资源。
-
公开(公告)号:CN109614968A
公开(公告)日:2019-04-12
申请号:CN201811176340.4
申请日:2018-10-10
Applicant: 浙江大学
Abstract: 一种基于多尺度混合图像风格化的车牌检测场景图片生成方法,包括:1)收集不同场景下的包含车牌的图片,这里的不同场景包含白天、傍晚、雨天、雪天、阴天和晴天共6个场景;2)划分源域图像和目标域图像,选取难以采集的场景作为目标域,比较容易的场景作为源域;3)对于每一个源-目标域场景对,将源域划分训练集和测试集,将训练集和具有代表性的目标域图片一起输入给多尺度混合图像风格化模型MSST并进行训练;4)测试阶段,将源域中测试集的图片输入MSST模型生成内容接近源域且场景风格接近目标域的图片。
-
公开(公告)号:CN106936964A
公开(公告)日:2017-07-07
申请号:CN201611152386.3
申请日:2016-12-14
Applicant: 浙江大学
IPC: H04M1/24 , G06K9/62 , G06K9/40 , G01N21/958 , G01N21/88
Abstract: 一种基于霍夫变换模板匹配的手机屏幕角点检测的方法,包括:1)利用图像的形态学变换对手机屏幕区域进行预处理,消除噪声、摩尔纹等干扰信号;2)对步骤1)中所得图片缩小到一定的尺度,通过边缘检测算法找出图片中存在的边界,利用霍夫变换对边界进行投票,得到图片中存在的直线段,从直线段集合中选择最合适的四条线段,使得四条线段所在的直线能够围成一个四边形的屏幕区域;3)对步骤2)中所得的四边形区域,利用该四边形的四个夹角自适应地产生角点模板,用该模板在四边形的四个顶点附近区域内进一步精确定位,并得到最终的屏幕区域检测结果。
-
公开(公告)号:CN103559196B
公开(公告)日:2017-02-22
申请号:CN201310438216.1
申请日:2013-09-23
Applicant: 浙江大学
Abstract: 基于多核典型相关分析的视频检索方法,从互联网上抓取视频及对应的文本描述后,针对每个视频进行如下操作:首先根据镜头是否突变对视频进行切分,抽取其关键帧,并提取关键帧中的视觉特征和镜头的运动特征构成视频特征向量,针对每个视频的文本描述提取词频特征;然后利用多核典型相关分析方法得到视频特征和词频特征的映射矩阵及其低维表示,使它们在低维空间的相关性最大;最后,当用户输入关键词做视频检索时,根据词频特征的映射矩阵得到关键词词频特征的低维表示,按照其与视频特征低维表示的余弦相似度由大到小依次返回视频检索结果。本方法的优点在于:增强视频内容和检索关键词的相关程度,提高用户的检索精度。
-
公开(公告)号:CN104636727A
公开(公告)日:2015-05-20
申请号:CN201510063018.0
申请日:2015-02-08
Applicant: 浙江大学
IPC: G06K9/00
CPC classification number: G06K9/00228 , G06K9/00248
Abstract: 本发明提供了一种适应多表情多姿态的人脸识别方法。本发明首先对输入的人脸照片做人脸检测,在人脸区域和数据集或者视频中的人脸区域做特征点的检测,得到每个图片特征点的集合。然后对于要进行匹配的人脸图片,将他们对应的特征点集合进行拟合,得到拟合参数;最后利用得到的拟合参数,生成新的匹配图片,对其进行填充调整,进行特征提取以及相似度的匹配。本发明无需估计人脸具体的姿态角度下,局部特征的提取和比对更加精确了,识别率也提高。
-
-
-
-
-
-
-
-
-