-
公开(公告)号:CN115731543A
公开(公告)日:2023-03-03
申请号:CN202211496358.9
申请日:2022-11-24
Applicant: 浙江大学
IPC: G06V20/64 , G06V10/774 , G06V10/77
Abstract: 本发明公开了一种节约标注数据的点云3D物体检测方法,包括:(1)给定激光雷达点云,将激光雷达点云进行网格化,将得到的若干分布规则的柱子通过多层感知机,转化为每个柱子的特征向量;(2)将得到的柱子进行随机掩码,丢弃一部分柱子;(3)将未被丢弃的柱子输入编码器中;(4)将编码器输出的柱子输入到解码器中,恢复被丢弃的那部分柱子的特征;(5)通过恢复后的柱子特征进行重建,重建出每个柱子里面包含的点云,计算重建的点云与真实点云间的损失函数;(6)重复上述步骤,将预训练后的参数直接加载到3D物体检测模型中,使用少量有标注数据进行微调后进行应用。本发明可以在保证检测效率和精度的前提下,节约标注数据的数量。
-
公开(公告)号:CN113052031B
公开(公告)日:2022-08-09
申请号:CN202110276978.0
申请日:2021-03-15
Applicant: 浙江大学
IPC: G06V20/64 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种无需后处理操作的3D目标检测方法,包括:(1)初始化K个3D候选框和1个物体嵌入特征;(2)对输入的点云样本进行特征提取,得到点特征;(3)在点特征上提取K个3D候选框特征;(4)使用物体嵌入特征对3D候选框特征进行筛选和提取,得到K个特征;(5)使用自注意力模型让K个特征交换特征信息,得到K个提议特征;(6)根据提议特征预测K个预测结果,并与标注信息一对一匹配后训练;(7)用步骤(6)预测的K个预测结果的3D候选框替代步骤(1)的K个3D候选框,用步骤(5)得到的特征提议替代步骤(1)的物体嵌入;重复步骤(3)~(7)多次得到检测结果。本发明可以解决现有3D目标检测器存在冗余预测的问题。
-
公开(公告)号:CN114283161A
公开(公告)日:2022-04-05
申请号:CN202111589805.0
申请日:2021-12-23
Applicant: 浙江大学
Abstract: 本发明公开了一种基于子模函数的图‑图转化任务主动学习方法,包括:利用已有标签的图像局部区域集合训练一个图‑图转化任务的深度模型;利用训练好的模型提取图像上未标注的局部区域深度特征;针对提取的局部区域深度特征集合,进行衡量其代表性以及多样性的子模函数构建;优化求解子模函数最大化问题,得到本轮迭代选择的待标注图像局部区域集合;获得待标注图像局部区域的标签,将其添加到已有标签的图像局部区域集合中,再利用所有带标签数据集重新训练图‑图转化任务的深度模型;重复上述步骤,直至挑选的图像局部区域达到要求,得到最具有标注价值的局部区域。利用本发明,可以从未标注图像中挑选出更有标注价值的图像局部区域。
-
公开(公告)号:CN108804611B
公开(公告)日:2021-11-19
申请号:CN201810538126.2
申请日:2018-05-30
Applicant: 浙江大学
IPC: G06F16/332
Abstract: 本发明公开了一种基于自我评论序列学习的对话回复生成方法及系统,其中,对话回复生成方法包括以下步骤:(1)对当前对话的上下文语境进行建模,获得上下文语义向量;(2)根据上下文语义向量,建立基于自我评论序列学习的对话模型;(3)对对话模型进行训练和测试,分别得到训练奖励值和测试奖励值;(4)计算两个奖励值之间的差,通过计算策略梯度,优化对话模型;(5)对话模型训练完毕,输出对话回复。利用本发明,可以使得对话生成模型在训练过程中,能够朝着优化评判指标的方向生成更加有实质意义的回复,大幅度降低生成对话的不稳定性。
-
公开(公告)号:CN108170712B
公开(公告)日:2021-08-10
申请号:CN201711230595.X
申请日:2017-11-29
Applicant: 浙江大学
IPC: G06F16/9537 , G06Q50/00
Abstract: 本发明公开了一种利用包含社会地理信息的多媒体网络进行最大边界多媒体网络表达学习的方法。主要包括如下步骤:1)针对于一组社交网络用户及感兴趣地点和感兴趣地点的类别信息,构建包含用户、感兴趣地点和感兴趣地点类别信息之间相互关系的网络。2)卷积神经网络及单词映射网络获取感兴趣地点的综合表达,之后利用最大边界网络训练的方法结合用户及感兴趣地点的映射表达进行训练,得到令损失函数最小的用户及感兴趣地点的表达。相比于一般的用户可能感兴趣地点推荐解决方案,本发明利用了多媒体网络的特性及用户之间的相互关系与感兴趣地点的种类信息。本发明在用户可能感兴趣的地点的预测问题中所取得的效果相比于传统的方法更好。
-
公开(公告)号:CN108228833B
公开(公告)日:2021-08-03
申请号:CN201810008053.6
申请日:2018-01-04
Applicant: 浙江大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种利用用户倾向性学习解决社区项目推荐任务的方法。主要包括如下步骤:1)针对于社交网络中的项目,用户,生成项目的表达矩阵与拉普拉斯矩阵。利用每次收集的用户项目排名信息,迭代产生用户倾向性矩阵2)对于生成的用户倾向性矩阵与项目表达矩阵,产生对于用户的项目推荐。相比于一般的项目推荐解决方案,本发明使用了项目特征及用户之间的相互关系,同时迭代地使用多次用户对于项目的排序信息,则能够更准确地反映用户对于项目的排序特点,同时时间消耗低。本发明在社区项目推荐问题中所取得的效果相比于传统的方法更好。
-
公开(公告)号:CN112633382A
公开(公告)日:2021-04-09
申请号:CN202011561516.5
申请日:2020-12-25
Applicant: 浙江大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于互近邻的少样本图像分类方法及系统,其中,少样本图像分类方法包括:(1)神经网络模型前向推导查询图像和支持图像的视觉特征表示;(2)使用互近邻算法筛选少样本分类中与任务相关的局部特征描述符;(3)使用筛选得到的描述符计算查询图像和支持图像集中各类之间的相似度;(4)使用带有标签的图像数据集进行少样本任务划分后训练神经网络模型;(5)根据与支持图像集中各类之间的相似度进行排序,选取最大相似度的类作为该图像的类预测。利用本发明,可以使得少样本图像分类在训练过程中,排除大量来自背景的局部特征描述符对相似度计算的干扰,使得分类的结果更加鲁棒。
-
公开(公告)号:CN112633180A
公开(公告)日:2021-04-09
申请号:CN202011561521.6
申请日:2020-12-25
Applicant: 浙江大学
Abstract: 本发明公开了一种基于对偶记忆模块的视频异常检测方法及系统,其中,方法的步骤如下:(1)使用连续帧作为输入,利用卷积神经网络提取特征,获得问询向量;(2)使用正常/异常询向量和记忆向量作为输入,利用对偶记忆模块“读操作”,生成新的正常/异常特征;(3)利用判别器生成判别特征,利用生成器生成未来帧;(4)利用未来帧的预测损失和对偶记忆模块的稀疏程度计算异常得分。利用本发明,可以有效的解决视频异常检测中正负样本量极其不均衡的问题,并且能够生成具有判别性的特征空间。
-
公开(公告)号:CN112116030A
公开(公告)日:2020-12-22
申请号:CN202011091695.0
申请日:2020-10-13
Applicant: 浙江大学
Abstract: 本发明公开了一种基于向量标准化和知识蒸馏的图像分类方法,包括以下步骤:(1)构建并训练一个教师模型,所述教师模型采用深度卷积神经网络;(2)构建一个比教师模型小的学生模型,所述学生模型也采用深度卷积神经网络;(3)使用蒸馏损失函数对学生模型进行训练,在训练过程中,对学生模型和教师模型输出的概率编码向量进行标准化;(4)将待分类的图像输入训练好的学生模型,进行分类预测。利用本发明,能够在不引入额外参数及计算开销的情况下,提升学生网络的性能,提高图像分类精度。
-
公开(公告)号:CN108763504B
公开(公告)日:2020-07-24
申请号:CN201810539095.2
申请日:2018-05-30
Applicant: 浙江大学
IPC: G06F16/332 , G06F40/30
Abstract: 本发明公开了一种基于强化双通道序列学习的对话回复生成方法及系统,本发明方法的步骤如下:(1)对上下文进行建模,获取上下文语义向量;(2)利用编码器将当前对话和上下文语义向量结合学习,得到当前对话向量以及编码器向量;(3)将上下文语义向量和当前对话向量输入解码器,得到第一通道对话回复草稿以及解码器向量;(4)将编码器向量与解码器向量以及第一通道对话回复草稿输入润饰器进行润饰,生成第二通道经过润饰的对话回复;(5)利用强化学习算法优化目标函数;(6)模型训练完毕,生成对话回复并输出。利用本发明,可以使对话生成模型对全局信息的把握更加深入,生成更加符合对话场景的有实质性内容的回复。
-
-
-
-
-
-
-
-
-