-
公开(公告)号:CN109872366B
公开(公告)日:2021-03-12
申请号:CN201910138684.4
申请日:2019-02-25
Applicant: 清华大学
Abstract: 本发明提出一种基于深度拟合程度评估网络的物体三维位置检测方法和装置,其中,方法包括:对第一原始图片进行二维物体检测,确定图片中包含物体的检测框,将截取的各个检测框对应的图像块分别输入基于锚点的回归模型中,确定各个物体对应的朝向和三维尺寸,进而采用紧凑性约束方法确定各个物体对应的三维长方体的基准位置,并通过高斯稠密采样获取每个物体对应的至少两个候选三维长方体,并投影至图片中获取对应的至少两个投影三维长方体,将获取的至少两个投影三维长方体通过深度拟合程度评估网络,确定三维覆盖率最大值对应的投影三维长方体为每个物体对应的目标三维长方体,从而确定物体的三维空间位置,提高了物体三维空间位置确定的准确度。
-
公开(公告)号:CN109999320B
公开(公告)日:2020-12-29
申请号:CN201910363538.1
申请日:2019-04-30
Applicant: 清华大学
IPC: A61M25/082
Abstract: 本发明提出一种用于血管介入手术的导管推送装置和方法,其中,装置包括:底座、导管、带有平衡配重的摇篮式旋转支架、第一固定支架、第二固定支架、第一空心轴、第二空心轴、第一电机、联轴器、血液防溅盖、直线驱动部件和可拆卸滚轮部件,其中,血液防溅盖通过可拆卸滚轮部件上表面的盖槽安装于可拆卸滚轮部件的上表面;直线驱动部件通过直线驱动部件上的底板固定连接在摇篮式旋转支架上,伴随摇篮式旋转支架一同旋转,直线驱动部件与血液防溅盖隔开,以使血液防溅盖和隔离结构之间形成封闭空间;实现了防止在导管运动中将血液飞溅到推送装置的其它部位,减少每次手术需要消毒和更换的零部件,降低使用成本。
-
公开(公告)号:CN109887075B
公开(公告)日:2020-12-15
申请号:CN201910125766.5
申请日:2019-02-20
Applicant: 清华大学
Abstract: 本申请提出用于三维模型构建的三维点云模型训练方法和装置,其中,方法包括:获取训练集合,将训练集合中每组三维点云数据划分为第一集合和第二集合,将第一集合中的点数据输入预设三维点云模型得到第一预测集合,将第一预测集合中的预测点数据输入同一个模型得到第二预测集合,根据预设的第一损失函数获取第一损失函数值,根据预设的第二损失函数获取第二损失函数值,对第一损失函数值和第二损失函数值计算获取每组点云数据对应的第三损失函数值,根据多组三维点云数据对应的多个第三损失函数值训练预设三维点云模型,以便于根据训练后的预设三维点云模型进行三维模型的构建。由此,训练后的预设三维点云模型提高了点云数据特征学习的效果。
-
公开(公告)号:CN108399211B
公开(公告)日:2020-11-24
申请号:CN201810106624.X
申请日:2018-02-02
Applicant: 清华大学
IPC: G06F16/583 , G06K9/62
Abstract: 本发明公开了一种基于二值特征的大规模图像检索算法,方法包括以下步骤:步骤S1:初始化神经网络参数,并根据训练图片集初始化实值输出特征;步骤S2:根据训练图片集构建图片相似度矩阵,并构建拉普拉斯矩阵;步骤S3:通过加权相似度度量构建损失函数;步骤S4:通过损失函数对实值输出特征求导,固定差异量更新实值输出特征,同时更新网络参数;步骤S5:通过损失函数对差异量求导,固定实值输出特征更新差异量;步骤S6:增大高阶展开权重,并依照步骤S3与步骤S4且结合损失函数持续更新实值输出特征与网络参数,直到训练结束。该方法可以有效补偿输入数据对中的正负训练样本不平衡带来的问题,有效提高检索精度。
-
公开(公告)号:CN109446897B
公开(公告)日:2020-10-27
申请号:CN201811091826.8
申请日:2018-09-19
Applicant: 清华大学
Abstract: 本发明提出了一种基于图像上下文信息的场景识别方法及系统,其中,该方法包括以下步骤:将预设图像划分为多个图像块,以提取每个图像块的图像块特征;根据每个图像块的图像块特征通过显著性模块生成序列信息,以得到图像块在语义上的相关关系;根据图像块在语义上的相关关系对每个图像块及其上下文信息进行编码,以得到上下文信息特征;以及获取全局表观信息,并根据全局表观信息和上下文信息特征得到特征表达信息,以得到场景识别结果。该方法能够充分利用图像上下文信息,将场景中物体特征与其上下文的特征进行场景识别,从而提高图像的特征表达能力。
-
公开(公告)号:CN111784121A
公开(公告)日:2020-10-16
申请号:CN202010535420.5
申请日:2020-06-12
Applicant: 清华大学
Abstract: 本发明公开了一种基于不确定性分数分布学习的动作质量评价方法,包括:以分数标签为均值,生成高斯分布作为监督信号;将动作视频送入到3D神经网络中来预测分数标签;通过优化预测分数标签和监督信号之间的KL散度来优化网络;将测试视频输入优化后的预测视频分数模型中,选取概率值最大的分数作为最终预测分数。该方法可以更好的描述动作质量分数的概率,解决解决动作质量评价分数标签中的歧义性问题。
-
公开(公告)号:CN109902729B
公开(公告)日:2020-10-16
申请号:CN201910119828.1
申请日:2019-02-18
Applicant: 清华大学
IPC: G06K9/62
Abstract: 本申请提出一种基于序列状态演进的行为预测方法及装置,其中,方法包括:获取当前周期的人体动作序列;将人体动作序列输入到预设的预测网络,得到多个预测动作的多个置信度,并从多个预测动作中筛选出多个候选预测动作;将多个候选预测动作中每个候选预测动作对应的类别标签和人体动作序列输入预设动作预测模型的生成器网络,生成多个第一候选动作序列;将每个候选预测动作对应的第一候选动作序列拼接在人体动作序列之后,生成多个第二候选动作序列;根据预设的真实度判断模型对多个第二候选动作序列的真实度进行判断,将目标动作序列确定为下一个周期的预测人体动作序列。由此,通过该方法进行行为预测时提升了行为预测的性能。
-
公开(公告)号:CN111754399A
公开(公告)日:2020-10-09
申请号:CN202010479674.X
申请日:2020-05-29
Applicant: 清华大学
Abstract: 本发明公开了一种基于梯度的保持几何结构的图像超分辨率方法,包括以下步骤:将低清图片输入生成网络,其中,生成网络包括超分分支和梯度分支,两个分支分别对输入的低清图像进行特征提取,梯度分支会将超分分支的部分中间特征作为输入,进行梯度的重建;之后将重建后的梯度特征输送回超分分支,使超分分支掌握梯度的相关信息。最后对于生成的梯度图和超分图片,利用提出的梯度目标方程,对生成网络进行约束和优化,最终训练的模型即可生成保持几何结构的清晰图片。该方法既能保持生成图像的几何结构又能保证图像修复的清晰程度。
-
公开(公告)号:CN108596013B
公开(公告)日:2020-08-28
申请号:CN201810083595.X
申请日:2018-01-29
Applicant: 清华大学
Abstract: 本发明公开了一种基于多粒度深度特征学习的行人检测方法及装置,其中,方法包括:将输入图像传输至细粒度深度特征生成网络和检测网络;通过细粒度深度特征生成网络生成行人解析图,以得到细粒度深度特征,并通过检测网络得到检测特征;对细粒度深度特征和检测特征进行元积,以显著化行人区域的特征和平滑背景区域的特征,并获取多粒度深度特征;根据多粒度深度特征得到行人检测结果。该方法通过使用不同分辨率的特征和引入细粒度特征,有效提高检测的精度和性能。
-
公开(公告)号:CN108446619B
公开(公告)日:2020-08-28
申请号:CN201810199909.2
申请日:2018-03-12
Applicant: 清华大学
IPC: G06K9/00
Abstract: 本发明公开了一种基于深度强化学习的人脸关键点检测方法及装置,其中,方法包括以下步骤:通过马尔科夫决策过程对人脸关键点检测问题进行数学建模;通过形状推测网络得到一个初始形状,将其通过k近邻,获取该形状候选子集;通过形状决策网络对形状候选子集中每个候选形状进行评价,并获取分数最高的形状;将形状推断网络和形状决策网络通过策略梯度同时优化,获取最终推断决策网络结构,以得到人脸关键点。该方法通过推断决策的框架,能够在形状连续空间中,找到一条最优的形状搜索路径,以最大化形状评价分数,从而有效提高人脸关键点检测的准确性和可靠性。
-
-
-
-
-
-
-
-
-