-
公开(公告)号:CN116228972A
公开(公告)日:2023-06-06
申请号:CN202310086735.X
申请日:2023-01-16
Applicant: 清华大学
IPC: G06T17/00 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种三维场景理解方法和装置,包括:获取三维场景下的目标三维点云图;对目标三维点云图进行体素化操作,得到目标三维点云图对应的体素特征;利用卷积神经网络对体素特征进行特征提取,得到目标三维点云图对应的三维场景特征;采用全连接层对三维场景特征进行变换,得到目标三维点云图的理解结果;其中,卷积神经网络,是在添加了长距离池化模块的稀疏卷积神经网络的基础上训练的。本发明长距离池化模块能够增大感受野并且引入更大的非线性操作,在增加极小参数量和计算量的前提下,提升网络的三维场景理解能力。
-
公开(公告)号:CN113821208B
公开(公告)日:2024-11-26
申请号:CN202110677399.7
申请日:2021-06-18
Applicant: 清华大学
Abstract: 本发明提供一种用于深度学习算子的编译优化方法及系统,该方法包括:根据线程调度算法,通过算子动态编译器,将元算子中各阶算子映射到对应的硬件线程;根据硬件线程的类型,按照编译优化策略,对映射到硬件线程的算子进行编译优化,得到编译优化后的算子;根据所述编译优化后的算子,编译得到可执行代码。本发明面向深度学习算子进行编译优化,能够极大的提高深度学习算子的性能,从而提高整个深度学习框架的整体性能。
-
公开(公告)号:CN113821208A
公开(公告)日:2021-12-21
申请号:CN202110677399.7
申请日:2021-06-18
Applicant: 清华大学
Abstract: 本发明提供一种用于深度学习算子的编译优化方法及系统,该方法包括:根据线程调度算法,通过算子动态编译器,将元算子中各阶算子映射到对应的硬件线程;根据硬件线程的类型,按照编译优化策略,对映射到硬件线程的算子进行编译优化,得到编译优化后的算子;根据所述编译优化后的算子,编译得到可执行代码。本发明面向深度学习算子进行编译优化,能够极大的提高深度学习算子的性能,从而提高整个深度学习框架的整体性能。
-
-