-
公开(公告)号:CN112101083B
公开(公告)日:2024-09-24
申请号:CN202010524624.9
申请日:2020-06-10
Applicant: 辉达公司
IPC: G06V40/10 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了使用一个或更多个神经网络进行弱监督的对象检测,具体公开了用于检测图像中的对象的装置、系统和技术,包括这些对象的数字表示。在至少一个实施例中,至少部分地基于与所述一个或更多个对象相对应的一个或更多个伪标签来检测图像中的一个或更多个对象。
-
公开(公告)号:CN117953092A
公开(公告)日:2024-04-30
申请号:CN202410048693.5
申请日:2018-11-15
Applicant: 辉达公司
Abstract: 公开了一种方法、计算机可读介质和系统,用于利用表示场景内不同种类的特定像素的映射来创建图像。一个或更多个计算系统使用该映射来创建初步图像。然后将该初步图像与用于创建映射的原始图像进行比较。确定初步图像是否与原始图像匹配,并且确定结果用于调整创建初步图像的计算系统,这改善了这种计算系统的性能。然后,调整后的计算系统用于基于表示场景内特定像素的各种对象种类的不同输入映射来创建图像。
-
公开(公告)号:CN115731607A
公开(公告)日:2023-03-03
申请号:CN202210679721.4
申请日:2022-06-15
Applicant: 辉达公司
IPC: G06V40/20
Abstract: 本发明涉及对铰接式对象执行遮挡感知全局3D姿势和形状估计。为了确定视频内对象的准确3维(3D)模型,首先在视频内识别和追踪对象,并估计这些被追踪对象的姿势和形状。从被追踪对象中去除平移和全局定向以确定对象的局部运动,并执行运动填充以填充视频内对象的任何缺失部分。然后为视频内的对象确定全局轨迹,然后使用填充运动和全局轨迹来确定视频内对象的填充全局运动。这可以使得每个对象的准确描述能够作为该模型的3D姿势序列,该模型考虑了视频内的遮挡和全局因素。
-
公开(公告)号:CN114787879A
公开(公告)日:2022-07-22
申请号:CN202080078653.5
申请日:2020-11-17
Applicant: 辉达公司
IPC: G06V10/774 , G06V10/776 , G06V10/764 , G06V10/24 , G06V10/44 , G06V10/82 , G06V20/56
Abstract: 用于识别图像中对象的方向的装置、系统和技术。在至少一个实施例中,一个或更多个神经网络被训练以至少部分地基于除了一个或更多个对象的方向之外的该对象的一个或更多个特征来识别该对象的方向。
-
公开(公告)号:CN114255356A
公开(公告)日:2022-03-29
申请号:CN202111056375.6
申请日:2021-09-09
Applicant: 辉达公司
Abstract: 公开了学习和传播视觉属性。本发明的一个实施例提出了一种用于执行空间传播的技术。该技术包括通过经由沿第一方向的有向边连接包括在非结构化点集合中的空间上相邻的点来生成第一有向无环图(DAG)。该技术还包括将第一组神经网络层应用于与该非结构化点集合相关联的一个或更多个图像以生成(i)非结构化点集合的特征集合和(ii)由有向边连接的空间上相邻的点之间的逐对相关度集合。该技术还包括通过基于逐对相关度集合跨第一DAG传播特征集合来生成用于非结构化点集合的标签集合。
-
公开(公告)号:CN112801125A
公开(公告)日:2021-05-14
申请号:CN202011270628.5
申请日:2020-11-13
Applicant: 辉达公司
Abstract: 公开了合成用于训练一个或更多个神经网络的数据。提出了用于生成对进一步训练神经网络有用的数据的设备、系统和技术。在至少一个实施例中,可以至少部分地基于由一个或更多个神经网络生成的数据,包括先前用于训练所述一个或更多个神经网络的数据,来重新训练所述一个或更多个神经网络。
-
公开(公告)号:CN110880203A
公开(公告)日:2020-03-13
申请号:CN201910826859.0
申请日:2019-09-03
Applicant: 辉达公司
Abstract: 本发明公开了场景中对象的联合合成和放置。具体地,一种方法的一个实施例包括:将第一生成器模型应用于图像的语义表示以生成仿射变换,其中仿射变换表示与图像内的至少一个区域相关联的边界框。该方法还包括:将第二生成器模型应用于仿射变换和语义表示以生成对象的形状。该方法还包括基于边界框和形状将对象插入到图像中。
-
公开(公告)号:CN112633463B
公开(公告)日:2024-09-27
申请号:CN202011011935.1
申请日:2020-09-22
Applicant: 辉达公司
IPC: G06N3/0442 , G06N3/0464 , G06N3/084 , G06N3/088
Abstract: 本发明公开了用于建模序列数据中长期依赖性的双重循环神经网络递归神经网络架构。学习环境的动态变化并预测将来的后果是一项最新的技术进步,其可以应用于视频预测,语音识别以及其他应用。通常,机器学习(例如深度学习模型,神经网络或其他人工智能算法)用于进行预测。但是,当前用于进行预测的人工智能算法通常仅限于进行短期未来预测,这主要是由于以下原因:1)高维视频数据中存在复杂的动态变化;2)随时间传播的预测误差;以及3)未来的内在不确定性。本公开通过提供双重(即,两部分)递归神经网络架构,使得能够建模用于进行长期预测的序列数据中的长期依赖性。
-
-
公开(公告)号:CN118043843A
公开(公告)日:2024-05-14
申请号:CN202380013445.0
申请日:2023-03-08
Applicant: 辉达公司
IPC: G06T3/4038
Abstract: 在各个示例中,状态机用于在默认接缝布置或避开显著区域的动态接缝布置之间进行选择,并且基于自我运动的速度、自我运动的方向、与显著对象的接近度、活动视窗、驾驶员注视和/或其他因素来启用和禁用动态接缝布置。可以对齐表示环境的重叠视图的图像以创建具有图像数据的重叠区域的对齐的合成图像或表面(例如,全景、360°图像、碗形表面),并且可以基于驾驶场景(例如,驾驶方向、速度、与附近对象的接近度)选择默认接缝布置或动态接缝布置。因此,接缝可以被定位在图像数据的重叠区域中,并且图像数据可以在接缝处被混合以创建拼接的图像或表面(例如,拼接的全景图、拼接的360°图像、拼接的纹理化表面)。
-
-
-
-
-
-
-
-
-