三维数字内容生成方法、装置、系统、设备、介质及产品

    公开(公告)号:CN119445006A

    公开(公告)日:2025-02-14

    申请号:CN202510046218.9

    申请日:2025-01-13

    Abstract: 本发明公开了一种三维数字内容生成方法、装置、系统、设备、介质及产品,应用于三维数据处理技术领域。其中,方法包括通过将不同数据格式的三维网络模型数据和目标三维数据统一在同一坐标系下的方式,生成异构三维数据,并采用目标数据结构进行表示。从图像采集设备观察位置沿渲染像素的观察方向投射光线,并按照预设光线参数沿着光线采样;根据采样点与三维网络模型数据、目标三维数据的空间位置关系确定采样点的颜色值,根据各采样点的颜色值确定渲染像素的颜色,根据各渲染像素生成三维数字内容。本发明可以解决依赖手工创建三维数字内容存在的高成本问题,能够统一处理异构三维数据,实现高效且低成本地生成三维数字内容。

    一种神经网络的剪枝方法、装置、设备及存储介质

    公开(公告)号:CN113705775B

    公开(公告)日:2024-10-01

    申请号:CN202110866324.3

    申请日:2021-07-29

    Abstract: 本发明公开了一种神经网络的剪枝方法、装置、设备及存储介质;本方案对神经网络进行剪枝时,可将待剪枝网络层作为目标网络层进行通道剪枝及卷积核重构,因此,本方案对多分支结构进行压缩时,并不仅仅局限于中间层,还可对输入层、输出层、下采样层等等网络层进行压缩,大大提升了神经网络的压缩比,减少神经网络模型执行任务所需要的计算量,加快神经网络的任务处理速度;并且,本方案为数据无关的异步通道剪枝方法,有利于保持压缩后神经网络的鲁棒性,还能够在神经网络的不同网络层实现不同稀疏粒度的剪枝,提高压缩的灵活性。

    异构计算平台及其任务仿真与耗时预测方法、装置、设备

    公开(公告)号:CN117971630B

    公开(公告)日:2024-06-28

    申请号:CN202410382408.3

    申请日:2024-04-01

    Abstract: 本发明公开了一种异构计算平台及其任务仿真与耗时预测方法、装置、设备,应用于异构计算领域。其中,方法包括获取异构计算平台采用层间并行方式执行目标任务的任务配置信息;调用预先构建的子任务训练耗时确定模型,根据任务配置信息中的目标任务特征确定各目标算力的子任务训练耗时信息。根据各目标算力的子任务训练耗时信息、任务配置信息中各子任务对应的目标算力及相应处理顺序,对采用层间并行方式执行目标任务的过程进行仿真,最后根据仿真结果确定目标任务的训练耗时预测结果。本发明可以解决相关技术并行训练任务的训练耗时无法精准预测的问题,能够实现精准预测层间并行训练任务的训练耗时。

    基于异构数据的设备分簇方法、装置、设备、系统及介质

    公开(公告)号:CN117806838B

    公开(公告)日:2024-06-04

    申请号:CN202410230125.7

    申请日:2024-02-29

    Abstract: 本发明提供基于异构数据的设备分簇方法、装置、设备、系统及介质,涉及计算机技术领域,首先可将多个边缘设备划分至多个设备簇,以便各边缘设备对机器学习模型进行层级联邦训练;同时,在分簇过程中,本发明可确定各边缘设备本地的机器学习模型对同一测试数据集的推理结果,并可基于该推理结果确定各边缘设备间的训练数据相似度;进而,可利用各训练数据相似度将各边缘设备划分至多个设备簇,即可在分簇过程中考虑数据异构的特点和分布情况,并将拥有相似数据的设备放在同一簇中,从而可提高簇内数据的相似性。这样,在各边缘设备进行层级联邦训练时,可确保相近的机器学习模型参数先聚合,可确保全局模型更快收敛,并可提升联邦学习效率。

    一种任务分配方法、装置及电子设备和存储介质

    公开(公告)号:CN117806835B

    公开(公告)日:2024-06-04

    申请号:CN202410224929.6

    申请日:2024-02-29

    Abstract: 本申请公开了一种任务分配方法、装置及电子设备和存储介质,涉及计算机技术领域,该方法包括:获取分布式训练的物理节点集合、数据源集合、神经网络模型、事件树集合;确定多个事件树的总能耗,选择总能耗最小的事件树作为目标事件树;以最小化训练能耗为目标确定目标事件树的目标事件或数据源分配策略;其中,目标事件或数据源分配策略用于描述处理目标事件树中事件的物理节点或数据源分配的物理节点,训练能耗包括物理节点处理事件的能耗、不同事件之间的数据传输能耗;基于目标事件或数据源分配策略将数据源和目标事件树中的事件部署于对应的物理节点。本申请降低了分布式训练神经网络模型的能耗。

    动作识别及其模型训练方法、装置、电子设备、存储介质

    公开(公告)号:CN117877125A

    公开(公告)日:2024-04-12

    申请号:CN202410270243.0

    申请日:2024-03-11

    Abstract: 本发明公开了一种动作识别及其模型训练方法、装置、电子设备、存储介质,应用于视频理解技术领域。其中,方法包括将具有动作标签和音频数据的视频样本输入动作识别模型,提取视频样本的视觉特征、文本语义特征及音频特征,对视觉特征、音频特征进行视觉交互和视听交互,并为文本语义特征添加交互特征,得到多模态动作标签特征;根据视觉交互特征、视听交互特征、音频特征与多模态动作标签特征之间的损失,对动作识别模型进行迭代更新。本发明可以解决相关技术精细动作识别差且动作识别任务收敛慢的问题,能够使得动作识别模型更全面地理解和描述精细动作特征,提高动作识别的性能和鲁棒性,还能增强模型扩展性和灵活性。

    视觉定位方法、装置、设备及介质

    公开(公告)号:CN117876651A

    公开(公告)日:2024-04-12

    申请号:CN202410281924.7

    申请日:2024-03-13

    Abstract: 本发明涉及人工智能技术领域,公开了一种视觉定位方法、装置、设备及介质,包括:从输入图像中提取元素属性特征并输入到关联提取网络,得到元素关系特征和元素索引库;将元素关系特征和元素属性特征进行拼接,得到元素第一综合特征;从输入文本中获取文本编码特征并与元素第一综合特征进行跨模态编码,提取元素第二综合特征;对元素第二综合特征与元素索引库进行溯源编码,得到视觉溯源特征;将视觉溯源特征和文本编码特征拼接成多模态溯源特征,经定位解码器处理后输出从输入图像中定位的导致输入文本事件发生的对应元素位置。这样能够根据视觉要素和关系进行视觉因果溯源的综合推理,从而推理出人类需求在视觉上的体现,得到准确的定位结果。

Patent Agency Ranking