-
公开(公告)号:CN114074331A
公开(公告)日:2022-02-22
申请号:CN202210060705.7
申请日:2022-01-19
申请人: 成都考拉悠然科技有限公司
摘要: 本发明公开了一种基于视觉的无序抓取方法及机器人,该方法包括:为标准工件模型设置抓取点;扫描待抓取工件的点云信息,识别待抓取工件的位置和姿态;判断工件抓取点的位置并进行抓取。本发明首先对标准工件模型进行六面封装,并对每一个面都选取抓取点,在点云识别后只需要获取工件的位置和姿态就能找到抓取点,提高了抓取的效率。另外在抓取之前还对抓取路径与边框和其他工件是否有干涉进行判断,从而提高了抓取的成功率。
-
公开(公告)号:CN113283400A
公开(公告)日:2021-08-20
申请号:CN202110812098.0
申请日:2021-07-19
申请人: 成都考拉悠然科技有限公司
摘要: 本发明提出了一种基于选择性超图卷积网络的骨架动作识别方法;通过设计一个全新的选择性超图卷积网络,在选择性超图卷积网络中适应性地提取骨架中的多尺度信息和选择性地聚合时序关键帧特征;在选择性超图卷积网络中主要表现为:将骨架表示成超图结构来建模关节点之间的高阶关系而不破外固有的空间位置属性;采用尺度选择超图卷积来充分提取多尺度信息和选择性融合多个尺度的特征;以及采用帧选择时间卷积来代替传统的步长时间卷积,根据帧的重要性自适应地选择关键帧和过滤冗余帧。从而实现了对节点间的高阶关系的重视处理、对多尺度信息的充分融合以及在减少冗余的过程中对关键帧信息进行筛选保留,从而实现了更高效且更高精度的骨架动作识别。
-
公开(公告)号:CN113255832A
公开(公告)日:2021-08-13
申请号:CN202110697276.X
申请日:2021-06-23
申请人: 成都考拉悠然科技有限公司
摘要: 本发明属于计算机视觉领域,提出一种双分支多中心的长尾分布识别的方法,用于解决长尾分布数据集带来的问题。将图片输入默认分支和重采样分支进行数据增强后输入深度卷积神经网络得到低维特征表示;再经过全连接层得到属于每个类别概率,乘以一个表示多中心的矩阵得到特征矩阵并取最大值,得到最终属于每个类别的概率;分别计算损失;相加得到最终的损失,依据损失对网络进行反向传播并更新权重;不断地迭代;当需要进行识别任务时,将图片输入重采样分支,得到图片属于各个类别的概率。通过双分支多中心能减轻重采样带来的数据分布变化带来的影响,可进一步处理长尾分布带来的影响,带来更好的识别分类效果,并且模型拥有更好的泛化能力。
-
公开(公告)号:CN113255570A
公开(公告)日:2021-08-13
申请号:CN202110659154.1
申请日:2021-06-15
申请人: 成都考拉悠然科技有限公司
摘要: 本发明涉及视频理解领域,具体是一种感知视频片段关系的时序动作检测方法,包括如下步骤:步骤S1:对视频进行采样;步骤S2:对视频进行初步的特征提取;步骤S3:对提取的特征进行特征增强,产生时序节点的边界预测,此外,还会抽取所有候选视频段的特征;步骤S4:捕获候选视频段特征之间的关系;步骤S5:将步骤S3和步骤S4的预测结果结合起来,生成最后的评判分数;步骤S6:对重复的候选视频段进行剔除;步骤S7:对候选视频段进行分类,得到其类别信息;通过捕获他们之间的全局关系和局部关系来产生更加有效的视频段特征,从而产生更加有效的预测结果。
-
公开(公告)号:CN113095304A
公开(公告)日:2021-07-09
申请号:CN202110634357.5
申请日:2021-06-08
申请人: 成都考拉悠然科技有限公司
摘要: 本发明提出一种减弱重采样对行人重识别的影响的方法,属于计算机视觉领域。本发明方法包括:对训练数据集进行预处理,并通过重采样策略,计算出每张图片的采样概率;构建特征提取网络,通过该特征提取网络提取出输入的行人的图片的特征表示;计算所述特征提取网络的损失函数,并调节该损失函数中类间损失和类内损失的权重比例,使得所述特征提取网络的损失函数最小;迭代训练行人重识别模型,直至行人重识别模型达到收敛状态。本发明能够通过减弱长尾分布和重采样使行人重识别的特征点在特征空间更加分散而带来的影响。
-
公开(公告)号:CN113033500A
公开(公告)日:2021-06-25
申请号:CN202110488341.8
申请日:2021-05-06
申请人: 成都考拉悠然科技有限公司
摘要: 本申请实施例涉及计算机视觉技术领域,提供一种动作片段检测方法、模型训练方法及装置,针对待检测视频,枚举待检测视频中所有的候选视频段,并获取待检测视频的视频特征和所有候选视频段的视频段特征图;然后,将视频特征和视频段特征图输入预先训练的动作检测模型,利用动作检测模型进行多尺度特征提取及预测,得到每个候选视频段的预测结果;最后,根据每个候选视频段的预测结果,从所有候选视频段中确定出动作片段,从而能够从长视频中自动剪辑出动作片段。
-
公开(公告)号:CN112364852B
公开(公告)日:2021-04-20
申请号:CN202110042635.8
申请日:2021-01-13
申请人: 成都考拉悠然科技有限公司
摘要: 本发明公开了一种融合全局信息的动作视频段提取方法,属于视频处理领域。本发明包括:选择训练数据集;提取数据集中的原始视频的视频帧,并利用TSN网络模型来提取的原始视频中包含的视频段的视觉特征并组成视觉特征序列;利用时序卷积对提取的视觉特征序列进行卷积操作,扩大视觉特征序中视觉特征的感受视野;基于扩大感受视野后的视觉特征生成视频段的二维视频段特征,并进行视频段的动作预测;基于扩大感受视野后的视觉特征预测视频段的开始时间节点和结束时间节点;将视频段的动作预测结果以及开始时间节点和结束时间节点预测结果进行融合,产生最终的预测结果。通过上述方法,本发明能够从长视频中提取出有效的视频段。
-
公开(公告)号:CN109828831B
公开(公告)日:2020-10-16
申请号:CN201910112462.5
申请日:2019-02-12
申请人: 成都考拉悠然科技有限公司
摘要: 本发明公开了一种人工智能云平台,依次由IaaS、PaaS和SaaS三层架构组成,采用对资源、组件和应用逐层抽象,对系统进行彻底解耦的方式构建本云平台,IaaS层采用虚拟化技术,统一分配和管理底层硬件资源,构建智能云平台的基础设施即服务;PaaS层通过对人工智能应用场景进行四级抽象构建自主流程控制引擎,进而构建人工智能组件与系统服务,对人工智能应用场景进行四级抽象包括如下四个部分:数据级抽象KLoud.cube、功能级抽象KLoud.case、业务级抽象KLoud.chain和优化级抽象KLoud.cycle;SaaS层构建人工智能应用服务。本发明基于自主流程控制引擎,可实现很多灵活而有效的操作,解决了堆叠开源引擎增大系统复杂性,对部署、调试和维护都非常不利的缺点,本云平台系统具有高弹性和高灵活性。
-
公开(公告)号:CN110990595A
公开(公告)日:2020-04-10
申请号:CN201911228649.8
申请日:2019-12-04
申请人: 成都考拉悠然科技有限公司
摘要: 本发明涉及跨模态检索技术领域,具体的说,是一种跨域对齐嵌入空间的零样本跨模态检索方法。所述的零样本跨模态检索方法先将不同模态数据和类别标签一起通过变分自动编码器映射到不同模态共同的低维的潜在嵌入空间,然后采用跨模态重构机制进行数据重构、采用跨域对齐机制进行跨域对齐、采用循环一致性约束机制进行循环一致性约束,经过整个网络训练后进行跨模态检索。本发明利用一个多模态变分自动编码器来构建类别嵌入和相同类别下不同模态的共同低维潜在嵌入空间而不是直接使用类别嵌入作为语义空间,并且避免了使用难以稳定训练的对抗生成网络,同时解决了“异构鸿沟”的问题。
-
公开(公告)号:CN110211127A
公开(公告)日:2019-09-06
申请号:CN201910704960.9
申请日:2019-08-01
申请人: 成都考拉悠然科技有限公司
摘要: 本发明涉及图像分割领域,具体的说,是一种利用相关性网络提高图像低层和高层之间分割清晰度的基于双相关性网络的图像分割方法。本发明的基于双相关性网络的图像分割方法,通过获得通道相关性特征Dk、阶段相关性特征Ek,并将每一个阶段的通道相关性特征Dk、阶段相关性特征Ek逐像素相加,得到融合特征输出Gk,再通过多个卷积层获得最终的分割图,提高了图像的分割清晰度,而且方法简单、实用。
-
-
-
-
-
-
-
-
-