-
公开(公告)号:CN114267087B
公开(公告)日:2022-05-17
申请号:CN202210186091.7
申请日:2022-02-28
申请人: 成都考拉悠然科技有限公司
IPC分类号: G06V40/20 , G06V20/40 , G06V10/74 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06N20/00
摘要: 本发明公开了一种基于小样本机器学习模型的动作注册方法及其系统,包括:预训练视频卷积网络;获取包含代表性动作的样本数据集,利用所述视频卷积网络提取所述数据集中视频样本的特征,基于所述特征及其对应的视频样本的标签构建数据对并注册于动作库中;基于所述数据对构建错误拒绝率和错误接受率,并基于所述错误拒绝率和错误接受率生成相似性阈值;基于所述视频卷积网络、所述动作库和所述相似性阈值对实时视频进行特征提取并判别,输出行为标签。
-
公开(公告)号:CN114491135A
公开(公告)日:2022-05-13
申请号:CN202210352920.4
申请日:2022-04-06
申请人: 成都考拉悠然科技有限公司
IPC分类号: G06F16/587 , G06F16/583 , G06F16/55 , G06V20/10 , G06V10/82 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于变分信息瓶颈的跨视角地理图像检索方法,涉及计算机视觉中的跨视角地理图像检索技术领域,以往检索模型的分类器在训练过程中会很快收敛,导致其产生的梯度包含的信息过少而不能有效的对特征提取模块进行训练,导致检索模型容易过拟合,在测试的数据集上表现不佳;本发明使用变分信息瓶颈模块在训练过程中对分类器添加高斯噪声,迫使特征提取模块提取具有视图不变性的和判别性的图像表示,来提升检索模型的泛化能力和鲁棒性,并使用变分信息瓶颈模块压缩后的特征作为检索特征;从而达到提高检索结果准确性的目的。
-
公开(公告)号:CN114241607A
公开(公告)日:2022-03-25
申请号:CN202210146580.X
申请日:2022-02-17
申请人: 成都考拉悠然科技有限公司
IPC分类号: G06V40/20 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/08
摘要: 本发明公开了一种人员转椅检测方法及其系统,包括:获取检测图像;获取预训练的神经网络模型,将所述检测图像逐帧输入所述神经网络模型生成人体检测框信息、人体关键点的坐标信息;对所述坐标信息的x轴数据进行滤波生成滤波x轴数据,并基于所述滤波x轴数据及其对应的图像帧的时间信息生成移动曲线;对所述滤波x轴数据进行归一化处理并构建标准余弦曲线;基于所述移动曲线和所述标准余弦曲线进行相似度计算并生成检测结果。
-
公开(公告)号:CN114155560A
公开(公告)日:2022-03-08
申请号:CN202210116943.5
申请日:2022-02-08
申请人: 成都考拉悠然科技有限公司
摘要: 本发明公开了基于空间降维的高分辨率人体姿态估计模型的轻量化方法,涉及人体姿态估计领域,解决深度神经网络所需要的计算资源巨大的技术问题,本发明提出一种对1*1卷积核的等级替换方案。首先通过条纹状的上下文建模对输入的二维空间特征压缩后得到单维的空间特征,再分别对两个单维的空间特征进行编码学习到条纹状的注意力图,最终用学习到的两个单维空间的注意力图还原成一个双维空间的注意力图,并且用此注意力图帮助模型聚焦在关键点附近的区域;由于在自顶向下的姿态估计方法中两个一维的空间特征可以还原出一个二维的空间特征的特性,这种方法能够在保持高精度的同时将网络的计算复杂度从二次方级降低到一次方级。
-
公开(公告)号:CN113920437A
公开(公告)日:2022-01-11
申请号:CN202111518830.X
申请日:2021-12-14
申请人: 成都考拉悠然科技有限公司
IPC分类号: G06V20/10 , G06V10/774 , G06V10/764 , G06V10/74 , G06T7/00 , G06T3/00 , G06T3/40 , G06N3/04 , G06N3/08
摘要: 本发明涉及工业智能质检领域,具体为一种导电粒子识别方法、系统、存储介质和计算机设备。所述导电粒子识别方法,能够高效检测和识别IC区域导电粒子;获取液晶面板IC区域导电粒子图像,通过模板匹配的方法自动化标定导电粒子点的中心位置,得到第一数据集;对所述第一数据集通过仿射变换和缩小图像规模的方式,进一步预处理数据集,以提升数据集的标定质量,设计一个深度卷积模型作为视觉编码器,通过分类损失函数和修正损失函数训练网络模型,通过指标评估,选择评分最高的网络模型作为测试候选模型,以实现精准统计导电粒子个数和精确评估液晶面板质量。
-
公开(公告)号:CN113033500B
公开(公告)日:2021-12-03
申请号:CN202110488341.8
申请日:2021-05-06
申请人: 成都考拉悠然科技有限公司
摘要: 本申请实施例涉及计算机视觉技术领域,提供一种动作片段检测方法、模型训练方法及装置,针对待检测视频,枚举待检测视频中所有的候选视频段,并获取待检测视频的视频特征和所有候选视频段的视频段特征图;然后,将视频特征和视频段特征图输入预先训练的动作检测模型,利用动作检测模型进行多尺度特征提取及预测,得到每个候选视频段的预测结果;最后,根据每个候选视频段的预测结果,从所有候选视频段中确定出动作片段,从而能够从长视频中自动剪辑出动作片段。
-
公开(公告)号:CN113255832B
公开(公告)日:2021-10-01
申请号:CN202110697276.X
申请日:2021-06-23
申请人: 成都考拉悠然科技有限公司
摘要: 本发明属于计算机视觉领域,提出一种双分支多中心的长尾分布识别的方法,用于解决长尾分布数据集带来的问题。将图片输入默认分支和重采样分支进行数据增强后输入深度卷积神经网络得到低维特征表示;再经过全连接层得到属于每个类别概率,乘以一个表示多中心的矩阵得到特征矩阵并取最大值,得到最终属于每个类别的概率;分别计算损失;相加得到最终的损失,依据损失对网络进行反向传播并更新权重;不断地迭代;当需要进行识别任务时,将图片输入重采样分支,得到图片属于各个类别的概率。通过双分支多中心能减轻重采样带来的数据分布变化带来的影响,可进一步处理长尾分布带来的影响,带来更好的识别分类效果,并且模型拥有更好的泛化能力。
-
公开(公告)号:CN113204675A
公开(公告)日:2021-08-03
申请号:CN202110766199.9
申请日:2021-07-07
申请人: 成都考拉悠然科技有限公司
IPC分类号: G06F16/783 , G06K9/62
摘要: 本发明公开了一种基于跨模态物体推理网络的跨模态视频时刻检索方法,属于计算机视觉中的跨模态检索领域。本发明使用细粒度的物体级视频特征来进行跨模态视频时刻检索。同时,使用基于跨模态物体推理网络的跨模态视频时刻检索方法完成时刻检索,更加充分的利用了物体之间隐含的信息以及时序上的信息来得到检索结果,以达到提高检索结果的准确性的目的。
-
公开(公告)号:CN109815353B
公开(公告)日:2021-07-13
申请号:CN201910052416.0
申请日:2019-01-21
申请人: 成都考拉悠然科技有限公司
摘要: 本发明公开了一种基于类中心的人脸检索方法,包括注册人脸库方法和人脸检索与在线更新特征库方法;本发明所提出的采用类中心/重心的方式,有效抑制了同一个人不同照片之间受拍摄影响引入的噪声,从而显著增大了类间距,降低了系统误识率,同时有效降低了同一自然人所有照片之间的类内距,显著提高了系统准确率,检索时采用类中心/重心,因此检索的算法时间复杂度固定为O(N),不受人脸库照片数量的影响,进一步提出了在线增量更新类中心/重心的方法,从而显著加强了系统适应性。
-
公开(公告)号:CN107506712B
公开(公告)日:2021-05-18
申请号:CN201710697809.8
申请日:2017-08-15
申请人: 成都考拉悠然科技有限公司
摘要: 本发明属于计算机视觉视频动作识别领域,公开了一种基于3D深度卷积网络的人类行为识别的方法,所述方法首先将一个视频划分为一系列连续的视频片段;然后,将连续的视频片段输入到由卷积计算层和时空金字塔池化层组成的3D神经网络得到连续的视频片段特征;然后通过长短记忆模型计算全局的视频特征作为行为模式。本发明技术具有明显优势,通过改进了标准的3维卷积网络C3D,引入多级池化能够对任意分辨率和时长的视频片段进行特征提取;同时提高模型对行为变化大的鲁棒性,有利于在保持视频质量的情况下增加视频训练数据规模;通过各个运动子状态进行关联性信息嵌入提高行为信息的完整性。
-
-
-
-
-
-
-
-
-