-
公开(公告)号:CN109784385A
公开(公告)日:2019-05-21
申请号:CN201811633640.0
申请日:2018-12-29
Applicant: 广州海昇计算机科技有限公司
Abstract: 本发明公开了一种商品自动识别方法、系统、装置及存储介质,其通过获取第一商品图像后,将第一商品图像输入至训练好的深度学习模型进行特征图提取处理后,得到所述第一商品图像的特征图,从所述特征图中获取所述第一商品图像的商品位置标注数据,接着所述深度学习模型利用所述特征图,对所述第一商品图像的商品位置标注数据所对应的图像块进行商品类型识别处理后,输出识别出的商品类型。可见,本发明实施例具有智能自动化程度高、投入设备购买成本低、处理效率高且识别准确的优点,可广泛应用于自动化零售领域中。
-
公开(公告)号:CN109543662A
公开(公告)日:2019-03-29
申请号:CN201811619663.6
申请日:2018-12-28
Applicant: 广州海昇计算机科技有限公司
Abstract: 本发明公开了一种基于区域提议的目标检测方法、系统、装置和存储介质,所述方法包括将待检测图像输入到目标检测网络中,接收目标检测网络输出的最终边界框,根据所述最终边界框,从所述待检测图像中确定要检测的目标等步骤。本发明提供了一种全新的目标检测网络,目标检测网络包括多个分支,各分支的特征图中均包含相应的局部信息和全局信息,每个分支在上一个分支的处理结果的基础上继续进行特征提取和特征信息学习,因此能够兼顾图像的局部信息和全局信息,能够取得很高的目标检测准确度。本发明广泛应用于图像识别技术领域。
-
公开(公告)号:CN109522883A
公开(公告)日:2019-03-26
申请号:CN201811625040.X
申请日:2018-12-28
Applicant: 广州海昇计算机科技有限公司
IPC: G06K9/00
Abstract: 本发明公开了一种人脸检测方法、系统、装置及存储介质,该方法包括:将获得的第一教室图像输入至训练好的卷积神经网络中进行人脸检测处理后,输出第一教室图像中若干个人脸的位置信息;其中,所述卷积神经网络在训练时所采用的训练输入图像是通过对原始教室图像进行预处理后得到的图像,所述预处理包括尺度变换处理、噪声加入处理、颜色变换处理、亮度变换处理以及镜像变换处理中至少一种预处理。该系统包括获取单元和处理单元。该装置包括用于存储程序的存储器以及用于加载程序以执行所述方法的处理器。通过使用本发明的检测方案,能快速且准确地对教师场景下的图像进行人脸检测,可广泛应用于教室考勤领域中。
-
公开(公告)号:CN104601910B
公开(公告)日:2018-07-24
申请号:CN201510038317.9
申请日:2015-01-26
Applicant: 广州海昇计算机科技有限公司
Abstract: 本发明公开了一种基于FPGA的四路全高清视频处理电路,其包括FPGA芯片,所述FPGA芯片包括存储控制器、通道选择开关模块、第一视频层叠加模块、第二视频层叠加模块、第三视频层叠加模块、第四视频层叠加模块、视频时序控制模块、视频合成模块、视频模式参数控制器、四个视频输入处理模块以及四个视频放大模块。通过使用本发明基于FPGA芯片的画中画和画外画视频处理电路,可满足对多路全高清视频信号同时进行采集处理的需求,而且还具有架构简单、易于设计实现等优点。本发明作为一种基于FPGA的四路全高清视频处理电路可广泛应用于高清视频处理领域中。
-
公开(公告)号:CN108256447A
公开(公告)日:2018-07-06
申请号:CN201711480429.5
申请日:2017-12-29
Applicant: 广州海昇计算机科技有限公司
Abstract: 本发明公开了一种基于深度神经网络的无人机航拍视频分析方法,步骤为:将采集到的无人机航拍视频上传至视频平台;建立无人机航拍人群分析库,建立训练集和测试集;训练并测试模型直至测试正确率大于期望值;保存并应用训练后的模型,对无人机航拍视频平台上实时采集到的视频进行分析处理;保存并统计分析处理结果。本发明方法结合无人机航拍人群分析库和深度学习神经网络模型,能够自动实时对无人机航拍视频进行人群行为识别和分析,从而能够在相应情况下作出预警,降低人群相关事故发生的概率,其分析方法相对于以往的人工分析方法,分析更准确,效率更高。本发明作为一种基于深度神经网络的无人机航拍视频分析方法可广泛应用于数据处理领域。
-
公开(公告)号:CN108111857A
公开(公告)日:2018-06-01
申请号:CN201711478633.3
申请日:2017-12-29
Applicant: 广州海昇计算机科技有限公司
IPC: H04N19/177 , H04N19/184 , H04N19/503 , H04N19/19 , H04N19/146
Abstract: 本发明公开了用于H.265码率控制的目标比特分配方法、系统及装置。该方法包括:GOP目标比特数的分配;计算GOP中帧图的已编码比特数;根据帧图的已编码比特数及GOP目标比特数,计算出GOP中帧图的比特分配权重;根据比特分配权重,对帧图进行目标比特分配;计算出当前LCU的帧内梯度;判断当前帧图是否为I帧,若是,则以帧内梯度作为LCU梯度;反之,则计算LCU的帧间梯度;判断LCU的帧内梯度是否大于帧间梯度,若是,则以帧间梯度作为LCU梯度;反之,则以帧内梯度作为LCU梯度;计算出当前帧图的总梯度;根据基于总梯度而计算出的LCU复杂度的权重,对LCU层进行目标比特分配。本发明提高了目标比特分配的准确性,可广泛适用于视频编码领域中。
-
公开(公告)号:CN108040256A
公开(公告)日:2018-05-15
申请号:CN201711482632.6
申请日:2017-12-29
Applicant: 广州海昇计算机科技有限公司
IPC: H04N19/124 , H04N19/142 , H04N19/147 , H04N19/103 , H04N19/184 , H04N19/19
CPC classification number: H04N19/124 , H04N19/103 , H04N19/142 , H04N19/147 , H04N19/184 , H04N19/19
Abstract: 本发明公开了一种基于H.265的码率控制方法、系统及装置,该方法包括:判断当前帧是否为场景切换帧;若是,将当前帧设置为I帧,根据量化参数与拉格朗日乘子法系数之间的关系,更新量化参数后,对新的GOP及新的帧层进行目标比特分配;若不是,则继续进行GOP层和帧层目标比特分配;利用R‑Q模型及帧层目标比特分配结果,计算出量化参数;根据计算出的量化参数,进行率失真优化后选出最佳编码模式;根据最佳编码模式进行编码;若当前帧为最后一帧,则结束;反之,则更新模型参数。该系统包括第一至第十一模块。该装置包括存储器以及用于执行上述方法的处理器。本发明可提高有场景切换视频的客观质量,广泛应用于视频编码领域中。
-
公开(公告)号:CN114363720A
公开(公告)日:2022-04-15
申请号:CN202111492456.0
申请日:2021-12-08
Applicant: 广州海昇计算机科技有限公司
IPC: H04N21/845 , G06V20/40 , G06V40/20 , G06V40/10
Abstract: 本发明公开了一种基于计算机视觉的视频切片方法、系统、设备及介质,方法包括:本发明实施例对待切片视频进行解码并输出视频帧图片;对所述视频帧图片进行手部关键点提取处理,确定手部关键点时间序列流;通过滑动窗口对所述手部关键点时间序列流进行手部动作匹配,确定手部行为信息;对所述视频帧图片进行目标检测,确定节点三元组;根据所述手部行为信息对所述节点距离进行位置检测,确定行为三元组;根据所述行为三元组中的动作起止时间戳对所述待切片视频进行剪辑,确定视频切片;能够通过手部与物体的交互行为确定切片的起止时间戳,实现自动化视频切片,提高了视频切片的效率,可广泛应用于视频切片技术领域。
-
公开(公告)号:CN109800662A
公开(公告)日:2019-05-24
申请号:CN201811617861.9
申请日:2018-12-28
Applicant: 广州海昇计算机科技有限公司
Abstract: 本发明公开了一种教师教课行为识别方法、系统、装置和存储介质,所述方法包括对从教师教课过程视频流中获取到的待识别图像进行运动目标检测,提取出运动目标,生成与所述运动目标相应的运动历史图,计算与所述运动历史图相应的运动特征,将所述运动特征输入到经过训练的卷积神经网络中,接收卷积神经网络输出的教师教课行为分类结果作为识别结果等步骤。本发明通过使用经过训练的卷积神经网络对从待识别图像提取出的运动特征进行分类,可以达到良好的识别效果,具有噪声小、时间复杂度小、识别精度高等优势。通过识别视频中的教师教课行为,可以对教师的教课质量进行客观评价。本发明广泛应用于图像识别技术领域。
-
公开(公告)号:CN109784219A
公开(公告)日:2019-05-21
申请号:CN201811623909.7
申请日:2018-12-28
Applicant: 广州海昇计算机科技有限公司
Abstract: 本发明公开了一种基于集中协调学习的人脸识别方法、系统及装置,其中,方法包括以下步骤:获取待识别的人脸图片,并对人脸图片进行人脸检测后,获得第一人脸图像;对第一人脸图像进行对齐处理后,获取预设尺寸的第二人脸图像;将第二人脸图像输入预设的基于集中协调学习的人脸识别模型进行特征提取后,获得第二人脸图像的人脸特征向量;结合人脸特征向量与预设的人脸数据库计算余弦相似度,并根据余弦相似度获取人脸识别结果。本发明采用基于集中协调学习的人脸识别模型对人脸图像进行特征提取,将各特征拉到原点并分别到全部象限中,类间距离更大,提高了人脸的分类效率和识别准确度,可广泛应用于人脸识别技术领域。
-
-
-
-
-
-
-
-
-