-
公开(公告)号:CN115641523A
公开(公告)日:2023-01-24
申请号:CN202110815559.X
申请日:2021-07-19
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V20/30 , G06V40/16 , G06V10/80 , G06V10/74 , G06V10/762 , G06V10/764 , G06N3/0464
Abstract: 本申请公开了一种图像分类方法、装置、电子设备和存储介质。其中,方法包括:获取待分类的第一图像;利用人脸识别算法,确定所述第一图像对应的聚类结果;所述聚类结果表征所述第一图像中的人物;利用第一分类模型,确定所述第一图像对应的分类结果;所述第一分类模型用于确定所述第一图像对应的至少一个类型;至少基于所述分类结果和所述聚类结果,确定所述第一图像对应的类别。本申请提供的方案,针对待分类的图像,利用人脸识别算法和分类模型分别得到对应的聚类结果和分类结果,再至少结合分类结果和聚类结果来对图像进行分类。如此,能够避免图像中的人脸错误识别,提高了图像分类的准确性。
-
公开(公告)号:CN111294524A
公开(公告)日:2020-06-16
申请号:CN202010110983.X
申请日:2020-02-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例涉及计算机领域,公开了一种视频剪辑方法、装置、电子设备及存储介质,视频剪辑方法包括:采用目标检测算法检测视频中的视频帧,得到所述视频帧中的人体区域;其中,所述目标检测算法基于人体目标特征数据预先训练得到;获取所述人体区域内的运动矢量,并根据所述运动矢量确定所述视频帧中的人体是否存在运动;若存在运动,则输出所述视频帧;根据预设的跳帧步长确定下一待检测的视频帧并进行检测,当所述视频中剩余的视频帧的帧数小于所述跳帧步长时,合成所有输出的视频帧以形成剪辑后的视频。本发明有利于快速且准确地提取出包含有人体运动的视频帧。
-
公开(公告)号:CN116634178B
公开(公告)日:2023-10-31
申请号:CN202310920194.6
申请日:2023-07-26
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
IPC: H04N19/70 , H04N19/146 , G06T9/00 , G06N3/0475 , G06N3/094
Abstract: 本申请实施例公开了一种极低码率的安防场景监控视频编解码方法及系统,可以极大地降低对安防场景监控视频的传输码率。该极低码率的安防场景监控视频编码方法包括:获取安防场景监控视频中的第一非关键帧;对所述第一非关键帧进行前背景分离,得到第一目标物体所对应的第一前景图,所述第一目标物体为所述第一非关键帧所包含的目标物体;对所述第一前景图进行语义信息提取,得到所述第一目标物体所对应的第一语义信息;将所述第一语义信息编码传输至接收端,以使所述接收端根据所述第一语义信息、以及所述安防场景监控视频的关键帧的背景图,重建所述第一非关键帧。
-
公开(公告)号:CN116684636B
公开(公告)日:2023-10-13
申请号:CN202310966321.6
申请日:2023-08-01
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
Abstract: 本发明提供了一种语义通信人脸重建优化方法、系统,涉及图像处理与计算机视觉技术领域。本发明实施例中,在传输过程中,针对参考帧(第一帧)传输其图像、运动关键点、以及轮廓关键点,针对驱动帧(第一帧后续其他帧)的传输只需要传输运动关键点,传输成本大幅降低,而人脸重建过程中,以参考帧图像的轮廓关键点作为轮廓约束,可以在少量增加传输信息的情况下,提高人脸重建的稳定性和准确度,缓解了生成人脸变形的问题。从而可以在低传输成本的前提下,稳定准确地完成人脸重建。解决了传统语义信息传输方法由于信息少,会导致目标重建效果差,失真的情况的问题。
-
公开(公告)号:CN116723333A
公开(公告)日:2023-09-08
申请号:CN202310962038.6
申请日:2023-08-02
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
IPC: H04N19/30 , H04N19/146 , H04N19/91
Abstract: 本发明提供了一种基于语义信息的可分层视频编码方法、装置及产品,涉及视频编解码技术领域。本发明实施例中,背景层数据是针对视频流图像数据中的较为固定的背景进行编码得到的,在解码端可以利用先验知识合成图像数据的背景信息;语义单元层数据是针对视频流图像数据中变化的前景目标进行编码得到的,在接收端根据语义信息和先验知识恢复视频流图像数据中的前景目标内容,语义增强层数据是在前两层的基础上,通过计算真实视频和合成视频之间前景目标区域的差异得到的,在解码端对通过背景层数据和语义单元层数据合成的视频进行细节补充,解决了可分层视频编码由于分层的维度导致视频重建存在质量下降的问题。
-
公开(公告)号:CN116634178A
公开(公告)日:2023-08-22
申请号:CN202310920194.6
申请日:2023-07-26
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
IPC: H04N19/70 , H04N19/146 , G06T9/00 , G06N3/0475 , G06N3/094
Abstract: 本申请实施例公开了一种极低码率的安防场景监控视频编解码方法及系统,可以极大地降低对安防场景监控视频的传输码率。该极低码率的安防场景监控视频编码方法包括:获取安防场景监控视频中的第一非关键帧;对所述第一非关键帧进行前背景分离,得到第一目标物体所对应的第一前景图,所述第一目标物体为所述第一非关键帧所包含的目标物体;对所述第一前景图进行语义信息提取,得到所述第一目标物体所对应的第一语义信息;将所述第一语义信息编码传输至接收端,以使所述接收端根据所述第一语义信息、以及所述安防场景监控视频的关键帧的背景图,重建所述第一非关键帧。
-
公开(公告)号:CN116723333B
公开(公告)日:2023-10-31
申请号:CN202310962038.6
申请日:2023-08-02
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
IPC: H04N19/30 , H04N19/146 , H04N19/91
Abstract: 本发明提供了一种基于语义信息的可分层视频编码方法、装置及产品,涉及视频编解码技术领域。本发明实施例中,背景层数据是针对视频流图像数据中的较为固定的背景进行编码得到的,在解码端可以利用先验知识合成图像数据的背景信息;语义单元层数据是针对视频流图像数据中变化的前景目标进行编码得到的,在接收端根据语义信息和先验知识恢复视频流图像数据中的前景目标内容,语义增强层数据是在前两层的基础上,通过计算真实视频和合成视频之间前景目标区域的差异得到的,在解码端对通过背景层数据和语义单元层数据合成的视频进行细节补充,解决了可分层视频编码由于分层的维度导致视频重建存在质量下降的问题。
-
公开(公告)号:CN116684636A
公开(公告)日:2023-09-01
申请号:CN202310966321.6
申请日:2023-08-01
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
Abstract: 本发明提供了一种语义通信人脸重建优化方法、系统,涉及图像处理与计算机视觉技术领域。本发明实施例中,在传输过程中,针对参考帧(第一帧)传输其图像、运动关键点、以及轮廓关键点,针对驱动帧(第一帧后续其他帧)的传输只需要传输运动关键点,传输成本大幅降低,而人脸重建过程中,以参考帧图像的轮廓关键点作为轮廓约束,可以在少量增加传输信息的情况下,提高人脸重建的稳定性和准确度,缓解了生成人脸变形的问题。从而可以在低传输成本的前提下,稳定准确地完成人脸重建。解决了传统语义信息传输方法由于信息少,会导致目标重建效果差,失真的情况的问题。
-
公开(公告)号:CN116708725B
公开(公告)日:2023-10-31
申请号:CN202310980716.1
申请日:2023-08-07
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
IPC: H04N7/18 , H04N19/42 , G06V20/52 , G06N3/0455 , G06N3/0475 , G06N3/08 , G06V10/80 , G06V10/82 , G06V20/40
Abstract: 本发明提供了一种基于语义编解码的低带宽人群场景安防监控方法及系统,涉及人工智能视频监控领域。本发明中,用户接口获取用户自定义信息,图像处理子系统获取针对人群的监控视频,并对监控视频中包括的连续多帧监控视频帧进行处理,将用户自定义信息作为指引信息,得到每一帧监控视频帧包括的目标对象的素描图和语义属性信息,并发送至图像重建子系统,按照预设周期发送监控视频帧包括的背景区域;图像重建子系统基于目标对象的素描图、语义属性信息和当前周期接收到的背景区域,重建监控视频帧。本发明采用语义编解码的方法,在传输和存储数据时有效压缩数据量,能够节省大量的带宽资源,降低传输成本,以在带宽受限的情况下实现高效的人群安防监控。
-
公开(公告)号:CN116743609B
公开(公告)日:2023-10-17
申请号:CN202311013701.4
申请日:2023-08-14
Applicant: 清华大学 , 中移(杭州)信息技术有限公司
IPC: H04L41/5067 , H04L41/5009 , H04N21/44 , H04N21/647
Abstract: 本申请提供了一种基于语义通信的视频流媒体的QoE评估方法及装置,首先通过语义通信解码端解码进行视频重建,生成重建视频流媒体。然后通过语义通信解码端获取重建视频流媒体的QoS表征,并确定其对应的基准QoE评分。同时,对重建视频流媒体中各个重建视频帧进行前景语义分析,得到对应的前景语义一致性表征,并比较相邻两个视频帧的前景语义一致性表征,得到QoE偏移量。最后通过语义通信解码端根据基准QoE评分和QoE偏移量,得到重建视频流媒体的QoE评分。其从服务质量和视频内容因素两方面考虑,根据QoS特征和语义特征对语义通信过程中产生的重建视频流媒体的体验质量QoE进行综合评估,使得结果更加真实、有效。
-
-
-
-
-
-
-
-
-