-
公开(公告)号:CN118803263A
公开(公告)日:2024-10-18
申请号:CN202410010515.3
申请日:2024-01-02
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: H04N19/30 , H04N19/137
Abstract: 本发明提供语义视频编解码方法、系统及存储介质,涉及视频编解码技术领域,所述方法包括:采集原始视频数据进行目标检测,获取第一基础语义层、目标增强层及背景层;每间隔预设时间值基于原始视频帧以及第一基础语义层生成语义关键帧;获取体验质量参数基于第一基础语义层以及目标增强层生成普通语义帧;根据相邻背景层的差异程度生成背景关键帧;根据语义关键帧、普通语义帧以及背景关键帧生成语义视频流;发送语义视频流。基于语义分析,将目标与背景作为不同层,通过不同方式编码,实现分层传输的效果,有利于提高编码灵活性,方同时考虑目标与背景之间的变化进行编码,有利于去除时序冗余信息,提高压缩率,减少发送端上传时的带宽占用。
-
公开(公告)号:CN112035685B
公开(公告)日:2024-06-18
申请号:CN202010826809.5
申请日:2020-08-17
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/438 , G06F16/45 , G06F16/44
Abstract: 本发明实施例涉及视频制作领域,特别涉及相册视频生成方法、电子设备和存储介质。本发明实施例使用聚类算法对素材集中的素材的人脸特征聚类,获取聚类结果,其中,聚类结果包括多个类别的人物簇;从所述聚类结果中获取第一类别的人物簇;根据所述多个类别的人物簇对应的人物与所述第一类别人物簇对应的人物的关联度筛选素材,得到关联度满足预设门限的素材;根据所述筛选得到的素材生成相册视频。本发明的实施方式无需用户进行手动筛选素材等繁琐操作,节约用户时间,解决了无法自动化和批量化的进行相册视频生成、不适用于实际生产环境的问题,能够按照素材中出现的人物的关联度来筛选素材,使生成的相册视频更贴近用户的实际需求。
-
公开(公告)号:CN115913802A
公开(公告)日:2023-04-04
申请号:CN202110913497.6
申请日:2021-08-10
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请实施例提供了一种业务数据处理方法、装置、电子设备和存储介质,该方法包括:确定用户对云存储服务器的资源占用信息;资源占用信息包括文件在云存储服务器的累计存储时间和文件大小信息;根据资源占用信息,获取用户和云存储服务器的运营商的交易信息;在至少一个区块链节点中,生成交易信息的区块。基于本申请提供的业务数据处理方法,可以提高对云存储服务器的存储资源进行计费的可靠性。
-
公开(公告)号:CN115731604A
公开(公告)日:2023-03-03
申请号:CN202110995209.6
申请日:2021-08-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V40/20 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例公开了一种模型训练方法、手势识别方法、装置、设备和存储介质,该方法包括:通过获取至少一张手势图片以及至少一张非手势图片;将至少一张手势图片中的每一张手势图片分别与至少一张非手势图片进行图片融合处理,得到样本图片集;利用样本图片集对预设网络模型进行训练,得到手势识别模型;其中,手势识别模型包括第一子模型和第二子模型,第一子模型用于确定待检测图片的手势类型,第二子模型用于确定待检测图片的手部定位信息。这样,由于样本图片中不仅包括手势,还融合有非手势内容,据此训练得到的手势识别模型,更适用于真实的场景,增强了手势识别模型的识别准确性和模型鲁棒性,降低了外界因素对识别结果的干扰。
-
公开(公告)号:CN115713458A
公开(公告)日:2023-02-24
申请号:CN202110960154.5
申请日:2021-08-20
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种人脸替换方法、人脸替换装置、电子设备和存储介质,方法包括:通过预设图像分割模型对获取的驱动图像进行图像分割,得到第一蒙版图像;通过预设图像分割模型对获取的特定图像进行图像分割,得到第二蒙版图像;获取驱动图像中的第一人脸和特定图像中的第二人脸的姿态变换参数;基于姿态变换参数,对第二人脸进行变换处理,得到变换后的第二人脸,其中,变换后的第二人脸中的人脸姿态与第一人脸中的人脸姿态相同;基于姿态变换参数、变换后的第二人脸、第一蒙版图像和第二蒙版图像,生成驱动图像对应的人脸替换后的目标图像。
-
公开(公告)号:CN114821730A
公开(公告)日:2022-07-29
申请号:CN202210506615.6
申请日:2022-05-10
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V40/16 , G06V10/774
Abstract: 本发明公开了一种人脸识别方法、装置、设备及计算机可读存储介质,人脸识别方法包括:确定预训练集中的可见光样本和近红外样本,根据所述可见光样本和所述近红外样本进行模型训练,得到图像转换生成模型;获取目标可见光样本,并将所述目标可见光样本输入至所述图像转换生成模型进行模型训练,得到目标近红外样本;根据所述目标可见光样本和目标近红外样本进行成对数据混合增加,得到目标样本集,并根据所述目标样本集对预设的人脸识别网络进行模型训练,得到人脸识别模型;将待识别的近红外人脸图像输入至所述人脸识别模型进行人脸识别。本发明提高了跨光谱人脸识别的准确性。
-
公开(公告)号:CN119992525A
公开(公告)日:2025-05-13
申请号:CN202311499898.7
申请日:2023-11-10
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V20/62 , G06V20/40 , G06V30/148
Abstract: 本发明涉及人工智能技术领域,提供一种车牌识别方法、装置、电子设备及可读存储介质,包括:获取包含目标车辆的当前视频帧;将所述当前视频帧输入至车牌识别模型,获取由所述车牌识别模型输出的当前识别结果;所述当前识别结果为识别出的车牌字符以及每个所述车牌字符的识别置信度;基于所述当前识别结果对预先存储的历史识别结果进行更新,以确定所述目标车辆的车牌号。本发明在得到对当前视频帧的识别结果后,结合识别到的字符数量以及每个字符的置信度两个维度,判断其是否优于历史最优的识别结果,以对历史最优的识别结果进行迭代更新,以根据更新后的识别结果进行车牌识别,有效地提升了车牌识别的精度。
-
公开(公告)号:CN110956123B
公开(公告)日:2024-02-27
申请号:CN201911183179.8
申请日:2019-11-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/08
Abstract: 本发明实施例涉及信息管理领域,公开了一种富媒体内容的审核方法、装置、服务器及存储介质,本发明中,一种富媒体内容的审核方法,包括:对待审核的富媒体内容进行场景分类,得到富媒体内容的场景类型;根据场景类型对富媒体内容进行与场景类型对应的审核;若富媒体内容包含违规内容,则输出内容违规的审核结果。本发明通过对富媒体内容进行场景分类,根据不同的场景采用对应的审核方法进行富媒体内容的审核,在保证了准确性的同时,极大的提高了效率,降低了人工成本。
-
公开(公告)号:CN120015016A
公开(公告)日:2025-05-16
申请号:CN202311519522.8
申请日:2023-11-14
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明涉及人工智能技术领域,提供一种哭声分类预测方法、装置、电子设备及存储介质,包括:获取目标用户的音频序列和历史行为信息;基于音频序列进行哭声类型预测,得到哭声类型预测向量;基于历史行为信息确定目标用户的调节向量;将哭声类型预测向量和调节向量进行融合,得到目标预测结果。本发明实施例提供的哭声分类预测方法,将音频序列和历史行为信息分别作为独立的模态数据,通过音频序列的哭声类型预测得到哭声类型预测向量,通过历史行为的调节模式得到调节向量,进而通过融合各个模态的输出预测出目标预测结果,实现哭声类型预测向量的调节,可以提升哭声分类预测的准确度,也可以通过轻量化的多模态结构,提高哭声分类预测的效率。
-
公开(公告)号:CN118802067A
公开(公告)日:2024-10-18
申请号:CN202410167896.6
申请日:2024-02-05
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种数据传输方法、装置、设备、介质和程序产品,该方法包括:获取待传输信息的环境状态参数,其中,所述环境状态参数至少包括接收端的状态参数,所述接收端的状态参数包括:所述接收端的缓存区容量、所述接收端的冻帧时长和所述接收端信号重建质量;将所述环境状态参数输入至第一前向纠错编码FEC不等差保护策略模型,得到与所述环境状态参数对应的FEC保护率;根据所述FEC保护率,对所述待传输信息进行FEC组包,得到目标传输信息;基于传输链路对所述目标传输信息进行传输。以实现稳定的高质量数据的传输。
-
-
-
-
-
-
-
-
-