-
公开(公告)号:CN120015016A
公开(公告)日:2025-05-16
申请号:CN202311519522.8
申请日:2023-11-14
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明涉及人工智能技术领域,提供一种哭声分类预测方法、装置、电子设备及存储介质,包括:获取目标用户的音频序列和历史行为信息;基于音频序列进行哭声类型预测,得到哭声类型预测向量;基于历史行为信息确定目标用户的调节向量;将哭声类型预测向量和调节向量进行融合,得到目标预测结果。本发明实施例提供的哭声分类预测方法,将音频序列和历史行为信息分别作为独立的模态数据,通过音频序列的哭声类型预测得到哭声类型预测向量,通过历史行为的调节模式得到调节向量,进而通过融合各个模态的输出预测出目标预测结果,实现哭声类型预测向量的调节,可以提升哭声分类预测的准确度,也可以通过轻量化的多模态结构,提高哭声分类预测的效率。
-
公开(公告)号:CN118802067A
公开(公告)日:2024-10-18
申请号:CN202410167896.6
申请日:2024-02-05
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种数据传输方法、装置、设备、介质和程序产品,该方法包括:获取待传输信息的环境状态参数,其中,所述环境状态参数至少包括接收端的状态参数,所述接收端的状态参数包括:所述接收端的缓存区容量、所述接收端的冻帧时长和所述接收端信号重建质量;将所述环境状态参数输入至第一前向纠错编码FEC不等差保护策略模型,得到与所述环境状态参数对应的FEC保护率;根据所述FEC保护率,对所述待传输信息进行FEC组包,得到目标传输信息;基于传输链路对所述目标传输信息进行传输。以实现稳定的高质量数据的传输。
-
公开(公告)号:CN116912894A
公开(公告)日:2023-10-20
申请号:CN202211412614.1
申请日:2022-11-11
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种评估方法、装置、设备及计算机可读存储介质,该评估方法包括:获取多个图像识别模型、待评估图像集合和所述待评估图像集合中各个待评估图像的第一维度质量评分,其中,所述第一维度质量评分用于反映所述各个待评估图像的视觉感官上的质量;利用各个图像识别模型对所述各个待评估图像分别进行特征提取处理,得到所述各个待评估图像的特征向量;基于所述各个待评估图像的特征向量确定所述各个待评估图像的第二维度质量评分;基于所述第一维度质量评分和所述第二维度质量评分,确定所述各个待评估图像的质量评估结果。如此,能够结合多个维度得到精确度较高的质量评估结果,优化质量评估结果。
-
公开(公告)号:CN116091955A
公开(公告)日:2023-05-09
申请号:CN202111299080.1
申请日:2021-11-04
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V20/40 , G06V10/26 , G06V10/44 , G06V10/764 , G06V10/774
Abstract: 本申请公开了一种分割方法、装置、设备及计算机可读存储介质,包括:获取待分割的视频数据和训练好的分割模型;确定视频数据中包括的多个视频帧,并将多个视频帧依次确定为待分割视频帧;当待分割视频帧之前存在至少一个历史视频帧,从至少一个历史视频帧的目标透明度模板中确定待分割视频帧的参考透明度模板;将待分割视频帧和参考透明度模板输入至训练好的分割模型,得到待分割视频帧的目标透明度模板;基于目标透明度模板对待分割视频帧进行提取处理,得到待分割视频帧的目标前景图像。如此,通过历史视频帧对应的参考透明度模板来增加输入的时空特征,从而减少计算复杂度,并提升目标透明度模板的准确性,从而提高分割效果。
-
公开(公告)号:CN112561956B
公开(公告)日:2023-04-28
申请号:CN202011345651.6
申请日:2020-11-25
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06T7/246 , G06V20/40 , G06V10/62 , G06V10/764 , G06V10/82
Abstract: 本发明实施例涉及通信技术领域,公开了一种视频目标跟踪方法、装置、电子设备及存储介质。本发明中,方法包括:将目标参照图和跟踪视频帧输入特征提取网络得到第一图像特征及第二图像特征;将所述第一图像特征和所述第二图像特征输入回归特征提取网络中,得到第一回归特征和第二回归特征;将所述第一回归特征和第二回归特征输入回归子网络中,获取所述回归子网络输出的所述跟踪视频帧的包围盒信息。通过上述技术手段,在视频跟踪中,仅通过回归特征提取网络确定图像的位置,提高视频跟踪的精确度与鲁棒性。
-
公开(公告)号:CN115760657A
公开(公告)日:2023-03-07
申请号:CN202110994987.3
申请日:2021-08-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06T5/50 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例公开了一种图像融合方法、装置、电子设备和计算机存储介质,该方法包括:获取初始融合图像以及蒙版图像;对初始融合图像进行图像通道分离处理,得到第一通道图像和第二通道图像;利用图像融合模型对第一通道图像和蒙版图像进行图像融合处理,得到中间融合图像;将中间融合图像与第二通道图像进行通道合并处理,生成目标融合图像。这样,在进行图像融合之前,将关于色调的第二通道图像剔除,只使用第一通道图像进行融合处理,从而能够避免图像融合模型学习到色调相关的特征而导致得到的目标融合图像色调信息被改变的问题,使得目标融合图像中的目标对象与背景图像的光照阴影效果趋于一致,进而提高了图像融合效果。
-
公开(公告)号:CN115757764A
公开(公告)日:2023-03-07
申请号:CN202110996527.4
申请日:2021-08-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F18/22 , G06N3/0464 , G06N3/084 , G06N5/02
Abstract: 本申请公开了一种信息识别方法、装置、设备及计算机可读存储介质,该方法包括:获取待处理信息,对所述待处理信息进行分离处理,得到文本数据和链接数据;分别对所述文本数据和所述链接数据进行特征提取,得到对应的文本特征和链接特征;基于所述链接数据和预先构建好的链接知识库确定所述链接数据的相似度属性信息;基于所述文本特征、所述链接特征和所述相似度属性信息确定所述待处理信息的识别结果,能够基于端到端思想,在对待处理信息的文本数据和链接数据进行特征提取后,再进行融合得到识别结果,简化识别过程,并提升识别方法的普适性以及识别准确率。
-
公开(公告)号:CN111294524B
公开(公告)日:2022-10-04
申请号:CN202010110983.X
申请日:2020-02-24
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例涉及计算机领域,公开了一种视频剪辑方法、装置、电子设备及存储介质,视频剪辑方法包括:采用目标检测算法检测视频中的视频帧,得到所述视频帧中的人体区域;其中,所述目标检测算法基于人体目标特征数据预先训练得到;获取所述人体区域内的运动矢量,并根据所述运动矢量确定所述视频帧中的人体是否存在运动;若存在运动,则输出所述视频帧;根据预设的跳帧步长确定下一待检测的视频帧并进行检测,当所述视频中剩余的视频帧的帧数小于所述跳帧步长时,合成所有输出的视频帧以形成剪辑后的视频。本发明有利于快速且准确地提取出包含有人体运动的视频帧。
-
公开(公告)号:CN115049953A
公开(公告)日:2022-09-13
申请号:CN202210501926.3
申请日:2022-05-09
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82 , G06F16/683 , G06N3/04 , G10L15/18 , G10L15/26
Abstract: 本发明公开了一种视频处理方法、装置、设备及计算机可读存储介质,其中,方法包括:获取待识别视频对应的音频信息以及关键帧图像;获取所述音频信息对应的音频文本语义特征向量,并获取所述关键帧图像对应的视觉语义特征向量;基于所述视觉语义特征向量以及所述音频文本语义特征向量,通过融合特征网络模型,确定所述待识别视频对应的违规概率;若所述违规概率大于预设阈值,则确定所述待识别视频为违规视频。本发明能够根据待识别视频的音频信息以及关键帧图像准确确定该待识别视频是否为违规视频,通过在视频审核时兼容语音讲解等音频信息,提高违规视频识别的准确率。
-
公开(公告)号:CN110956123A
公开(公告)日:2020-04-03
申请号:CN201911183179.8
申请日:2019-11-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例涉及信息管理领域,公开了一种富媒体内容的审核方法、装置、服务器及存储介质,本发明中,一种富媒体内容的审核方法,包括:对待审核的富媒体内容进行场景分类,得到富媒体内容的场景类型;根据场景类型对富媒体内容进行与场景类型对应的审核;若富媒体内容包含违规内容,则输出内容违规的审核结果。本发明通过对富媒体内容进行场景分类,根据不同的场景采用对应的审核方法进行富媒体内容的审核,在保证了准确性的同时,极大的提高了效率,降低了人工成本。
-
-
-
-
-
-
-
-
-