-
公开(公告)号:CN116501907A
公开(公告)日:2023-07-28
申请号:CN202210061703.X
申请日:2022-01-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/532 , G06F16/538 , G06F16/583
Abstract: 本申请公开了一种图像数据处理方法、装置、设备以及可读存储介质,方法包括:响应针对扫描控件的触发操作,显示用于执行扫描业务的扫描界面;响应针对第一扫描对象的扫描操作,获取第一原始扫描图像;第一原始扫描图像包括第一遮挡对象和第一扫描对象,第一遮挡对象是指对第一扫描对象的局部区域进行遮挡的对象;响应针对扫描业务的扫描结果阅览操作,显示包含目标更新扫描图像的扫描结果文档;目标更新扫描图像的图像内容包括第一原始扫描图像中去除第一遮挡对象后的图像内容。采用本申请,可以通过扫描方式获取对象的图像,并且在扫描业务中,可以优化扫描得到的图像的展示效果。
-
公开(公告)号:CN115050378A
公开(公告)日:2022-09-13
申请号:CN202210546928.4
申请日:2022-05-19
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请属于音视频技术领域,具体涉及一种音频编解码方法、音频编解码装置、计算机可读介质、电子设备以及计算机程序产品。音频解码方法包括:获取音频帧序列中各个音频帧的编码向量;对历史音频帧的编码向量进行上采样得到至少一个上采样特征值,所述历史音频帧是在当前音频帧之前解码的一个或者多个音频帧,所述上采样特征值是在上采样过程中得到的用于描述音频帧的特征向量;根据所述至少一个上采样特征值对所述当前音频帧的编码向量进行上采样得到所述当前音频帧的解码数据。本申请可以提高音频数据的编解码质量。
-
公开(公告)号:CN114792524B
公开(公告)日:2022-09-06
申请号:CN202210720831.0
申请日:2022-06-24
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208
Abstract: 本申请公开了一种音频数据处理方法、装置、程序产品、计算机设备和介质,该方法包括:获取待优化的目标音频数据;调用音频优化网络对目标音频数据进行回声消除处理,得到目标音频数据的回声消除的音频数据;调用音频优化网络对回声消除的音频数据进行噪声抑制处理,得到目标音频数据的降噪处理的音频数据;调用音频优化网络对降噪处理的音频数据进行响度增益处理,得到目标音频数据的优化音频数据。采用本申请,可以提升对目标音频数据的优化效果。
-
公开(公告)号:CN114792524A
公开(公告)日:2022-07-26
申请号:CN202210720831.0
申请日:2022-06-24
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208
Abstract: 本申请公开了一种音频数据处理方法、装置、程序产品、计算机设备和介质,该方法包括:获取待优化的目标音频数据;调用音频优化网络对目标音频数据进行回声消除处理,得到目标音频数据的回声消除的音频数据;调用音频优化网络对回声消除的音频数据进行噪声抑制处理,得到目标音频数据的降噪处理的音频数据;调用音频优化网络对降噪处理的音频数据进行响度增益处理,得到目标音频数据的优化音频数据。采用本申请,可以提升对目标音频数据的优化效果。
-
公开(公告)号:CN114242097A
公开(公告)日:2022-03-25
申请号:CN202111456334.6
申请日:2021-12-01
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L21/0208
Abstract: 本申请公开了一种音频数据处理方法、音频数据处理装置、介质及设备,可应用于人工智能、机器学习中的人工智能AI降噪、人工智能AI回声消除技术的研究。该方法包括:获取采集的原始音频数据,原始音频数据包括纯净语音音频数据、噪声音频数据;根据原始音频数据中的纯净语音音频数据和噪声音频数据,生成仿真带噪数据;根据原始音频数据或仿真带噪数据,生成用于模拟音频经过空间传递后产生变化的目标音频数据;对目标音频数据执行语音增强操作,以得到增强的目标音频数据。通过数学语言模拟音频经过各种空间的传递变化,生成多样化的目标音频数据,提出了更完备的仿真音频数据合成方法。
-
公开(公告)号:CN110163235A
公开(公告)日:2019-08-23
申请号:CN201811183016.5
申请日:2018-10-11
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明涉及一种图像增强模型的训练、图像增强方法、装置和存储介质,所述图像增强模型的训练方法包括:获取第一训练图像集,所述第一训练图像集中的各个训练样本包括训练图像以及配对的目标图像;根据所述第一训练图像集的各个训练样本对初始图像增强模型进行有监督的模型训练,得到中间图像增强模型;获取第二训练图像集,所述第二训练图像集包括第一质量图像子集和第二质量图像子集;根据所述第二训练图像集对所述中间图像增强模型和判别网络模型进行对抗学习,采用无监督训练算法训练得到目标图像增强模型。上述方法可以提高目标图像增强模型的图像增强效果。
-
公开(公告)号:CN115050378B
公开(公告)日:2024-06-07
申请号:CN202210546928.4
申请日:2022-05-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L19/20 , G10L19/22 , G10L25/30 , G10L25/24 , G06N3/0464
Abstract: 本申请属于音视频技术领域,具体涉及一种音频编解码方法、音频编解码装置、计算机可读介质、电子设备以及计算机程序产品。音频解码方法包括:获取音频帧序列中各个音频帧的编码向量;对历史音频帧的编码向量进行上采样得到至少一个上采样特征值,所述历史音频帧是在当前音频帧之前解码的一个或者多个音频帧,所述上采样特征值是在上采样过程中得到的用于描述音频帧的特征向量;根据所述至少一个上采样特征值对所述当前音频帧的编码向量进行上采样得到所述当前音频帧的解码数据。本申请可以提高音频数据的编解码质量。
-
公开(公告)号:CN110633745B
公开(公告)日:2022-11-29
申请号:CN201910854110.7
申请日:2017-12-12
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V10/774 , G06V10/764 , G06V30/413 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明实施例公开了一种基于人工智能的图像分类训练方法、装置及存储介质,应用于人工智能的机器学习技术领域。分类训练装置会先选定训练集,并根据草图分类模型确定训练集中的草图的类别,且可以根据真实图鉴别器对草图分类模型中得到的草图特征进行鉴别,得到第二草图特征鉴别结果;然后固定真实图分类模型和草图鉴别器,根据草图的类别和第二草图特征鉴别结果对草图分类模型的固定参数值进行调整。这样,在对某一分类模型即草图分类模型的固定参数值进行调整时,不仅会参考该分类模型对相应图像进行分类的误差,还会借鉴另一分类模型即固定的真实图分类模型在分类过程中的有用信息,从而使得调整后的草图分类模型的分类计算更准确。
-
公开(公告)号:CN113612808B
公开(公告)日:2022-01-25
申请号:CN202111176990.0
申请日:2021-10-09
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明实施例公开了一种音频处理方法、相关设备、存储介质及程序产品,其中方法包括:获取待处理的目标音频数据及所述目标音频数据的频谱信息,所述目标音频数据中存在音频缺失片段,所述频谱信息包括所述音频缺失片段的上下文音频片段的频谱特征;根据所述上下文音频片段的频谱特征,对所述目标音频数据的频谱信息进行特征补偿处理,得到所述目标音频数据对应的补偿频谱信息;采用所述补偿频谱信息进行音频预测,得到预测音频数据;根据所述预测音频数据对目标音频数据中的所述音频缺失片段进行补偿,得到所述目标音频数据的补偿音频数据,可提升对丢包音频进行预测补偿时的准确性。
-
公开(公告)号:CN111507352B
公开(公告)日:2021-09-28
申请号:CN202010299553.7
申请日:2020-04-16
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请实施例公开了一种图像处理方法、装置、计算机设备以及存储介质,图像处理方法包括:获取输入图像,确定输入图像的前景区域;从输入图像中抽取前景区域对应的前景图像,识别前景图像得到输入图像的前景内容;根据前景区域获取输入图像的背景内容;对前景内容和背景内容进行处理,生成目标可编辑文件。采用本申请,可以提高图像识别的准确率。
-
-
-
-
-
-
-
-
-