-
公开(公告)号:CN111653263A
公开(公告)日:2020-09-11
申请号:CN202010537487.2
申请日:2020-06-12
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张倩
IPC: G10L13/033 , G10L13/02 , G06F3/16
Abstract: 本申请公开了音量调节方法、装置、电子设备以及存储介质,涉及语音识别技术领域。具体实现方案为:将包括原声音频和叠加音频的音频数据进行分解,获得原声音频和叠加音频;对原声音频和/或叠加音频的音量进行调节;执行音频合成操作,以得到目标音频;其中,在对原声音频和叠加音频进行音量调节的情况下,音频合成操作为将音量调节后的原声音频和叠加音频进行合并,或者,在对原声音频或者叠加音频进行音量调节的情况下,音频合成操作为将音量调节后的音频与未进行音量调节的音频进行合并。这样,可以对原声音频和叠加音频中的至少一项进行音量调节,提高了对音频数据进行音量调节的灵活性。
-
公开(公告)号:CN104133704A
公开(公告)日:2014-11-05
申请号:CN201410374798.6
申请日:2014-07-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张倩
Abstract: 本发明实施例公开了一种软件升级、升级包下发方法、装置和设备,涉及计算机技术领域,用于减少软件升级所需要消耗的资源。该方法中,向服务器端发送对当前版本的应用软件的升级请求;接收服务器端下发的所述应用软件的标准升级包;所述标准升级包是预先指定的该应用软件的标准数据包对应的升级包;根据预设规则将本地的所述应用软件的待升级数据包调整为标准数据包;使用所述标准升级包对调整得到的标准数据包进行升级。采用本发明可以减少软件升级时对时间、存储空间等资源的消耗。
-
公开(公告)号:CN111653263B
公开(公告)日:2023-03-31
申请号:CN202010537487.2
申请日:2020-06-12
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张倩
IPC: G10L13/033 , G10L13/02 , G06F3/16
Abstract: 本申请公开了音量调节方法、装置、电子设备以及存储介质,涉及语音识别技术领域。具体实现方案为:将包括原声音频和叠加音频的音频数据进行分解,获得原声音频和叠加音频;对原声音频和/或叠加音频的音量进行调节;执行音频合成操作,以得到目标音频;其中,在对原声音频和叠加音频进行音量调节的情况下,音频合成操作为将音量调节后的原声音频和叠加音频进行合并,或者,在对原声音频或者叠加音频进行音量调节的情况下,音频合成操作为将音量调节后的音频与未进行音量调节的音频进行合并。这样,可以对原声音频和叠加音频中的至少一项进行音量调节,提高了对音频数据进行音量调节的灵活性。
-
公开(公告)号:CN111770388B
公开(公告)日:2022-04-19
申请号:CN202010612062.3
申请日:2020-06-30
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张倩
IPC: H04N21/4788 , H04N21/44 , H04N21/439 , H04N21/4402 , H04N21/488
Abstract: 本申请公开了内容处理方法、装置、设备及存储介质,涉及人工智能、多媒体技术、语音处理领域。具体实现方案为:确定目标对象,其中,所述目标对象为视频帧所展示的对象;接收针对所述目标对象的评论数据;将所述评论数据转换为目标音频数据,并在所述视频帧所对应的视频数据中输出对所述目标对象进行评论的所述目标音频数据。如此,增加视频播放中与用户的互动方式,丰富视频的展示形式。
-
公开(公告)号:CN114595780A
公开(公告)日:2022-06-07
申请号:CN202210255883.5
申请日:2022-03-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62 , G06V10/74 , G06V10/774
Abstract: 本公开提供了一种图文处理模型训练及图文处理方法、装置、设备及介质,涉及人工智能领域,具体涉及深度学习领域,可用于信息推荐场景。具体实现方案为:将样本文本输入待训练的文本特征提取器得到文本特征,并将样本图像输入待训练的图像特征提取器得到图像特征;根据所述文本特征和所述图像特征之间的相关性,对所述文本特征提取器和所述图像特征提取器的网络参数进行更新;根据所述图像特征和所述样本图像构建监督信号,并根据所述监督信号更新所述图像特征提取器的网络参数。本公开能够提高图像特征提取器的特征提取准确度,从而提高图文相关性判断的准确度。
-
公开(公告)号:CN104133704B
公开(公告)日:2018-01-26
申请号:CN201410374798.6
申请日:2014-07-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张倩
Abstract: 本发明实施例公开了一种软件升级、升级包下发方法、装置和设备,涉及计算机技术领域,用于减少软件升级所需要消耗的资源。该方法中,向服务器端发送对当前版本的应用软件的升级请求;接收服务器端下发的所述应用软件的标准升级包;所述标准升级包是预先指定的该应用软件的标准数据包对应的升级包;根据预设规则将本地的所述应用软件的待升级数据包调整为标准数据包;使用所述标准升级包对调整得到的标准数据包进行升级。采用本发明可以减少软件升级时对时间、存储空间等资源的消耗。
-
公开(公告)号:CN114595780B
公开(公告)日:2022-12-20
申请号:CN202210255883.5
申请日:2022-03-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62 , G06V10/74 , G06V10/774
Abstract: 本公开提供了一种图文处理模型训练及图文处理方法、装置、设备及介质,涉及人工智能领域,具体涉及深度学习领域,可用于信息推荐场景。具体实现方案为:将样本文本输入待训练的文本特征提取器得到文本特征,并将样本图像输入待训练的图像特征提取器得到图像特征;根据所述文本特征和所述图像特征之间的相关性,对所述文本特征提取器和所述图像特征提取器的网络参数进行更新;根据所述图像特征和所述样本图像构建监督信号,并根据所述监督信号更新所述图像特征提取器的网络参数。本公开能够提高图像特征提取器的特征提取准确度,从而提高图文相关性判断的准确度。
-
公开(公告)号:CN111770388A
公开(公告)日:2020-10-13
申请号:CN202010612062.3
申请日:2020-06-30
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 张倩
IPC: H04N21/4788 , H04N21/44 , H04N21/439 , H04N21/4402 , H04N21/488
Abstract: 本申请公开了内容处理方法、装置、设备及存储介质,涉及人工智能、多媒体技术、语音处理领域。具体实现方案为:确定目标对象,其中,所述目标对象为视频帧所展示的对象;接收针对所述目标对象的评论数据;将所述评论数据转换为目标音频数据,并在所述视频帧所对应的视频数据中输出对所述目标对象进行评论的所述目标音频数据。如此,增加视频播放中与用户的互动方式,丰富视频的展示形式。
-
-
-
-
-
-
-