-
公开(公告)号:CN106055643B
公开(公告)日:2019-12-13
申请号:CN201610376221.8
申请日:2016-05-31
Applicant: 成都索贝数码科技股份有限公司
IPC: G06F16/60
Abstract: 本发明公开了一种MXF文件写入中断的续写方法,包括以下步骤:判断MXF文件是否完整;若所述MXF文件不完整,则判断所述MXF文件的头部元数据是否完成,若所述头部元数据未完成,则重写所述头部元数据;获取已写入的音视频数据的帧数;写入新的音视频数据;写入文件尾部包;根据所述MXF文件的格式,判断是否写入完整的索引表段和随机索引包;所述续写方法还包括:改写头部元数据中需要改写时长参数的项。本发明通过续写的方法对不完整MXF文件进行处理,相比对不完整MXF文件的重写操作,大大缩短了处理时间,减少了工作量。
-
公开(公告)号:CN110517656A
公开(公告)日:2019-11-29
申请号:CN201910728238.9
申请日:2019-08-02
Applicant: 平安科技(深圳)有限公司
Abstract: 本发明公开了一种歌词节奏生成方法、设备、存储介质及装置,该方法通过获取多个待处理歌词文本,对多个待处理歌词文本进行多线程处理,从待处理歌词文本中提取多个句子,并对提取的句子分别进行字数统计,将提取的句子存储至数据缓存器,按照先进先出规则对数据缓存器中的句子进行遍历,将遍历到的句子作为当前句子;根据当前句子的第一字数从预设歌词节奏生成模型的节拍矩阵集合中选择初始概率矩阵;从初始概率矩阵中选择一个节拍节奏作为当前句子的句子节奏;将生成的各所述句子节奏按时间顺序拼接,获得待处理歌词文本对应的歌词节奏,通过基于马尔可夫模型训练获得的预设歌词节奏生成模型,生成歌词节奏,提高歌词节奏的扩展性。
-
公开(公告)号:CN110516102A
公开(公告)日:2019-11-29
申请号:CN201910650229.2
申请日:2019-07-18
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于语谱图识别的歌词时间戳生成方法,步骤S1:利用音频空间位置差异分离人声与伴奏;步骤S2:根据响度与BPM对处理后的音频作基于行的时间分割;步骤S3:将上述分割后的音频转化为语谱图,并利用图像识别对其进行基于单字的时间分割,得到所需的歌词时间戳。采用本发明的技术方案,将原始音频进行人声提取,并结合Adaboost模型对其语谱图进行识别,能有效提高对齐准确性,并大大降低人工对齐的成本。
-
公开(公告)号:CN107786549B
公开(公告)日:2019-10-29
申请号:CN201710958076.9
申请日:2017-10-16
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Inventor: 姚聪
IPC: H04L29/06 , G06F16/60 , G06F16/635 , G06F16/70 , G06F16/783
Abstract: 本发明提供了一种音频文件的添加方法、装置、系统及计算机可读介质,涉及多媒体信息的技术领域,该方法包括:获取待识别的图像信息;在图像信息中进行手势检测以及识别,以得到手势的手势信息,其中,手势信息包括以下至少之一:手势的位置信息,手势的类型信息,手势的实时持续时间;以及,基于手势信息确定与手势相匹配的音频文件,以在图像信息中添加音频文件,本发明缓解了现有技术中直播视频或者短视频无法基于手势识别来进行音频特效的添加的技术问题。
-
公开(公告)号:CN109783469A
公开(公告)日:2019-05-21
申请号:CN201811531642.9
申请日:2018-12-14
Applicant: 上海威固信息技术股份有限公司
Abstract: 本发明提供了一种基于内容感知的数据去重方法与装置,包括运行在上位机的IO处理装置和运行在存储控制器的数据去重装置,数据去重装置包括解析单元、特征值比对单元和数据去重执行单元。对待存储数据按内容分为文本、音频、图像、非时序数值数据与时序数值数据,按类型采用不同的算法计算其特征值,将得到的特征值与初始IO写请求组合成新的IO写请求,按解析出的IO写请求数据类型,特征值比对单元从相应的特征值子表读出特征值,计算待存储数据特征值与读出特征值的汉明距离,将判断结果发送至数据去重执行单元进行数据去重操作。本发明采取基于内容感知的特征值计算算法和数据重复判断标准,提高了去重成功率和去重效率。
-
公开(公告)号:CN109669663A
公开(公告)日:2019-04-23
申请号:CN201811628633.1
申请日:2018-12-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种音区幅值获取方法、装置、电子设备及存储介质,其中,所述方法包括:实时采集目标音区的语音数据,所述语音数据包括多个采样点对应的音频信号;通过如下方式对所述音频信号进行存储:将待存储的当前音频信号的幅值与已存储的各音频信号的幅值相比较,并根据比较结果选择是否存储所述当前音频信号;根据完成存储的全部音频信号的幅值计算所述目标音区的当前音区幅值。本发明实施例可以准确获取音区幅值,从而根据该音区幅值准确地定位语音数据的来源音区,进而解决四音区隔离度不足导致的误唤醒问题,并为纠正语音引擎误唤醒提供幅值数据依据,而且计算量小,节约了系统资源。
-
公开(公告)号:CN109558853A
公开(公告)日:2019-04-02
申请号:CN201811478894.X
申请日:2018-12-05
Applicant: 维沃移动通信有限公司
Inventor: 邢健飞
Abstract: 本发明实施例提供一种音频合成方法及终端设备,该方法包括:获取第一人脸图像;获取与第一人脸图像相匹配的目标音素;根据所述目标音素,生成目标音频。本发明实施例根据与第一人脸图像相匹配的目标音素生成目标音频,简化了音频合成过程,并充分考虑了用户特征,提高了合成得到的音频的保真度。
-
公开(公告)号:CN109492124A
公开(公告)日:2019-03-19
申请号:CN201811397237.2
申请日:2018-11-22
Applicant: 北京工业大学
IPC: G06F16/60
Abstract: 本申请实施例提供一种选择性注意线索指导的不良主播检测方法、装置及电子设备,该方法包括:获取待测直播音视频;基于所述待测直播音视频生成第二耦合特征;计算所述第二耦合特征与预存的各类型的影音数据对应的第一耦合特征之间的汉明距离,其中,所述第二耦合特征采用与所述第一耦合特征相同的方式生成;将与所述第二耦合特征的汉明距离小于预设阈值的第一耦合特征所对应的影音数据的类型判定为所述待测直播音视频的类型,并输出。由此,可靠地检测出直播音视频的类型。
-
公开(公告)号:CN109299312A
公开(公告)日:2019-02-01
申请号:CN201811212687.X
申请日:2018-10-18
Applicant: 湖南城市学院
Inventor: 郭冰涛
Abstract: 本发明公开了基于大数据的音乐节奏分析方法,涉及计算机技术领域,其技术方案要点是:包括以下步骤:获取待分析音乐数据;提取音乐分段中的节奏特征;根据节奏特征调取具有相应节奏特征的参照音乐数据;对参照音乐数据进行情感表达分析;根据情感数据对所有的参照音乐数据进行情感分类处理;根据情感类别中参照音乐数据的数量对所有的情感类别进行排序;根据预设范围值在所有排序后的情感类别中截取相应的情感类别;计算截取后的情感类别的情感应用频率以及相应情感类别中的节奏应用频率;整理成图表后输出,具有减少音乐创作或音乐搭配失误的情况发生,提高音乐创作或音乐搭配的工作效率,增强音乐效果的作用。
-
公开(公告)号:CN118499796A
公开(公告)日:2024-08-16
申请号:CN202410606726.3
申请日:2024-05-16
Applicant: 国家电投集团江西电力有限公司景德镇发电厂
Abstract: 本申请公开了一种基于声波测温技术的锅炉炉膛优化吹灰系统及方法,包括通过声波检测系统全方位检测炉膛左右侧烟气温度水平;将锅炉炉膛吹灰系统中检测到的声波信息、炉膛设计与结构参数、煤质数据和运行参数,形成信息数据库,其中,所述声波信息包括炉膛各燃烧截面层温度参数;重构炉膛截面二维温度场;运用燃烧截面温度计算炉膛热有效系数,寻求最小吹灰频率,实现锅炉炉膛优化吹灰。本发明利用声波测温技术对炉膛截面温度进行采集计算,对采集的数据进行分析判断,重构炉膛温度场,利用炉膛热有效系数,寻求最小吹灰频率,实现锅炉炉膛优化吹灰。
-
-
-
-
-
-
-
-
-