一种非线性编辑网络中低码流素材上变换的方法及系统

    公开(公告)号:CN101448150B

    公开(公告)日:2012-05-09

    申请号:CN200710178202.5

    申请日:2007-11-28

    IPC分类号: H04N7/26 H04N9/804 G11B27/02

    摘要: 本发明涉及一种非线性编辑网络中低码流素材上变换的方法及系统,属于电视台节目制作技术领域。利用现有场分解的方法进行低码流素材的上变换并不能得到理想的效果。本发明将低码流素材解压成帧数据;然后将帧数据中的每一帧画面复制产生奇数场和偶数场;再计算奇数场和偶数场中插值点的值,分别对奇数场和偶数场进行插值,在需要插值的地方利用原画面中相应的点计算出新的点;最后将插值后得到的奇数场和偶数场合成为一帧画面并输出。采用本发明所述的方法及系统,有效地改善了现有低码流素材变换到高分辨率下的画面效果,有利于对低码流素材进行编辑。

    自动字幕生成系统中语音区间的检测方法

    公开(公告)号:CN101625862A

    公开(公告)日:2010-01-13

    申请号:CN200810116460.5

    申请日:2008-07-10

    IPC分类号: G10L11/02 H04N5/278

    摘要: 本发明涉及自动字幕生成系统中的语音检测技术,具体涉及一种自动字幕生成系统中语音区间的检测方法。该方法将音频采样序列分成固定长度的帧,计算每一帧的短时能频值,并形成一个短时能频值序列;从第一帧数据开始,分析短时能频值序列,寻找短时能频值序列的上升区间或下降区间;通过计算短时能频值序列波形的平均斜率,并与门限值进行比较,确定语音的起点或终点,最终完成对语音区间的检测。本发明可以在背景噪声经常发生变化的情况下,对连续语音进行语音端点检测,从而提高在复杂噪声背景下的语音端点检测效率。

    语音端点检测中短时能频值的提取方法

    公开(公告)号:CN101625858A

    公开(公告)日:2010-01-13

    申请号:CN200810116461.X

    申请日:2008-07-10

    IPC分类号: G10L11/00 G10L11/02 G10L15/04

    摘要: 本发明涉及自动字幕生成系统中的语音检测技术,具体涉及一种语音端点检测中短时能频值的提取方法。该方法将音频采样序列分成固定长度的帧,并形成一个帧序列;针对每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数;根据上述音频特征参数计算每一帧数据的短时能频值,并形成一个短时能频值序列。本发明将时域和频域的音频特征参数结合在一起,能够发挥它们各自的长处,同时又可以在一定程度上规避各自的缺点,从而能够有效的应对各种不同类型的背景噪声。

    一种增强画面显示效果的方法

    公开(公告)号:CN102769720B

    公开(公告)日:2017-09-12

    申请号:CN201210082335.3

    申请日:2012-03-26

    发明人: 张婷

    IPC分类号: H04N5/262

    摘要: 本发明公开了一种增强画面显示效果的方法,包括以下步骤:提取素材的运动轨迹;将所述素材的运动轨迹转换成二维线条,并对所述二维线条上的每一个点的坐标与其相邻的点的坐标做差数计算,得到差数坐标值;比较所述差数坐标值与用户预先配置的最大临界坐标值与最小临界坐标值之间的大小;若当前点与其相邻点之间差数坐标值大于所述最大临界坐标值或小于所述最小临界坐标值时,调用平滑模块,根据接收用户输入的平滑参数指令做平滑处理;通过平滑后的二维线条重新配置素材的运动轨迹,并发送至显示设备,显示平滑后的素材运动效果。通过采用本发明提供对素材的运动轨迹进行自动平滑处理,大大节省了工作,提高了工作效率,并增强了画面显示质量。

    一种利用色键进行图像校色选区的方法

    公开(公告)号:CN102752544B

    公开(公告)日:2017-06-13

    申请号:CN201110370709.7

    申请日:2011-11-21

    发明人: 张婷 李和平

    IPC分类号: H04N5/275 H04N9/75

    摘要: 本发明实施例公开了一种利用色键进行图像校色选区的方法,所述色键由中心点、门限和软边组成,所述方法包括以下步骤:在所述中心点和所述门限之间设置一过渡点,根据门限值计算过渡点值;根据所述过渡点值和所述门限值计算第一斜率;根据所述门限值和软边值计算第二斜率;根据所述第一斜率和所述第二斜率选择目标颜色区。本发明实施例中,通过在HSL色键中心点与门限之间设置过渡点,并根据所述过渡点与所述门限的第一斜率,所述门限与所述软边的第二斜率,实现HSL色键平滑选取目标颜色区。

    一种基于色键选区进行图像校色的方法

    公开(公告)号:CN102752612B

    公开(公告)日:2016-06-15

    申请号:CN201110371833.5

    申请日:2011-11-21

    发明人: 张婷 李和平

    IPC分类号: H04N9/75

    摘要: 本发明实施例公开了一种基于色键选区进行图像校色的方法,所述方法包括以下步骤:获取图像的原始颜色;根据所述图像的原始颜色设置色键,所述色键包括中心点、门限和软边;在所述中心点和所述门限之间设置一过渡点,根据门限值计算过渡点值;根据所述过渡点值和所述门限值计算第一斜率;根据所述门限值和软边值计算第二斜率;根据所述第一斜率和所述第二斜率选择目标颜色区;根据选择的所述目标颜色区更新图像的原始颜色。本发明实施例中,通过在色键中心点与门限之间设置过渡点,并根据所述过渡点与所述门限的第一斜率,所述门限与所述软边的第二斜率,实现平滑选取目标颜色区。

    一种视频图像超标检测方法及装置

    公开(公告)号:CN104967840A

    公开(公告)日:2015-10-07

    申请号:CN201510347568.5

    申请日:2015-06-19

    IPC分类号: H04N17/00 H04N17/02

    摘要: 本申请提供了一种视频图像超标检测方法及装置,获取视频图像的YUV像素值;通过标准转换公式,将所述YUV像素值转换电平值;统计亮度信号Y的超标点数量和色度信号UV的超标点数量,并计算所述亮度信号Y、色度信号UV的超标点数量与所述视频图像像素点数量的比值;当亮度信号Y、色度信号UV中任意一项的比值超过预设第一阈值时,确定本次检测结果为所述视频图像超标。由于本申请实施例中是通过标准转换公式将YUV像素值转换为电平值,并分别计算亮度信号Y、色度信号UV的超标点数量与所述视频图像像素点数量的比值,来判断所述视频图像是否超标,相比现有技术准确性更高。

    一种增强画面显示效果的方法

    公开(公告)号:CN102769720A

    公开(公告)日:2012-11-07

    申请号:CN201210082335.3

    申请日:2012-03-26

    发明人: 张婷

    IPC分类号: H04N5/262

    摘要: 本发明公开了一种增强画面显示效果的方法,包括以下步骤:提取素材的运动轨迹;将所述素材的运动轨迹转换成二维线条,并对所述二维线条上的每一个点的坐标与其相邻的点的坐标做差数计算,得到差数坐标值;比较所述差数坐标值与用户预先配置的最大临界坐标值与最小临界坐标值之间的大小;若当前点与其相邻点之间差数坐标值大于所述最大临界坐标值或小于所述最小临界坐标值时,调用平滑模块,根据接收用户输入的平滑参数指令做平滑处理;通过平滑后的二维线条重新配置素材的运动轨迹,并发送至显示设备,显示平滑后的素材运动效果。通过采用本发明提供对素材的运动轨迹进行自动平滑处理,大大节省了工作,提高了工作效率,并增强了画面显示质量。

    语音端点检测中的短时能频值波形斜率门限的确定方法

    公开(公告)号:CN101625859A

    公开(公告)日:2010-01-13

    申请号:CN200810116462.4

    申请日:2008-07-10

    IPC分类号: G10L11/00 G10L11/02 G10L15/04

    摘要: 本发明涉及自动字幕生成系统中的语音检测技术,具体涉及一种语音端点检测中的短时能频值波形斜率门限的确定方法。该方法通过分析当前的短时能频值序列,找出其最小值EZE-featuremin和最大值EZE-featuremax,然后计算EZE-featuremax/100;比较EZE-featuremin和EZE-featuremax/100,取其中较大者,记为EZE-featureslope;确定短时能频值波形斜率门限值为Rm=EZE-featureslope×2。通过本发明所述方法找到的短时能频值斜率门限对于整个短时能频值序列都有效,因此在语音端点检测过程中不需要再次进行修改,而且在绝大部分情况下基本可以满足寻找语句端点的需要,因此,可以提高语音端点的检测效率。

    视音频文件检测方法、装置、电子设备及可读介质

    公开(公告)号:CN114495202A

    公开(公告)日:2022-05-13

    申请号:CN202111631192.2

    申请日:2021-12-28

    IPC分类号: G06V40/16 G06V20/40

    摘要: 本发明实施例提供了一种视音频文件检测方法、装置、电子设备及可读介质,方法包括:获取待检测的视音频文件,提取视频数据中包含人脸的视频帧,并识别出视频帧中的人脸区域,检测人脸区域的亮度平均值和背景区域的亮度平均值,计算人脸区域的亮度平均值和背景区域的亮度平均值的比值,并基于比值确定视音频文件为质量异常的视音频文件。本发明实施例中,通过计算人脸区域的亮度平均值和背景区域的亮度平均值的比值,并可以基于比值确定视音频文件为质量异常的视音频文件,代替人工检测的方法,在提高视音频文件的检测效率同时,保证了视音频文件质量检测的准确性,避免因图像的问题用肉眼难以辨别,导致漏检的情况发生。