一种基于学习补偿的背景噪声去除方法

    公开(公告)号:CN109841227A

    公开(公告)日:2019-06-04

    申请号:CN201910182463.7

    申请日:2019-03-11

    Abstract: 本发明公开了一种基于学习补偿的背景噪声去除方法,包括以下步骤:步骤(1):按照会议规模将会议场景背景噪声数据集分为小型会议背景噪声、中等会议背景噪声、大型会议背景噪声;步骤(2):背景噪声估计具体为:步骤(2.1):采用GMM模型学习背景噪声的特征,分别得出小型会议背景噪声、中等会议背景噪声、以及大型会议背景噪声的背景噪声分布;步骤(2.2):通过GMM识别出采集的语音信号属于何种规模的背景噪声,最后根据识别结果选择对应规模的背景噪声分布;步骤(3):根据所估计出的背景噪声分布,采用噪声学习补偿算法对采集的语音信号进行补偿,去除采集语音信号中的背景噪声。本发明具有有效去除背景噪声的优点。

    面向游戏直播场景的精彩时刻实时识别与预录制方法

    公开(公告)号:CN109672899A

    公开(公告)日:2019-04-23

    申请号:CN201811523869.9

    申请日:2018-12-13

    Inventor: 张晖 叶子皓

    Abstract: 本发明揭示了一种面向游戏直播场景的精彩时刻实时识别与预录制方法,包括如下步骤:S1、直播开始后,设置视频缓存池,对直播视频流进行缓存;S2、对直播内容进行区域划分;S3、为各区域设置各自的打分模式及精彩程度加权系数,使用精彩时刻识别系统对各个区内的精彩程度打分;S4、通过加权统计后得到当前画面的精彩得分,识别精彩时刻;S5、识别到精彩时刻后触发预录制系统,录制直播内容,直至达到录制结束标准后停止录制并储存已录制内容。本发明通过对人工智能及图像识别技术的合理利用,免除了现有技术中人工剪辑和后期制作的作业负担,克服了视频制作过程中对人工操作的依赖,降低了制作成本。

    基于买卖模型及两层优化的节点激励方法

    公开(公告)号:CN105682176B

    公开(公告)日:2019-03-05

    申请号:CN201610033588.X

    申请日:2016-01-19

    Inventor: 张晖 任文辉

    Abstract: 本发明公开了基于买卖模型及两层优化的节点激励方法,该方法首先设定无线泛在环境下的多网络、多终端的通信场景,拥塞网络小区A中存在业务需求速率很高的节点s,节点s附近空闲网络小区集为:Γ={k1,k2,…,km},对应的接入点集为D={d1,d2,…,dm},其中m代表空闲网络小区数目,ki∈Γ对应的中继节点集为Ri={ri1,ri2,…,rin}。该方法结合无线泛在环境泛在网络、泛在终端的特点,根据无线通信环境构建业务需求节点与中继节点之间的买卖模型,实现激励中继节点协作转发的目的;在激励中继节点的基础上,通过两层优化模型达到业务需求节点以最低激励价格满足其业务速率要求的目标。

    面向哭声检测系统的Mel能量声纹特征提取方法

    公开(公告)号:CN108564967A

    公开(公告)日:2018-09-21

    申请号:CN201810208675.3

    申请日:2018-03-14

    Inventor: 张晖 毛小旺

    Abstract: 本发明提出一种面向哭声检测系统的Mel能量声纹特征提取方法,本发明的方法基于声纹识别系统中常用的Mel倒谱系数特征,进行深入研究,发现在Mel频谱域,哭声信号Mel能量分布范围以及振荡程度与其他音频信号有较高区分度;为此,针对能量曲线分布范围差异性,提出Mel对数能量波动特征;针对能量曲线振荡差异性,提出Mel对数能量振荡特征。本发明提出的声纹特征提取方法为哭声检测系统提供了性能良好的特征提取解决方案,对哭声检测系统的性能提升有很大帮助。

    一种面向第三方音频播放器的数据截取方法

    公开(公告)号:CN105468360B

    公开(公告)日:2018-09-21

    申请号:CN201510791453.5

    申请日:2015-11-17

    Inventor: 张晖 刘宝

    Abstract: 本发明提出了一种面向第三方音频播放器的数据截取方法,从Android系统Native层的音频核心AudioFlinger入手,通过新创建的协同工作子线程与标准Android音频系统线程交互合作形成完备的数据截取闭环,在准确截取任意第三方音频播放器音频数据的同时又能保持对第三方音频播放器透明。本发明提出的一种面向第三方音频播放器的数据截取方法,通过软件方法加以实现,具有良好的可移植性与向后兼容性。

    面向智能家居场景的实时人形检测方法

    公开(公告)号:CN108549855A

    公开(公告)日:2018-09-18

    申请号:CN201810280722.5

    申请日:2018-04-02

    Inventor: 张晖 张迪

    Abstract: 面向智能家居场景的实时人形检测方法,包括如下步骤:S1、预处理一张无人物的家居场景图像作为背景图;S2、预处理视频流中的每一帧图像,获取当前帧处理后的图像;S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图进行处理,获人形所在区域的图像;S4、人形所在区域的图像中的每个像素的灰度值与设定好的阈值进行比较,获取掩码图,利用矩形拟合掩码图,获取人形图像;S5、分离人形图像的红色、绿色、蓝色通道图像,获取该人形图像的HOG特征;S6、通过SVM对人形图像的HOG特征进行训练,获取人形模型。该方法通过背景减除法分割人形图形,再利用矩形框拟合掩码图,提取人形图像的HOG特征,训练人形模型,可以快速准确的检测人形图像。

    一种基于深度学习的老人跌倒行为的识别方法

    公开(公告)号:CN108549841A

    公开(公告)日:2018-09-18

    申请号:CN201810233464.5

    申请日:2018-03-21

    Inventor: 张晖 赵前龙

    Abstract: 本发明涉及一种基于深度学习的老人跌倒行为的识别方法,基于卷积神经网络与长短时记忆网络构建深度神经网络,使用长短时记忆网络对视频进行建模,通过卷积神经网络提取图像特征,LSTM将底层CNN的输出连接起来作为下一时刻的输入,并最终使用softmax分类器对图像进行识别判断。本发明够针对人体行为通过自适应地选择区域或位置的序列并且仅以图像或视频中高分辨率处理所选择的区域提取信息,将其运用于老人跌倒行为的识别工作中,能够有效识别出老人的跌倒行为,提高行为识别的准确性。

    面向大型直播场景的多人特写实时识别与自动截图方法

    公开(公告)号:CN108388885A

    公开(公告)日:2018-08-10

    申请号:CN201810222865.0

    申请日:2018-03-16

    Inventor: 张晖 杨纯

    Abstract: 本发明公开了一种面向大型直播场景的多人特写实时识别与自动截图方法,具体为:将人脸大小、清晰度以及人脸位置分别作为截图的第一、二、三指标,首先实时获取直播视频的当前视频帧图像,检测所述视频帧图像中的人脸获得人脸区域并进行跟踪,然后对人脸区域的人脸大小、清晰度以及位置依次进行评估,进而选取符合截图标准的人脸图像,并将当前视频帧图像截图保存,送入人脸识别模块进行识别,输出识别结果。该发明可应用在大型直播场景下对视频中的多人特写进行识别与截图,当满足截图指标时自动截图保存,确保获得质量更佳的截图。

    面向智能家居场景的手势识别方法

    公开(公告)号:CN108345867A

    公开(公告)日:2018-07-31

    申请号:CN201810193484.4

    申请日:2018-03-09

    Inventor: 张晖 张迪

    Abstract: 面向智能家居场景的手势识别方法,包括如下步骤:S1、对初始图像进行预处理;S2、将预处理后的图像从RGB颜色空间转化为HSV颜色空间,转化后的图像中的每个像素与肤色阈值进行比较,获取掩码图;利用矩形拟合掩码图,截取矩形部分,获取手势图像;S3、分离手势图像的红、绿、蓝三色通道图像,将手势图像分成9个单元,计算各单元中每个像素的LBP值,对每个单元的LBP值进行归一化,统计每个单元的LBP分布直方图,再串联成一个图像LBP分布直方图,获取图像的LBP特征;S4、通过SVM对LBP特征进行训练,获取手势模型;本发明将图像转化为HSV颜色空间进行手势图像分割,再利用矩形框拟合掩码图,提取手势的LBP特征,训练手势模型,可以快速准确的定位和识别图像中手势。

Patent Agency Ranking