一种音频混响的抑制装置及其抑制方法

    公开(公告)号:CN103440869B

    公开(公告)日:2017-01-18

    申请号:CN201310398174.3

    申请日:2013-09-03

    Abstract: 本发明公开了一种音频混响的抑制装置及其抑制方法,所述的装置包括混响时间盲估计模块、后期混响功率谱估计模块、谱减模块和复倒谱域滤波模块。混响语音通过混响时间盲估计模块,估计出混响时间;后期混响功率谱估计模块利用所估计出的混响时间来建立混响统计模型,并对混响语音进行分析处理,得到后期混响功率谱;谱减模块包括增益函数构造和谱减实施模块,先用混响语音功率谱和后期混响功率谱构造出谱减增益函数;再将谱减增益函数和混响语音输入谱减实施模块,得到前期语音;最后将前期语音输入到复倒谱域滤波模块,得到去混响的语音。本发明计算复杂度较低,便于实时处理,能明显抑制音频混响,有效提高语音质量。

    一种低照度视频图像增强方法

    公开(公告)号:CN103455979B

    公开(公告)日:2016-12-28

    申请号:CN201310298869.4

    申请日:2013-07-16

    Inventor: 陈喆 殷福亮 潘凯

    Abstract: 本发明公开了一种低照度视频图像增强方法,属于图像处理技术领域。本发明包括白平衡处理模块、图像去噪模块、图像增强模块、边缘补偿模块、帧间补偿模块;视频图像信息依次经过白平衡处理模块、图像去噪模块、图像增强模块、边缘补偿模块、帧间补偿模块,最后得到增强视频图像。

    一种分布式麦克风阵列中麦克风位置估计系统

    公开(公告)号:CN103439689B

    公开(公告)日:2015-12-23

    申请号:CN201310370093.2

    申请日:2013-08-21

    Abstract: 本发明公开了一种分布式麦克风阵列中麦克风位置估计系统,包括声源信号产生模块、扬声器、参考麦克风、待定位麦克风以及麦克风位置估计模块;声源信号产生模块输出端输出信号经扬声器转换为声音在分布式麦克风阵列的工作场地中播放;该声音被参考麦克风和待定位麦克风所接收;参考麦克风和待定位麦克风接收的信号同时传递至与待定位麦克风对应的麦克风位置估计模块。本发明用三个不同频带的信号作为三个声源的发声信号,在麦克风位置估计过程中一次性采集并分离出三个声源,能实现麦克风位置的在线估计。本发明将基于能量和时延的测距方法结合使用,先后进行距离的粗略、精细估计,保证了位置估计具有较小的计算量和较高的精度。

    一种基于相似性的音乐推荐方法

    公开(公告)号:CN103440873B

    公开(公告)日:2015-10-28

    申请号:CN201310379100.5

    申请日:2013-08-27

    Inventor: 陈喆 殷福亮 时丹

    Abstract: 本发明公开了一种基于混合特征和高斯混合模型的音乐相似度检测方法,基本思路如下:用伽马通倒谱系数进行相似度检测,并将多种特征的加权相似度作为最终的检测结果;提出一种基于帧轴的调制频谱特征,用该特征表示音乐的长时特征,并且将长时特征与短时特征的组合作为下一步建模的输入;使用高斯混合模型对各个音乐特征建模,首先利用动态K均值方法对模型进行初始化,接着用期望最大化算法进行模型训练,获得准确的模型参数,最后使用对数似然比算法获得音乐之间的相似度。本发明对音乐特征的获取更为充分和深入,提高了音乐推荐的准确程度。本发明可降低特征矢量维数,降低音乐数据库信息存储量,提高音乐推荐的准确程度。

    一种基于HRTF结构化模型与主观反馈的个性化方法

    公开(公告)号:CN104967952A

    公开(公告)日:2015-10-07

    申请号:CN201510387214.3

    申请日:2015-06-30

    Abstract: 本发明公开了一种基于HRTF结构化模型与主观反馈的个性化方法,包括以下步骤:S1:实验者选取个性化定制的方向,生成初始种群:S2:获得种群中个体的适应度及个体区间:S3:对包含八个个体的种群进行选择操作,S4:对包含八个个体的种群进行交叉操作,S5:对包含八个个体的种群进行变异操作;S6:步骤S2、S3、S4、S5不断迭代,直到实验者感知的声像与目标声像一致,进行S7;S7:垂直方向个性化结束后,进行水平方向个性化。

    一种基于Legendre矩的图像亚像素边缘检测方法

    公开(公告)号:CN104899888A

    公开(公告)日:2015-09-09

    申请号:CN201510340586.0

    申请日:2015-06-18

    Inventor: 陈喆 殷福亮 张一

    CPC classification number: G06T7/13

    Abstract: 本发明公开了一种基于Legendre矩的图像亚像素边缘检测方法,包括以下步骤:S1:读取图像信息,将图像灰度化并对灰度图像进行去噪处理;S2:采用Sobel算子对去噪后的图像进行像素级边缘定位:利用像素点的各向邻点灰度加权值在边缘点达到最大值这一现象进行边缘检测;S3:采用Legendre矩对图像进行亚像素边缘检测,输出边缘图像。其中Sobel算子对噪声具有平滑作用,提供较为准确的边缘方向信息,利用Legendre矩进行亚像素边缘检测,减少了运算所需要的模板的数量,降低了计算的复杂度,同时在抗噪方面具有更好的鲁棒性。

    一种人工语音带宽扩展的方法

    公开(公告)号:CN103258543B

    公开(公告)日:2015-06-03

    申请号:CN201310130081.2

    申请日:2013-04-12

    Abstract: 本发明公开了一种人工语音带宽扩展的方法。其工作过程如下:窄带语音信号经过曲线拟合模块后输入到外推高频包络模块处理,外推高频包络模块的输出信号进入频谱成型模块;窄带语音信号经过特征提取模块后每帧得到一组线性预测系数,利用线性预测系数构造自回归模型及滤波模块,将白噪声通过此AR模型进行处理产生与低频相关的高频噪声随机序列,高频噪声随机序列进入频谱成型模块;频谱成型模块输出高频语音;高频语音与原始窄带语音信号经过语音合成模块得到宽带语音。

    一种基于视频图像的信息传输方法

    公开(公告)号:CN104284207A

    公开(公告)日:2015-01-14

    申请号:CN201410582828.2

    申请日:2014-10-27

    CPC classification number: H04N21/2383 H04N21/435 H04N21/4382

    Abstract: 本发明涉及一种基于视频图像的信息传输方法,该方法首先在信号发送端将数据信息进行编码;然后将编码后的码流调制到图像中,产生视频信息;通过视频传输通道,在接收端利用设备自带的摄像头获取发送端产生的视频信息,然后对接收到的视频进行解调,得到图像中的码流信息;最后对解调的码流进行译码,便可还原得到传输的数据。只需利用移动终端自带的摄像头便可进行数据的传输,具有很高的分辨率和成像质量,且成本低廉,环境干扰小,以此解决了断网、断无线、不接U盘就不能传输数据的问题。因此,本发明可以广泛用于数据传输领域。

    一种轮毂工件定位的装置及其方法

    公开(公告)号:CN104123542A

    公开(公告)日:2014-10-29

    申请号:CN201410349103.9

    申请日:2014-07-18

    Abstract: 本发明公开了一种轮毂工件定位的装置及其方法,所述的装置包括图像采集模块、轮毂模板信息提取模块、待检测轮毂特征点提取模块、特征点匹配模块和轮毂定位模块;轮毂模板信息提取模块用于提取轮毂模板图像上的SIFT特征点、圆心和气嘴的位置以及轮毂外边缘圆周上的四个点。本发明考虑到轮毂图像匹配过程中遇到的光照影响以及平移、旋转、尺度变化等问题,采用尺度不变特征变换特征点匹配方法来匹配出模板图像和待检测图像中空间对应的点对,然后通过这些点对判断模板图像和待检测图像中轮毂区域图像的空间对应关系,最后将模板图像中已知的标定点通过二者的空间对应关系计算出待检测图像中轮毂区域对应的点,从而达到轮毂定位的目的。

    一种用于电力线通信的多输入多输出信号检测方法

    公开(公告)号:CN103457701A

    公开(公告)日:2013-12-18

    申请号:CN201310365330.6

    申请日:2013-08-19

    Abstract: 本发明涉及一种用于电力线通信的多输入多输出信号检测方法,属于信号处理技术领域。发送端在发送信号序列之前,需要发送iter帧训练序列,iter为算法的迭代次数,迭代次数范围为100~200;在接收端,首先进行初始化,即wi(0)=0,Pi(0)=δI,其中P为计算过程中所需要的矩阵,I为N×N的单位阵,N为接收天线数,此处为2×2的单位阵,δ是一个足够大的正常数,此处为δ=106。

Patent Agency Ranking