-
公开(公告)号:CN102592593B
公开(公告)日:2014-01-01
申请号:CN201210091525.1
申请日:2012-03-31
Applicant: 山东大学
Abstract: 本发明公开了一种考虑语音中多线性群组稀疏特性的情绪特征提取方法,该方法考虑语音信号中包括时间、频率、尺度和方向信息的多重因素,利用多线性群组稀疏分解的方法进行特征提取,通过不同尺度和方向的Gabor函数对语音信号能量谱进行多线性表征,利用群组稀疏张量分解方法求解特征投影矩阵,计算频率阶上的特征投影,经过离散余弦变换对特征去相关,最终计算特征的一阶和二阶差分系数,得到语音情绪特征。本发明考虑语音信号中的时间、频率、尺度和方向等因素用于情绪的特征提取,利用群组稀疏张量分解方法进行特征投影,最终提高了多类语音情绪识别的准确率。
-
公开(公告)号:CN103247018A
公开(公告)日:2013-08-14
申请号:CN201310188433.X
申请日:2013-05-20
Applicant: 山东大学
IPC: G06T1/00
Abstract: 本发明提供了一种基于对数域视觉模型的扩展变换抖动调制水印方法,包括嵌入水印步骤和检测水印步骤。首先将载体图像分块,在每个分块中提取待嵌入水印的系数向量,对每个向量在随机方向上的投影进行对数域转换,同时根据对数域的视觉模型计算每个系数向量对应的量化步长,利用抖动调制水印嵌入对每个分块嵌入水印信息,最后重建得到嵌入水印的图像。检测水印时,根据上述相同的方法,经过对数域转换和量化步长的计算,提取水印信息。本发明对水印的鲁棒性及不可见性有极大的改善与提高。
-
公开(公告)号:CN102231280B
公开(公告)日:2013-04-03
申请号:CN201110117022.2
申请日:2011-05-06
Applicant: 山东大学
IPC: G10L21/0272 , G10L21/0232 , G10L25/18
Abstract: 本发明提供了一种卷积语音信号的频域盲分离排序算法,对于卷积混叠语音信号,首先由时域转换到频域,在每个频带上使用频域ICA算法进行盲分离,然后使用本发明的排序算法进行排序:(1)选取基准频带进行对准;(2)根据已排序好的基准频带对剩余频带进行排序;(3)标记可能出现排序错误的频带,利用基于分离矩阵的DOA估计进行补充性对准。本发明利用基准频带对准的思想并结合了现有基于频带相关性的排序算法和基于DOA的排序算法两类排序算法的优势,具有很好的鲁棒性和准确性,并且在真实环境中仍然适用。
-
公开(公告)号:CN102223553B
公开(公告)日:2013-03-20
申请号:CN201110140389.6
申请日:2011-05-27
Applicant: 山东大学
Abstract: 本发明提供一种二维视频到三维视频的自动转换方法,针对带运动物体的静止场景,首先对背景进行高斯建模,重建出静止的背景和分割出前景的大致区域,针对背景图像,利用单目几何信息和分类学习算法对每个像素进行几何分类,根据分类结果得到深度图;针对前景区域,采用均值移位算法对图像进行分割,然后对图像进行边缘检测、边缘连接和端点消除得到精确的前景区域,与背景深度图融合之后得到每一帧的深度图;右视图的合成算法采用先重建右视图中的背景,然后用该右视背景来进行补洞;本发明将得到左右视图投放在三维显示设备上可以自动获得良好的3D效果,无需人工参与。
-
公开(公告)号:CN102209243B
公开(公告)日:2012-10-24
申请号:CN201110140471.9
申请日:2011-05-27
Applicant: 山东大学
Abstract: 本发明公开了一种基于线性模型的深度图帧内预测方法,利用当前编码块的上一行和左侧一列的相邻像素的灰度值及其坐标确定线性模型参数;依据该参数以及当前编码块的像素坐标对当前编码块的像素灰度值进行预测。本发明利用了深度图的空间特性,具有预测准确的优点;同时由于本发明采用当前编码块的上一行和左侧一列的邻近像素计算模型参数,因此编码端不必对模型参数进行编码,解码端就可以直接确定模型参数。本发明可应用于三维立体视频的编码标准中。
-
公开(公告)号:CN102665135A
公开(公告)日:2012-09-12
申请号:CN201210113225.9
申请日:2012-04-18
Applicant: 山东大学
IPC: H04N21/436 , H04N21/4363 , H04N21/4402
Abstract: 本发明公开了一种嵌入式屏幕传输系统及其操作方法,该系统由连接在一个局域网内的屏幕发送端和屏幕接收端组成,屏幕发送端以TI达芬奇平台DM3730为核心,采用ARM微处理器和数字信号处理器DSP双核架构,ARM微处理器运行Linux系统和屏幕发送主程序,数字信号处理器DSP负责色彩空间格式转换、视频编码等大数据量运算;屏幕接收端运行在PC机上,实时显示发送端屏幕;ARM微处理器上包括UI界面控制模块、屏幕抓取模块、色彩空间转换模块、视频编码模块、TS流封装模块和网络发送模块。本发明采用模块化设计,有效地缩短了开发周期,降低了开发成本,能够将屏幕发送端屏幕显示内容通过网络即时传送到屏幕接收端显示。
-
公开(公告)号:CN102664010A
公开(公告)日:2012-09-12
申请号:CN201210137353.7
申请日:2012-05-04
Applicant: 山东大学
IPC: G10L17/00
Abstract: 本发明公开了一种考虑语音中多因素的频率位移不变特征提取方法,用于复杂环境下的文本无关说话人辨别,该方法考虑了语音的时间、频率、尺度和相位信息,通过不同尺度和相位的二维复数小波变换对语音信号能量谱进行多因素表征,考虑频率的位移不变特性,利用卷积型非负张量分解方法,计算频率阶上的位移不变特征投影矩阵,得到多因素的稀疏特征,通过离散余弦变换对特征去相关,计算特征的一阶和二阶差分系数,最终获得具有较好鲁棒性的说话人特征。本发明考虑语音信号多因素频率位移不变特征提取方法,利用卷积型非负张量分解方法计算具有鲁棒性的多因素频率位移不变特征,用于噪声环境下的文本无关说话人辨别,具有较好的识别准确率。
-
公开(公告)号:CN102594928A
公开(公告)日:2012-07-18
申请号:CN201210099568.4
申请日:2012-04-05
Applicant: 山东大学
Abstract: 本发明涉及一种协作上下文感知的框架模型,包括设备节点、采集上下文信息的感知节点和向设备节点发送指令信息的中心节点或融合节点,所述中心节点为计算机或手机;所述设备节点通过Zigbee网络、IGRS网络、通用RF网络、UPnP网络或DLNA网络与中心节点无线连接,所述感知节点通过Zigbee网络、IGRS网络、通用RF网络、UPnP网络或DLNA网络与中心节点无线连接;所述设备节点之间通过Zigbee网络、IGRS网络、通用RF网络、UPnP网络或DLNA网络无线连接;感知节点、中心节点和设备节点之间的感知协作模式包括基于相关任务的节点间协作感知模式、基于同任务的节点间协作感知模式和基于相关任务的节点间协作感知模式与基于同任务的节点协作感知模式相结合的融合模式。本发明提高了感知的可靠性和精度、提高了节点利用率、降低了中心节点计算和存储的压力。
-
公开(公告)号:CN102063258B
公开(公告)日:2012-07-04
申请号:CN201010617544.4
申请日:2010-12-31
Applicant: 山东大学
IPC: G06F3/048
Abstract: 本发明公开了一种针对不同尺寸显示终端上的图像自适应显示方法,包括以下步骤:(1)视觉注意模型的构建,得到最终的显著图;(2)最显著位置的标定:将得到的最终的显著图进行分块,找到显著能量最大的块标定为显著图中最显著的位置;(3)自适应调整:以标定的最大显著值位置的中心为坐标轴原点,根据目标显示器尺寸及比例,逐步向x、y正负坐标轴方向扩大显示窗口。本发明避免了图像在不同尺寸显示器上显示时容易出现的重要关注区域丢失的问题,且使图像的重要区域,也就是观赏者最关注的区域的视觉失真降到最低,保持显示内容中的显著性对象准确完整。
-
公开(公告)号:CN102209243A
公开(公告)日:2011-10-05
申请号:CN201110140471.9
申请日:2011-05-27
Applicant: 山东大学
Abstract: 本发明公开了一种基于线性模型的深度图帧内预测方法,利用当前编码块的上一行和左侧一列的相邻像素的灰度值及其坐标确定线性模型参数;依据该参数以及当前编码块的像素坐标对当前编码块的像素灰度值进行预测。本发明利用了深度图的空间特性,具有预测准确的优点;同时由于本发明采用当前编码块的上一行和左侧一列的邻近像素计算模型参数,因此编码端不必对模型参数进行编码,解码端就可以直接确定模型参数。本发明可应用于三维立体视频的编码标准中。
-
-
-
-
-
-
-
-
-