基于事件相机和传统光学相机的即时回放方法及系统

    公开(公告)号:CN117635655A

    公开(公告)日:2024-03-01

    申请号:CN202311441431.7

    申请日:2023-11-01

    Applicant: 武汉大学

    Abstract: 一种基于事件相机和传统光学相机的即时回放方法及系统,采用事件相机和传统光学相机拍摄平台,通过共同拍摄实现球体运动跟踪,事件相机通过少量的离散数据形式实现高时间分辨的球体运动记录,摄像机拍摄场景标定,球体识别、定位和追踪。本发明能进行比赛信息记录,用于比赛中的球体轨迹回放显示。拍摄平台中的事件相机和传统光学相机经过时空同步后,保证记录信息的对应,放置在场地周围的拍摄平台通过记录的场地信息进行标定,得到像素空间和实际空间位置对应关系,依据对应关系将拍摄平台记录的事件流和图像帧中的球体运动轨迹进行转换,到三维虚拟场景中进行回放。本发明保证估计精度且记录所需的数据量很小,处理所需时间很短,成本低廉。

    基于电网频率谐波信息融合的音频取证方法

    公开(公告)号:CN116612786A

    公开(公告)日:2023-08-18

    申请号:CN202310620145.0

    申请日:2023-05-25

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于电网频率谐波信息融合的音频取证方法,步骤如下:其主要步骤包括:1)从目标音频中提取电网频率的多阶谐波的样本数据;2)对步骤1的样本数据进行预处理;3)计算各个谐波的去片段率,并确定主谐波和可选谐波;4)确定主谐波的可补区间;5)在每个可补区间,判断可选谐波是否存在片段;6)计算每个可补区间的最长可补片段,并拼接到主谐波上;7)将上一步得到的结果与参考数据库中的真实电网频率信号进行匹配,选出相关系数最大的一段参考信号,其对应的时间认为是目标音频的录制时间。本发明通过电网谐波带来的更多电网频率信息,能够使融合后的信号更加贴近参考信号,从而在音频取证上获得更加准确的结果。

    基于DPRNN-Ext的单通道端到端语音提取方法

    公开(公告)号:CN116189704A

    公开(公告)日:2023-05-30

    申请号:CN202310135796.0

    申请日:2023-02-13

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于DPRNN‑Ext的单通道端对端语音提取方法,采用双路径循环神经网络作为目标语音提取主网络,其步骤主要包括:1)卷积编码器将目标对象的参考语音信息和输入的多人混合录音转为可以进行深度学习的语音特征。2)通过嵌入提取网络对上一步得到的目标对象的参考语音特征进行转化,得到能够体现目标对象声纹信息的嵌入向量。3)目标语音提取主网络结合嵌入向量和第1步得到的多人混合录音的语音特征,进行目标语音特征的学习。4)解码器将上一步得到的目标语音特征进行转化,得到目标对象的语音信息。本发明在目标语音信息提取方面具有准确性、稳定性与及时性,并且在不同目标人条件下具有可观的泛化能力。

    一种基于卷积神经网络的视频野外火灾烟雾实时检测方法

    公开(公告)号:CN109147254B

    公开(公告)日:2021-05-18

    申请号:CN201810791162.X

    申请日:2018-07-18

    Applicant: 武汉大学

    Abstract: 本发明提出了一种基于卷积神经网络的视频野外火灾烟雾实时检测方法。本发明通过实验模拟方式收集烟雾图像数据集并创建训练集、测试集及验证集;分别对训练集、测试集及验证集进行自动标注结合人工调整,分别得到带真实标签的训练集、测试集以及验证集;对带真实标签的训练集以及验证集进行图像旋转处理、颜色通道加减色处理、缩放处理得到处理后带真实标签的训练集、验证集;初始化卷积神经网络参数,根据缩放处理后带真实标签的训练集训练建立好的卷积神经网络模型;实时采集待检测野外监控画面图像,通过训练后卷积神经网络模型预测烟雾目标检测框并进行优化;在训练后卷积神经网络模型给出的目标检测结果上进行帧间置信度增强以及重定位。

    面向数字取证的电网频率信号采集和存储方法及系统

    公开(公告)号:CN112287161A

    公开(公告)日:2021-01-29

    申请号:CN202011218842.6

    申请日:2020-11-04

    Applicant: 武汉大学

    Abstract: 本发明公开了一种面向数字取证的电网频率信号采集和存储方法及系统,该方法包括以下步骤:利用降压变压器将电网信号降压,将降压后的电网信号传输给声卡;使用上位机开发工具编译的代码,读取声卡捕获的音频样本;采用高精度时钟源返回开始捕获音频样本时的时间值,得到音频样本相对应的时间戳信息;将采集到的音频样本和时间戳信息一同保存,构成音频数据库;将采集到的音频样本通过短时傅里叶变换加极值的方法转换成时频域的电网频率参考信号,并与时间戳信息一同保存,构成时频域数据库。本发明实现了电网频率参考信号的精准稳定采集,确保电网频率参考数据库的建立,为基于电网频率判据的多媒体数字取证工作切实有效进行提供了数据保障。

    一种基于卷积神经网络的字符识别方法

    公开(公告)号:CN108596066A

    公开(公告)日:2018-09-28

    申请号:CN201810332531.9

    申请日:2018-04-13

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于卷积神经网络的字符识别方法,主要解决现有的人力录入工程图纸数据时费时费力、错误率高的问题,其主要步骤包括:1)采用基于Otsu法的最佳全局阈值处理将灰度图像转换为二值图像。2)对倾斜的图像进行旋转矫正。3)采用数学形态学的算法提取出表格框。4)获得字符所在区域。5)将斜向字符串旋转相应的角度至水平方向。6)采用圆形霍夫变换的算法来查找图像中的圆圈,提取工程图纸中的焊道号。7)采用卷积神经网络的方法对工程图纸进行图文识别。8)通过编码规则修正简单错误,自动纠正识别错误。9)输出并存储图纸数据。本发明在工程图纸的图文识别上具有高准确率和实时性,实现了工程图纸数据的高效记录与管理。

    一种基于脉冲神经网络的声纹识别语音助手方法

    公开(公告)号:CN115171700B

    公开(公告)日:2024-04-26

    申请号:CN202210678239.9

    申请日:2022-06-13

    Applicant: 武汉大学

    Abstract: 在语音识别及声纹识别领域,传统非网络算法识别率低、经典神经网络算法又存在结构复杂、功耗大等问题。针对以上问题,本发明创新性地使用低功耗、运算快速的脉冲神经网络建立识别模型,可以有效降低网络复杂度、模型尺寸及运算功耗。首先语音信号进行活动性检测去除静音段,接着将语音信号切分为等长段并分别计算语谱图矩阵,依次取相邻矩阵做差获得事件脉冲矩阵,将脉冲矩阵输入到脉冲神经网络模型中进行识别测试,同时引入多数人投票机制对识别结果进行优化。在真实数据集上对指标进行测试,达到了不错的识别准确率。同时利用声纹识别模型和语音识别模型搭建了语音助手方法,具有声纹认证和语音控制的功能,实现了安全高效的设计要求。

    视频时间戳的取证方法
    8.
    发明授权

    公开(公告)号:CN115174762B

    公开(公告)日:2024-04-16

    申请号:CN202210733975.X

    申请日:2022-06-27

    Applicant: 武汉大学

    Abstract: 本发明提供一种视频时间戳的取证方法,包括:对待取证的视频进行预处理,得到去除了运动信息干扰的灰度视频;对步骤1得到的灰度视频进行进一步地处理以去除场景信息的干扰;根据视频曝光差异以不同方式获得视频记录中的电网频率信号;将获得的电网频率信号与参考数据库中真实电网频率信号匹配,选出相关系数最大的参考信号部分所对应的时间,即认为是视频录制的估计时间。能够利用电网频率的时间和地点差异,在检测视频篡改的基础上,实现对视频录制时间的估计,且是目前已知的时间戳检测的唯一手段。

    一种基于FFC-LSTM的多通道目标语音提取方法及电子设备

    公开(公告)号:CN116863940A

    公开(公告)日:2023-10-10

    申请号:CN202310848550.8

    申请日:2023-07-11

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于FFC‑LSTM的多通道目标语音提取方法及电子设备,包括声纹特征提取模块,短时傅里叶变换模块、编码器模块、解码器模块、目标说话人特征提取模块和短时傅里叶逆变换模块,其中声纹特征提取模块用于从参考语音中提取目标说话人声纹信息,短时傅里叶变换模块用于将混合语音转换为复数谱,编码器模块用于将混合复数谱编码为高维特征表示,目标说话人特征提取模块根据给定声纹特征信息从混合语音高维特征表示中提取出目标语音特征,解码器模块用于将目标语音特征映射为复数掩膜,将复数掩膜作用于混合语音复数谱得到目标语音复数谱,最后使用短时傅里叶逆变换模块将目标语音复数谱转化为目标语音时域信号。本发明具有较强的实用性。

    一种基于双传感器的时频域欠定盲源分离方法及系统

    公开(公告)号:CN116756551A

    公开(公告)日:2023-09-15

    申请号:CN202310639802.6

    申请日:2023-05-31

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于双传感器的时频域欠定盲源分离方法及系统,包括两个阶段:第一阶段利用聚类和匹配追踪算法检测出具有高聚类特性的单源点并估计混合矩阵,从而实现高精度的混合矩阵估计;第二阶段将时频域的信号恢复问题转化为具有松弛稀疏条件的稀疏恢复模型,打破了传统盲源分离算法对自源点上源数目的约束,实现了良好的分离效果。本发明适用于源数目较多、混合信噪比较低、混叠严重等双传感器欠定盲源分离场景,具有较强的适用性和实用性。

Patent Agency Ranking