一种端到端说话人确认方法、装置及存储介质

    公开(公告)号:CN109256135A

    公开(公告)日:2019-01-22

    申请号:CN201810988567.2

    申请日:2018-08-28

    Inventor: 蔡晓东 李波

    Abstract: 本发明提供一种端到端说话人确认方法、装置及存储介质,其方法包括构建说话人确认端到端网络,所述说话人确认端到端网络包括前端的ResCNN残差卷积神经网络模型和后端的,ResCNN残差卷积神经网络模型用于提取语音帧级别特征,阈值再加权注意力模型对语音帧级别特征转化为句子级别特征,从而完成对所述说话人确认端到端网络的训练;通过训练得到的说话人确认端到端网络,以确定测试语音的注册人;本发明实现了端到端处理,阈值再加权注意力模型通过赋予权重的形式提取出关键语音帧级别特征,将非关键语音帧级别特征筛除,再进行加权平均处理来放大关键语音帧级别特征,从帧级别特征转化为句子级别特征,极大的提高了语音识别度。

    一种细粒度车型识别系统及方法

    公开(公告)号:CN109214441A

    公开(公告)日:2019-01-15

    申请号:CN201810968895.6

    申请日:2018-08-23

    Inventor: 蔡晓东 万今朝

    Abstract: 本发明涉及一种细粒度车型识别系统及方法,方法包括以下步骤:构建车辆样本数据库,利用Fast-RCNN对样本数据库内的样本图片进行目标检测,截取出目标车辆的图片;构建奇异值分解卷积神经网络,使用中心距离损失和分类损失的融合损失,将目标车辆的图片导入到所述的奇异值分解卷积神经网络进行训练,得到训练模型;提取训练模型中全连接层的权重矩阵W,对权重矩阵W进行奇异值分解后重新赋值并调整,获得细粒度车型识别模型;采用细粒度车型识别模型对车辆样本数据库内的样本图片进行分类识别,识别出车辆样本数据库中的车辆。相对现有技术,本发明可以去除具有相关性的冗余特征,学习到细粒度级别的区分性特征能够提高细粒度车型识别的准确率。

    一种基于随机森林支持向量机的行人识别系统及处理方法

    公开(公告)号:CN105095884B

    公开(公告)日:2018-11-13

    申请号:CN201510548174.6

    申请日:2015-08-31

    Abstract: 本发明涉及一种基于随机森林支持向量机的行人识别系统,包括特征提取模块、聚类模块、随机森林创建模块和评分模型模块,本发明还涉及一种基于随机森林支持向量机的行人识别处理方法;本发明用相似度排名方式代替了以往的相似度绝对值的比较,无需划定阈值,得出的排名结果便于使用者自己判断;建立随机森林模型需要多特征,仅从表观特征无法人工将样本们分类完善,采用K‑means聚类算法代替人工给出样本类别,可以挖掘出样本间的潜在联系;该系统及方法对行人姿态变化具有鲁棒性,在计算相似度的时候会排除来自其他几类样本的干扰,RankSVM的排名结果也会靠前,进行相似度计算时,会使得识别准确率提升,相比MCC与RankSVM等现有技术列举的传统算法识别准确率高。

    一种文本分类系统及方法
    154.
    发明公开

    公开(公告)号:CN106547885A

    公开(公告)日:2017-03-29

    申请号:CN201610954497.X

    申请日:2016-10-27

    Inventor: 蔡晓东 赵勤鲁

    Abstract: 本发明涉及一种文本分类系统及方法,其系统包括初始化模块读取文本,将文本内的句子进行向量化,生成二维的矩阵向量;第一提取模块对二维的矩阵向量进行卷积以及池化处理,生成多个第一矩阵向量;第二提取模块将多个第一矩阵向量分别与attention矩阵进行点乘,生成多个第二矩阵向量;综合表示模块将每一个矩阵向量进行卷积操作,使每一个第二矩阵向量对应转换成一维向量矩阵;分类模块将多个一维向量矩阵分别输入到Fully Contact Layer中进行处理,并将其输出值输入到softmax分类器中,softmax分类器将矩阵值转换成对应类别的概率分布,对文本进分类。本发明使用较少的参数,使网络模型快速收敛,并提取出文本深度的表示信息,进而提高文本的分类正确率。

    基于多分块深层卷积神经网络的车型识别方法和系统

    公开(公告)号:CN106529446A

    公开(公告)日:2017-03-22

    申请号:CN201610956426.3

    申请日:2016-10-27

    Inventor: 蔡晓东 陈超村

    CPC classification number: G06K9/00771 G06K9/6267 G06K2209/23 G06N3/08

    Abstract: 本发明提供基于多分块深层卷积神经网络的车型识别方法和系统,其中方法包括当目标车辆经过交通卡口设备时定位目标车辆位置,并截取目标车辆的车脸图像;对目标车脸图像进行预处理;将预处理后的目标车脸图像分割为多个车脸图像分块;建立深层卷积神经网络模型,将所述多个车脸图像分块导入所述深层卷积神经网络模型中进行特征提取、特征融合和特征展开处理;将展开后的车脸特征输入分类器中进行回归训练,实现对所述车脸特征分类识别。本发明将目标车脸图像进行多分块处理,并建立深层卷积神经网络模型从多分块的目标车脸图像中进行特征提取、特征融合和特征展开处理,再通过分类器对展开后的特征进行回归训练,实现车脸特征的分类识别。

    一种多路视频同录同放系统及方法

    公开(公告)号:CN105208297A

    公开(公告)日:2015-12-30

    申请号:CN201510577581.X

    申请日:2015-09-11

    Abstract: 本发明涉及一种多路视频同录同放系统及方法,其系统包括控制器、信号发送模块、信号接收模块、电平标记模块、存储器和多个显示器;所述控制器分别与所述信号发送模块和所述存储器连接,所述信号发送模块与所述信号接收模块连接,所述信号接收模块分别与所述电平标记模块和多个所述显示器连接,所述电平标记模块还与所述存储器连接,所述存储器与多个所述显示器通过线路连接。相对现有技术,本发明在多路视频同录同放技术中对存储在一个文件里的多路视频实现单独操作,操作简便、安装方便。

Patent Agency Ranking