一种视频动作分类的处理方法及装置

    公开(公告)号:CN107463949B

    公开(公告)日:2020-02-21

    申请号:CN201710573692.2

    申请日:2017-07-14

    Abstract: 本发明实施例提供一种视频动作分类的处理方法及装置,方法包括:读取待识别的视频帧,并提取视频帧的光流图像;选择一帧视频帧作为起始帧,提取起始帧后的连续m帧视频帧x方向和y方向的光流图像,并与起始帧的RGB图像作为一个样本;将每一个样本中的光流图像和起始帧的RGB图像同时输入SCNN和TCNN,以分别获得SCNN和TCNN的最高卷积层计算出的卷积投影;根据卷积投影和多尺度卷积核的融合模块,获取视频动作的时空融合特征投影;将时空融合特征投影依次通过卷积层、最大池化层和全连接层进行计算,并根据计算结果和分类器获得视频动作所属分类。装置执行上述方法。本发明实施例提供的视频动作分类的处理方法及装置,能够提高复杂场景下人物动作的识别准确率。

    面向广域网的音视频智能编目信息获取方法

    公开(公告)号:CN101968819B

    公开(公告)日:2012-05-30

    申请号:CN201010537106.7

    申请日:2010-11-05

    Abstract: 面向广域网的音视频智能编目信息获取方法,属计算机应用领域。本发明特征在于,提出了基于关键词特征项位置因素的权重算法,对文档中不同位置的特征项赋予不同的加权因子,进而更准确地计算网页内容的主题相似度;综合利用网页内容相似度、超链接的URL目录层次信息、超链接的锚文本信息三方面因素,优化选择主题相似度更高的链接。对搜索到的主题页面,采用基于本体和HTML的信息提取方法自动提取出编目信息。采用改进的语义相似度计算方法,对提取到的编目信息进行规范化。本发明能够智能、自动地为编目者提供著录项信息,减轻人工劳动量,提高编目效率,能够适应专业和非专业编目者的不同需求,也能适应广域网环境。

    一种集成版权管理的互为服务器的设计方法以及网络架构

    公开(公告)号:CN101175094A

    公开(公告)日:2008-05-07

    申请号:CN200710176968.X

    申请日:2007-11-08

    Abstract: 一种集成版权管理的互为服务器的设计方法以及网络架构属于计算机领域。该网络架构包括权限服务器:提供版权定制服务;Peer端向权限服务器申请购买,由权限服务器进行费用扣除,颁发权限证书;证书服务器:给P2P客户端颁发身份证书;用户服务器:负责提供用户登录验证,口令修改,个人帐户充值服务;多个用户节点;数据库服务器:提供数据存储支持功能,用于支持智能节点和权限服务器,提供网络信息、用户信息数据存储、查询分析。该设计方法将DRM内置为P2P下载软件的一个模块;该DRM模块分为申请个人身份证书;查看权限列表;购买权限证书;这三部分和权限服务器以及证书服务器进行交互。本发明中实现P2P网络中的高速下载上传,还集成了DRM认证解密功能。

    面向P2P应用的互为服务器的设计方法以及网络架构

    公开(公告)号:CN101159645A

    公开(公告)日:2008-04-09

    申请号:CN200710176967.5

    申请日:2007-11-08

    Abstract: 本发明属于计算机网络技术领域。设计方法步骤:将FTP下载集成在P2P客户端软件中,作为P2P下载方式的补充,软件在下载时优先从P2P网络中寻找资源进行分片下载;当P2P网络中的资源不足以提供完整的文件时,P2P客户端软件自动选择向FTP服务器申请下载该文件;FTP服务器从内容管理服务器调度成功后,P2P客户端软件开始从FTP服务器上下载尚未完成的文件片断;最终保证下载到完整的资源文件。该网络架构包括FTP服务器、内容管理服务器、多个用户节点及用户FTP和FTP服务器之间的命令通道和数据通道。本发明充分利用FTP协议功能,使资源传输更加稳定,确保用户快捷方便地获取完整文件,充分保障了用户的权益。

    一种结合形状和颜色的双目立体视觉图像特征提取方法

    公开(公告)号:CN104850850B

    公开(公告)日:2017-12-01

    申请号:CN201510159543.2

    申请日:2015-04-05

    Abstract: 一种结合形状和颜色的双目立体视觉图像特征提取方法,属于多媒体信息检索、智能信息处理、数据挖掘等数据处理领域,克服双目立体视觉图像特征提取精确度不高、复杂度大等缺点。本发明步骤:通过立体匹配对双目立体视觉图像进行深度图提取;基于选定大小窗口对双目立体视觉深度图像进行轮廓形状特征提取,并进行降维;采用滑动窗口检测方法对完整深度图像进行特征提取,并进行降维;对双目立体视觉左图像进行颜色特征提取,形成直方图特征;对轮廓形状特征和颜色特征进行高斯归一化,实现多特征融合的双目立体视觉图像特征提取。本发明能够获取精确、低维的双目立体视觉图像特征,较好的应用于基于内容的相关资源索引和检索。

    面向舞美场景设计的快速创意生成方法

    公开(公告)号:CN105468704A

    公开(公告)日:2016-04-06

    申请号:CN201510796560.7

    申请日:2015-11-18

    CPC classification number: G06F16/243

    Abstract: 一种面向舞美场景设计的快速创意生成方法属于计算机应用技术领域。具体包括:(1)分词:针对用户初始创意,结合专用词库,对创意文本进行分词和关联,供推理模块使用;(2)推理:构建了一个基于本体(Ontology)的舞美领域知识库,提出了一种自适应合并阈值的层次聚类算法对舞美概念进行分类,利用本体构建工具构建舞美领域本体,之后运用Tableau算法来推理舞美模型知识;(3)检索:应用了三维模型语义检索技术进行模型检索。本发明解决了舞美3D模型复用率低、检索困难等问题,使舞美设计人员能快速有效的在三维虚拟场景及虚实结合的场景下实现快速创意设计、快速模型检索,从而提高舞美设计创意与布景演练的效率。

    面向三网融合的视频内容安全责任认定方法

    公开(公告)号:CN103313142B

    公开(公告)日:2016-02-24

    申请号:CN201310205349.4

    申请日:2013-05-26

    Abstract: 面向三网融合的视频内容安全责任认定方法,属于计算机信息安全领域。本发明针对视频内容在开放网络传输,并在多个不可信主体间进行业务交互,当发生非法视频内容传播事件时,无法确定责任方而设计。将视频在时间维随机的选取若干关键帧并按照帧序号划分为若干组。在空间维,对每个关键帧进行区域分割,分为中心区、边缘区和角落区,对不同的区域分配不同的采样率。将处于同一分组的关键帧采样信息进行级联后,进行比特承诺。在传输的过程中,双方协商一个秘密通信标识,接受方通过验证秘密通信标识和比特承诺值,来确保视频内容没有被篡改。在发生纠纷时,在两方之间采用保密比较协议对比特承诺结果进行保密比较,实现责任认定。

    基于DC系数的MPEG2视频水印实现方法

    公开(公告)号:CN102547297B

    公开(公告)日:2014-12-03

    申请号:CN201210048099.3

    申请日:2012-02-28

    Abstract: 基于DC系数的MPEG2视频水印实现方法,属于计算机信息安全领域。本发明提出了在编码视频的I帧的亮度分量中嵌入水印信息,从而保证了视频水印的鲁棒性;在水印嵌入位置上,选择对视频质量影响最小的每一个条带的最后一个宏块的Y分量的最后一个差分DC系数,使得修改DC系数后并不会影响到其他条带的视频数据;在水印的嵌入提取算法中,结合MPEG2视频中DC系数采用霍夫曼差分编码特征,在保证添加水印前后DCT系数的编码量不变的基础上嵌入水印信息;水印的嵌入和提取并不涉及大量的数据DCT、IDCT变换以及量化和反量化,大大降低了视频水印系统的复杂度,提高了水印的嵌入和提取效率,并增强了水印信息提取的准确度。

    一种语音情感识别方法及系统

    公开(公告)号:CN109767790A

    公开(公告)日:2019-05-17

    申请号:CN201910173689.0

    申请日:2019-02-28

    Abstract: 本发明公开一种语音情感识别方法及系统。所述识别方法包括:获取语音信号;预处理所述语音信号,获得预处理语音信号;计算所述预处理语音信号对应的语谱图;计算多个不同语段长度的所述预处理语音信号的情感识别率,将所述情感识别率最高对应的语段长度确定为最佳语段长度;根据所述最佳语段长度对应的语谱图提取所述语音信号的声学特征;将所述声学特征采用卷积神经网络分类识别所述语音信号的情感。采用基于语谱图和卷积神经网络的语音情感识别方法提升了语音情感识别率。

    一种视频动作分类的处理方法及装置

    公开(公告)号:CN107463949A

    公开(公告)日:2017-12-12

    申请号:CN201710573692.2

    申请日:2017-07-14

    Abstract: 本发明实施例提供一种视频动作分类的处理方法及装置,方法包括:读取待识别的视频帧,并提取视频帧的光流图像;选择一帧视频帧作为起始帧,提取起始帧后的连续m帧视频帧x方向和y方向的光流图像,并与起始帧的RGB图像作为一个样本;将每一个样本中的光流图像和起始帧的RGB图像同时输入SCNN和TCNN,以分别获得SCNN和TCNN的最高卷积层计算出的卷积投影;根据卷积投影和多尺度卷积核的融合模块,获取视频动作的时空融合特征投影;将时空融合特征投影依次通过卷积层、最大池化层和全连接层进行计算,并根据计算结果和分类器获得视频动作所属分类。装置执行上述方法。本发明实施例提供的视频动作分类的处理方法及装置,能够提高复杂场景下人物动作的识别准确率。

Patent Agency Ranking