一种多媒体文件的标识方法及系统

    公开(公告)号:CN106454367B

    公开(公告)日:2019-12-20

    申请号:CN201610881309.5

    申请日:2016-10-09

    Abstract: 本发明提供了一种多媒体文件的标识方法及系统,该方法通过判断当前待标识的多媒体文件的类型;提取视频文件的关键帧,得到待标识的图像文件;对图像文件进行二维DCT变换,提取图像文件的文件特征;对音频文件进行DWT变换,提取音频文件的文件特征;将提取的当前多媒体文件的文件特征与水印密文进行异或处理,获取并存储该多媒体文件的零水印。该系统包括多媒体文件类型判断模块、视频特征获取模块、图像特征获取模块、音频特征获取模块及零水印获取模块。本发明实现了在不修改原始多媒体数据的基础上,实现了对多类型的多媒体文件的加密标识,使得对多媒体文件标识的过程准确且全面,进而实现了对多媒体版权的有效且可靠的保护。

    一种果蔬成熟度检测方法及装置

    公开(公告)号:CN106454302A

    公开(公告)日:2017-02-22

    申请号:CN201610892016.7

    申请日:2016-10-12

    CPC classification number: H04N9/646 G01N21/25 G01N21/84 H04N9/643

    Abstract: 本发明公开一种果蔬成熟度检测方法及装置。其中,所述方法包括:获取果蔬的视频信息;对获取的视频信息进行图像增强处理,以提高对图像中果蔬颜色的识别;将增强处理过的图像从三原色光模式转化为HSV色彩属性模式,以获得所述图像中果蔬的色调;根据所述图像中果蔬的色调,对所述图像中果蔬进行成熟度检测。所述装置用于执行上述方法。本发明提供的果蔬成熟度检测方法及装置,由于能够通过对果蔬的视频信息进行处理,获得图像中果蔬的色调,从而对果蔬进行成熟度检测,提高了对果蔬成熟度检测的准确性。

    一种音频检索方法
    3.
    发明公开

    公开(公告)号:CN107402965A

    公开(公告)日:2017-11-28

    申请号:CN201710482883.8

    申请日:2017-06-22

    Abstract: 本发明提供一种音频检索方法,包括:S1、获得样例音频的静音词,作为查询静音词;S2、根据倒排索引表,获得包含所述查询静音词的候选音频以及所述查询静音词在所述候选音频中的IDF和TF;S3、根据候选音频的个数以及所有所述查询静音词在所述候选音频中的IDF和TF,获得作为目标音频的候选音频。本发明具有并不需要高维距离计算,并且基于语音型的特点优化传统的表示级检索方法,在没有完善领域字典的情况下也能快速准确的技术优势。

    一种纯语音快速筛选方法及其装置

    公开(公告)号:CN108242241A

    公开(公告)日:2018-07-03

    申请号:CN201611206097.7

    申请日:2016-12-23

    Abstract: 本发明提供了一种纯语音快速筛选方法及其系统,通过对获取到的音频数据或伴音数据提取每一帧音频数据的端时能量值,自动识别音频数据或伴音数据中静音帧,并通过获取两个相邻静音帧之间的间隔时间值与设定的间隔时间值相比较,以实现自动识别音频数据或伴音数据中的纯语音是否是所需要的语音,从而达到自动识别分类音频数据的目的。藉由本申请提取的语音特征信息仅仅为音频数据或伴音数据的每一帧数据的短时能量值及静音帧之间的间隔时间长短,故采集的音频数据特征较少,因此,在对纯语音识别过程前序处理过程端,识别算法简单,可以有效提高其识别速度。

    一种多媒体文件的标识方法及系统

    公开(公告)号:CN106454367A

    公开(公告)日:2017-02-22

    申请号:CN201610881309.5

    申请日:2016-10-09

    Abstract: 本发明提供了一种多媒体文件的标识方法及系统,该方法通过判断当前待标识的多媒体文件的类型;提取视频文件的关键帧,得到待标识的图像文件;对图像文件进行二维DCT变换,提取图像文件的文件特征;对音频文件进行DWT变换,提取音频文件的文件特征;将提取的当前多媒体文件的文件特征与水印密文进行异或处理,获取并存储该多媒体文件的零水印。该系统包括多媒体文件类型判断模块、视频特征获取模块、图像特征获取模块、音频特征获取模块及零水印获取模块。本发明实现了在不修改原始多媒体数据的基础上,实现了对多类型的多媒体文件的加密标识,使得对多媒体文件标识的过程准确且全面,进而实现了对多媒体版权的有效且可靠的保护。

    基于小波和Radon变换的视频零水印实现方法及系统

    公开(公告)号:CN106131373A

    公开(公告)日:2016-11-16

    申请号:CN201610454800.X

    申请日:2016-06-21

    CPC classification number: H04N1/32144 H04N1/3216 H04N1/3217 H04N1/32272

    Abstract: 本发明提供一种基于小波和Radon变换的视频零水印实现方法及系统,其中,方法包括:提取视频中的关键帧,保证各关键帧之间具有最小相似度;采用离散小波变换将关键帧中的数字图像信号由时域转到频域上进行高频信号和低频信号的分解,将高频信号滤出,将低频信号由频域转为时域后进行Radon变换,根据Radon变换生成的矩阵计算其特征矩阵和特征值;将水印图像加密生成水印密文;将水印密文与计算的特征值进行异或处理,形成零水印并注册到知识产权信息数据库中。本发明在不修改原始视频的基础上能够克服已有的视频零水印构造算法的速度问题,并在保证视频水印鲁棒性的同时有效抵挡住旋转、缩放、平移等几何攻击。

    多媒体文件类型自动识别与导入方法及系统

    公开(公告)号:CN106127045A

    公开(公告)日:2016-11-16

    申请号:CN201610453895.3

    申请日:2016-06-21

    CPC classification number: G06F21/562 G06F16/168

    Abstract: 本发明提供一种多媒体文件类型自动识别与导入系统,包括:用户接口模块,用于获取待导入的全部多媒体文件,以及通过接收用户的指令获取用户的操作信息;文件类型识别及查毒模块,用于根据用户的操作信息对获取的待导入的全部多媒体文件依次进行病毒识别和类型识别;自动导入模块,用于将识别出来的非病毒多媒体文件导入到搭载本系统的终端设备上预先设置的与该非病毒多媒体文件所属类型相对应的文件夹内。本发明能够克服现有的多媒体文件拷贝及使用的不便以及文件类型识别应用的不足,满足用户对文件快速导入及使用需求。

    一种目标声音的音量调节系统及方法

    公开(公告)号:CN106126177A

    公开(公告)日:2016-11-16

    申请号:CN201610454799.0

    申请日:2016-06-21

    CPC classification number: G06F3/165

    Abstract: 本发明实施例公开了一种目标声音的音量调节系统及方法。该系统包括:相互连接的监测模块和控制模块;监测模块,用于采集目标声音的声源所在地预设范围内的声音信号,并对声音信号进行分类识别处理,获取声音信号中的语音信号和噪声信号,以及噪声信号的音量;控制模块,用于采用模糊控制技术,根据噪声信号的音量调整目标声音的音量。本发明实施例基于分类识别处理技术,从目标声音的周围环境声音中去除用户正常行为产生的语音信号,以筛选出噪声信号,并采用模糊控制技术,根据噪声信号的音量调整目标声音的音量,与现有技术相比,能避免影响用户的正常交谈等行为,具有调节精度高的优点。

    一种基于音频数据的视频检索的装置及其视频检索方法

    公开(公告)号:CN106055570A

    公开(公告)日:2016-10-26

    申请号:CN201610339063.9

    申请日:2016-05-19

    CPC classification number: G06F16/7834

    Abstract: 本发明公开一种基于音频数据的视频检索的装置及其视频检索方法,装置包括:视频数据库模块,用于存储视频数据;第一音视频分离模块,用于分离视频数据库模块中视频数据的音频数据;音频数据库模块,用于存储第一音视频分离模块得到的音频数据;音视频数据接收模块,用于接收用户输入的音频或视频数据;第二音视频分离模块,用于在音视频数据接收模块接收到视频数据后,分离接收到的视频数据中的音频数据;音频数据匹配模块,用于将用户输入的音频数据或第二音视频分离模块得到的音频数据与音频数据库模块中的音频数据进行匹配,得到一个或多个目标音频数据;视频检索显示模块,用于将目标音频数据对应的目标视频数据向用户显示。

    一种音频检索方法
    10.
    发明授权

    公开(公告)号:CN107402965B

    公开(公告)日:2020-04-28

    申请号:CN201710482883.8

    申请日:2017-06-22

    Abstract: 本发明提供一种音频检索方法,包括:S1、获得样例音频的静音词,作为查询静音词;S2、根据倒排索引表,获得包含所述查询静音词的候选音频以及所述查询静音词在所述候选音频中的IDF和TF;S3、根据候选音频的个数以及所有所述查询静音词在所述候选音频中的IDF和TF,获得作为目标音频的候选音频。本发明具有并不需要高维距离计算,并且基于语音型的特点优化传统的表示级检索方法,在没有完善领域字典的情况下也能快速准确的技术优势。

Patent Agency Ranking