从音视频中检测广告的方法及系统

    公开(公告)号:CN101576955A

    公开(公告)日:2009-11-11

    申请号:CN200910087428.3

    申请日:2009-06-22

    Abstract: 本发明涉及从音视频中检测广告的方法和系统,所述方法包括:步骤1,从待检测的音视频中提取音频,从音频中提取帧的短时能量和美尔倒谱系数特征;步骤2,根据帧的短时能量和美尔倒谱系数特征从所述音频中查找出相互间相似度满足预设条件的两组帧,每组内部中的帧在所述音频中位置连续,每组帧在待检测的音视频中对应的音视频片段为广告。本发明能够比现有技术更准确、高效地检测出视频音频中的广告片段。

    一种帧内图像预测编码方法

    公开(公告)号:CN100461867C

    公开(公告)日:2009-02-11

    申请号:CN200410096605.1

    申请日:2004-12-02

    Abstract: 本发明公开了一种帧内图像预测编码方法,包括对所述帧内图像进行亮度预测编码和色度预测编码,在进行色度预测编码时,根据亮度预测编码的预测模式对应得到一个色度预测模式,用该色度预测模式对所述帧内图像进行色度预测编码。本发明方法的优点:不必使用率失真优化方法来挑选预测模式,有效降低了色度分量帧内模式编码的复杂度;由帧内亮度预测模式可以映射一种唯一的帧内色度预测模式,只要在解码端采用同样的选择策略,就不必对色度分量的空域预测模式进行编码,进一步降低编解码的复杂度;在利用色度预测模式,实现对色度块像素值的预测过程中,4x4块预测使得4个4x4色度分量块的预测并行进行,提高了对色度块像素值进行预测时的效率。

    一种人脸检测系统的评测方法及评测系统

    公开(公告)号:CN100361136C

    公开(公告)日:2008-01-09

    申请号:CN200510001787.4

    申请日:2005-01-21

    Abstract: 本发明公开一种人脸检测系统的评测方法,包括:选择步骤,在图像样本中选择出人脸核心区域;检测步骤,使用人脸检测系统对含人脸的图像样本进行人脸检测;判断步骤,根据预先设定的判断标准对人脸检测区域和人脸核心区域进行比较,判断人脸检测系统是否正确检测出含人脸的图像样本中的人脸;评测指标计算步骤,根据判断步骤的判断结果形成评价人脸检测系统的评测指标。本发明方法的优点:对人脸检测的效果提出了一套完整地评测方法,给出了一个统一的评价标准,降低了对人脸检测方法做性能评测时的误差;使不同的人脸检测系统间具有可比性;通过设计合理的评测数据,考核系统在不同条件下的检测性能,帮助系统发现人脸检测核心算法上存在的问题。

    一种人脸检测系统的评测方法及评测系统

    公开(公告)号:CN1808465A

    公开(公告)日:2006-07-26

    申请号:CN200510001787.4

    申请日:2005-01-21

    Abstract: 本发明公开一种人脸检测系统的评测方法,包括:选择步骤,在图像样本中选择出人脸核心区域;检测步骤,使用人脸检测系统对含人脸的图像样本进行人脸检测;判断步骤,根据预先设定的判断标准对人脸检测区域和人脸核心区域进行比较,判断人脸检测系统是否正确检测出含人脸的图像样本中的人脸;评测指标计算步骤,根据判断步骤的判断结果形成评价人脸检测系统的评测指标。本发明方法的优点:对人脸检测的效果提出了一套完整地评测方法,给出了一个统一的评价标准,降低了对人脸检测方法做性能评测时的误差;使不同的人脸检测系统间具有可比性;通过设计合理的评测数据,考核系统在不同条件下的检测性能,帮助系统发现人脸检测核心算法上存在的问题。

    在体育比赛视频中检测精彩片断的方法

    公开(公告)号:CN1233147C

    公开(公告)日:2005-12-21

    申请号:CN02156973.8

    申请日:2002-12-24

    Abstract: 一种在体育比赛视频中检测精彩片断的方法,包括步骤:确定视频中相邻帧的摄像机运动;用所述摄像机运动来校正镜头边界的检测;根据图像中的重放标志的有无来确定所述镜头是否为重放镜头,如果是重放,则判定为精彩片断;根据所述摄像机运动来计算重放镜头与之前视频中正常镜头的相似度,其中相似度最大的镜头判定为精彩片断。本发明能对精彩片断进行有效的自动提取,且不依赖于特定比赛的领域知识。针对体育视频中存在的大量运动,本发明使用摄像机运动分析的结果来校验所检测的镜头边界,从而提高了镜头分割的准确性。

    乱笔顺库建立方法及联机手写汉字识别评测系统

    公开(公告)号:CN1641686A

    公开(公告)日:2005-07-20

    申请号:CN200410000823.0

    申请日:2004-01-17

    Abstract: 本发明涉及一种建立乱笔顺库的方法及联机手写汉字识别技术的评测系统。本发明方法,包括标准样本库的采集和乱笔顺库的生成,其特征在于,所述乱笔顺库是按照笔画的连通关系,对采集的联机手写汉字笔迹数据进行等价划分,分割出至少一个以上的部件后,再打乱每个部件内笔画的顺序生成的。本发明的评测系统,包括:存储设备,用于存储标准样本库和乱笔顺库;采集模块,用于采集标准样本库;转换模块,用于将联机汉字笔迹数据转化成一幅二值图像;分割模块,用于按照笔画的连通关系从二值图像中分割出至少一个以上的部件;生成模块,包括一用于打乱每个部件内笔画的顺序的单元,以及一用于打乱部件之间排列顺序的单元。

    一种网页分割方法
    7.
    发明授权

    公开(公告)号:CN102073710B

    公开(公告)日:2012-11-21

    申请号:CN201010617741.6

    申请日:2010-12-31

    Abstract: 本发明提供一种网页分割方法,其特征在于,包括:步骤1)获取待分割网页的DOM树;步骤2)遍历所述DOM树,将其中每个只包含1个基本多行结点的结点作为一个基本分块,将每两个只包含1个基本多行结点的结点之间的零散叶结点分别合成一个基本分块;其中,当一个基本多行结点的父结点被作为一个基本分块时,该基本多行结点不再作为一个基本分块;步骤3)在所述基本分块中找出主题块,将主题块与其后面邻接的若干个非主题块合并。本发明能够在分块的同时很好地保持原有的网页结构,避免打散属于同一主题或分类的链接,避免主题或分类标签与其对应的链接分离。本发明的执行效率高,容易实现。

    一种交互式语音识别系统和方法

    公开(公告)号:CN101923854B

    公开(公告)日:2012-03-28

    申请号:CN201010269306.9

    申请日:2010-08-31

    Abstract: 本发明公开了一种交互式语音识别系统,包括:声学模型和语言模型选择模块,用于根据待识别对象信息,为其选择与之发音特点最相似的声学模型和为整个识别过程选择与之领域最相似的语言模型;语音语句提取模块,用于将整段语音信号切分成若干个语音语句并提取出来,送至语音识别模块;语音识别模块,用于对语音语句提取模块提取后得到的语音语句进行识别,并输出中间识别结果;字候选生成和错误修正模块,用于对所述识别中间结果进行处理生成候选集,再根据选择的候选或输入的正确数据来纠正识别错误得到最终识别结果;交互模块,用于将用户输入的数据发送给声学模型和语言模型选择模块,以及向用户反馈所述字候选生成和错误修正模块的识别结果。

    一种基于显著区域的图像查询方法

    公开(公告)号:CN100573523C

    公开(公告)日:2009-12-23

    申请号:CN200610171520.4

    申请日:2006-12-30

    Abstract: 本发明公开了一种基于显著区域的图像查询方法,包括以下步骤:(1)将图像进行网格划分;(2)对网格进行模糊聚类,将图像分割成若干关注区域;(3)基于关注区域计算显著度;(4)将所有格点按照显著度进行排序得到显著区域;(5)进行图像查询。本发明的优点在于:简化计算,更符合视觉感知,提高检索效率和精度。

    MPEG-2到H.264压缩域视频转码器系数转换方法

    公开(公告)号:CN100477795C

    公开(公告)日:2009-04-08

    申请号:CN200510135212.1

    申请日:2005-12-27

    Abstract: 本发明公开了一种MPEG-2到H.264压缩域视频转码过程中将解码输入的MPEG-2视频码流获得的离散余弦系数直接转换到H.2644阶整数系数的转换方法,包括如下步骤:1)从输入MPEG-2码流中获取8×8 DCT块系数分布信息;2)将上一步骤1)中的8×8 DCT块进行分类;3)对上一步骤2)的8×8 DCT块按照其分类来分别进行处理,获得H.264整数变换系数。本发明优点是保持视频质量,降低系数转换操作的计算复杂度。

Patent Agency Ranking