-
公开(公告)号:CN1477566A
公开(公告)日:2004-02-25
申请号:CN03150126.5
申请日:2003-07-18
Applicant: 北京大学计算机科学技术研究所 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于视频检索技术领域,具体涉及一种对镜头进行基于内容的视频检索的方法。现有的基于内容的镜头检索方法往往存在着由于镜头内容描述不准确,检索准确率不高的问题。针对现有技术中存在的不足,本发明首次将模糊聚类分析的方法用于镜头检索。与现有方法相比,本发明提出的方法使用模糊聚类的方法,把镜头分为多个等价类,等价类内部内容是一致的,这些等价类客观全面的描述了镜头内部内容的变化。然后把这些等价类用于镜头检索,获得了良好的检索结果。本发明的效果在于进行基于内容的视频检索时可以取得更高的准确率,同时保持很快的检索速度。
-
公开(公告)号:CN100585592C
公开(公告)日:2010-01-27
申请号:CN200610080669.1
申请日:2006-05-25
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种音频片断之间相似度度量的方法。现有技术中,没有考虑音频片断中具体内容的差别而采用音频特征表示整个音频片断,因此不能有效度量音频内容的相似度。针对上述问题,本发明把音频片断度量分为两个层次:音频单元和音频片断。在音频单元阶段,本发明定义音频单元是一系列音质相似的音频帧,首先把音频片断分割为一个个音频单元,然后度量两个音频片断中音频单元的相似度;在音频片断阶段,基于音频单元的度量结果,把两个音频片断的相似度度量建模为一个带权二分图,最后使用最优匹配度量两个音频片断的相似度。试验结果表明,与现有方法相比,本发明可以取得更高的检索准确性,从而充分发挥音频检索技术在信息检索中的巨大作用。
-
公开(公告)号:CN101136015A
公开(公告)日:2008-03-05
申请号:CN200610112799.9
申请日:2006-09-01
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
Abstract: 本发明公开了一种图像相似度计算及检索方法。现有技术中,尽管考虑了利用图像分块的方法以提高检索的准确性,但在图像分块以后,采用的是对应块相似度度量的方法,最后图像的相似度是图像对应块相似度的平均值。本发明提出了一种基于分块最优匹配的图像检索方法。首先也对图像进行分块处理,并利用最优匹配在一对一匹配的前提下,计算两幅图像的全部分块所能达到的最大相似度。试验结果表明,与现有方法相比,本发明可以取得更高的检索准确性,从而可以充分发挥图像检索技术在信息检索中的巨大作用。
-
公开(公告)号:CN101079044A
公开(公告)日:2007-11-28
申请号:CN200610080669.1
申请日:2006-05-25
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种音频片断之间相似度度量的方法。现有技术中,没有考虑音频片断中具体内容的差别而采用音频特征表示整个音频片断,因此不能有效度量音频内容的相似度。针对上述问题,本发明把音频片断度量分为两个层次:音频单元和音频片断。在音频单元阶段,本发明定义音频单元是一系列音质相似的音频帧,首先把音频片断分割为一个个音频单元,然后度量两个音频片断中音频单元的相似度;在音频片断阶段,基于音频单元的度量结果,把两个音频片断的相似度度量建模为一个带权二分图,最后使用最优匹配度量两个音频片断的相似度。试验结果表明,与现有方法相比,本发明可以取得更高的检索准确性,从而充分发挥音频检索技术在信息检索中的巨大作用。
-
公开(公告)号:CN100508587C
公开(公告)日:2009-07-01
申请号:CN200610007965.9
申请日:2006-02-24
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于计算机语音识别及视频检索技术领域,具体涉及一种基于语音分类识别的新闻视频检索方法。现有技术中,在进行视频检索时,一般是从视频中提取出颜色、纹理等底层特征,然后根据这些特征进行视频检索,无法有效实现从文本到新闻视频的检索,应用非常不方便。本发明所述的方法是在新闻视频中自动分割出标准语音的所有语音片断;然后运用语音识别系统,对分割出的标准语音进行识别,由于新闻视频中的标准语音能够反映该视频的主要内容,因此很容易地实现从文本到视频的新闻检索。采用本发明所述的方法,可以实现自动识别新闻视频中的标准语音,有效实现从文本到视频的新闻检索,从而充分发挥音频分析和检索技术在信息检索中的巨大作用。
-
公开(公告)号:CN1825936A
公开(公告)日:2006-08-30
申请号:CN200610007965.9
申请日:2006-02-24
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
Abstract: 本发明属于计算机语音识别及视频检索技术领域,具体涉及一种基于语音分类识别的新闻视频检索方法。现有技术中,在进行视频检索时,一般是从视频中提取出颜色、纹理等底层特征,然后根据这些特征进行视频检索,无法有效实现从文本到新闻视频的检索,应用非常不方便。本发明所述的方法是在新闻视频中自动分割出标准语音的所有语音片断;然后运用语音识别系统,对分割出的标准语音进行识别,由于新闻视频中的标准语音能够反映该视频的主要内容,因此很容易地实现从文本到视频的新闻检索。采用本发明所述的方法,可以实现自动识别新闻视频中的标准语音,有效实现从文本到视频的新闻检索,从而充分发挥音频分析和检索技术在信息检索中的巨大作用。
-
公开(公告)号:CN100543735C
公开(公告)日:2009-09-23
申请号:CN200510117412.4
申请日:2005-10-31
Applicant: 北大方正集团有限公司 , 北京北大方正技术研究院有限公司 , 北京大学
Abstract: 本发明公开了一种基于文档结构的文档相似性度量方法,涉及一种自然语言的处理方法。针对度量方法中丢失了词语在文档各个部分的分布信息,本发明提出的方法包括以下步骤:(1)对于需要比较的两个文档X和Y,分别使用文档结构分析方法找出每个文档的子主题序列;(2)利用相似性度量方法计算任意两个分别属于不同文档的子主题之间的相似度值;(3)对步骤(1)及步骤(2)得到的子主题序列及子主题之间的相似度值,建立一个带权二部图G={X,Y,E};(4)对带权二部图G={X,Y,E}求解最优匹配,对最优匹配的总权值进行规范化处理,即得到文档X与Y的相似度值。本发明提出的方法,提高了文档相似性判断的准确度。
-
公开(公告)号:CN1828610A
公开(公告)日:2006-09-06
申请号:CN200610072588.7
申请日:2006-04-13
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
Abstract: 本发明涉及一种改进的基于文档子主题结构的文档相似性度量方法,属于语言的计算机处理和信息检索技术领域。针对传统相似性度量方法丢失了词语在文档各个部分的分布信息这个缺点以及利用最优匹配的基于文档子主题结构的方法只允许子主题之间一对一匹配的缺点。本发明所述的方法利用文档结构分析方法分别得到所述两个文档A和B的子主题结构,然后通过构建一个带权二部图G并根据求解线性规划的方法求解其货物运输距离EMD(A,B),最后根据1-EMD(A,B)得到文档A和B之间的相似度值。本发明允许文档子主题之间在一定约束条件下进行多对多匹配,从而提高了文档相似性判断的准确度,同时,该方法具有更好的鲁棒性。
-
公开(公告)号:CN100586201C
公开(公告)日:2010-01-27
申请号:CN200610080667.2
申请日:2006-05-25
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
IPC: H04N17/02
Abstract: 本发明属于视频分析及检索技术领域,具体涉及一种广告视频检测的方法。现有的广告视频检测方法,一般是从广告具有的图像特征出发来进行识别。这种方法因为仅仅利用了图像特征,因此存在检测错误或检测不全的问题。针对现有技术的不足,本发明提出了同时利用广告视频具有的图像和音频特征综合进行检测。本发明首先检测视频中的镜头边界,然后以镜头为单位,通过镜头中音频帧类型和数目的分析,识别广告镜头和非广告镜头,并通过平滑处理,最终检测出广告视频。试验结果证明了本发明的有效性,从而实现了从视频中自动检测广告的应用。
-
公开(公告)号:CN100412869C
公开(公告)日:2008-08-20
申请号:CN200610072588.7
申请日:2006-04-13
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正技术研究院有限公司
Abstract: 本发明涉及一种改进的基于文档子主题结构的文档相似性度量方法,属于语言的计算机处理和信息检索技术领域。针对传统相似性度量方法丢失了词语在文档各个部分的分布信息这个缺点以及利用最优匹配的基于文档子主题结构的方法只允许子主题之间一对一匹配的缺点。本发明所述的方法利用文档结构分析方法分别得到所述两个文档A和B的子主题结构,然后通过构建一个带权二部图G并根据求解线性规划的方法求解其货物运输距离EMD(A,B),最后根据1-EMD(A,B)得到文档A和B之间的相似度值。本发明允许文档子主题之间在一定约束条件下进行多对多匹配,从而提高了文档相似性判断的准确度,同时,该方法具有更好的鲁棒性。
-
-
-
-
-
-
-
-
-