一种统计机器翻译方法和系统

    公开(公告)号:CN101290616A

    公开(公告)日:2008-10-22

    申请号:CN200810114735.1

    申请日:2008-06-11

    Abstract: 本发明公开了一种统计机器翻译方法和系统,其中该方法包括下列步骤:1)对源语言句进行短语划分,根据划分的短语从双语短语表中检索双语短语;2)检查划分的短语与双语短语匹配程度,如果完全匹配将双语短语加入候选短语表,执行步骤4),如果部分匹配,执行步骤3);3)根据划分的短语和双语短语构造翻译模板,把划分的短语与双语短语不同的词语翻译填入翻译模板,生成新双语短语,并加入所述候选短语表;4)根据候选短语表翻译所述待翻译源语言句。本发明能够在双语语料受限的情况下有效的提高翻译质量,解决了统计机器翻译系统面临的数据稀疏问题。

    一种帧内图像的亮度预测编码方法

    公开(公告)号:CN100426868C

    公开(公告)日:2008-10-15

    申请号:CN200510002494.8

    申请日:2005-01-25

    Abstract: 本发明公开了一种帧内图像的亮度预测编码方法,包括建立待预测块的参考像素点步骤和根据参考像素点进行待预测块的亮度预测步骤;在所述建立待预测块的参考像素点步骤中:当待预测块的正上块参考像素点可用时,直接用所述正上块参考像素点的像素值扩展得到所述待预测块的右上块参考像素点的像素值;当待预测块的正左块参考像素点可用时,直接用所述正左块参考像素点的像素值扩展得到所述待预测块的左下块参考像素点的像素值。本发明的优点在于:有效降低了帧内预测的复杂度,且视频质量不会明显降低;省去了对待预测块的右上块和左下块的参考像素点的可用性判断,在用硬件实现亮度预测编码时,有效降低内存需求和硬件实现的复杂度。

    一种基于聚类的图像查询方法

    公开(公告)号:CN101211355A

    公开(公告)日:2008-07-02

    申请号:CN200610171519.1

    申请日:2006-12-30

    Abstract: 本发明公开了一种基于聚类的图像查询方法,包括以下步骤:(1)提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;(2)对描述图像内容的高维特征进行降维,得到特征子集;(3)对特征子集构成的数据集进行聚类;(4)对聚类得到的每个类分别建立索引;(5)使用索引进行图像查询。本发明的优点在于:根据图像的注意力区域对图像进行简单有效的划分,优化了索引树结构,使检索更为准确和高效。

    一种视频运动对象分割方法

    公开(公告)号:CN100337249C

    公开(公告)日:2007-09-12

    申请号:CN200410037501.3

    申请日:2004-04-23

    Abstract: 本发明涉及一种视频运动对象分割方法,该方法包括先对图像进行时序分割,将包含运动对象的初始区域和背景分离,随后的空间分割以及区域的分类、合并都仅在初始区域上进行,从而大大减少了计算开销,提高分割速度;根据区域的空间、时序和邻域相似度在MRF模型中加入空间约束、时序约束和邻域约束,并通过求解MRF的最大后验概率对区域分类,最终准确地分割出运动对象,克服了运动估计易受不规则运动和光照影响的缺点。

    基于关键帧的视频流索引播放系统

    公开(公告)号:CN1444398A

    公开(公告)日:2003-09-24

    申请号:CN02103273.4

    申请日:2002-03-12

    Abstract: 一种基于关键帧的视频流索引播放方法,包括步骤:在视频播放器中加入预览播放窗口;在视频文件中的每个视频流中建立一个索引轨道;视频播放器根据预览播放窗口的内容选择主播放的内容。本发明提供了一种基于关键帧的视频流索引播放方法,通过在视频播放器中加入一个预览播放窗口,同时在视频文件中针对需要索引浏览的视频轨道,建立一个新的索引预览轨道,视频播放器根据索引预览轨道中记录索引关键帧的时间戳信息计算出此索引帧所对应的正常播放时间,从而实现根据预览播放窗口的内容选择主播放的内容。

    汉语语音识别中重复出现词识别错误的自动修正方法

    公开(公告)号:CN102324233B

    公开(公告)日:2014-05-07

    申请号:CN201110220842.4

    申请日:2011-08-03

    Abstract: 本发明提供一种汉语语音识别中重复出现词识别错误的自动修正方法,包括:(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配,以查找重复出现词组;其中,字混淆网络是所有可能识别结果的集合,字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果;词组库包括词组及其对应的中间识别结果;(2)根据查找得到的词组信息,重新计算相似概率值和字识别概率值;(3)根据新的概率值,对字混淆网络按照概率值大小排序;和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。优点在于:利用之前已修正的识别结果中的经验知识,自动修正当前识别语句中重复出现词的识别错误,从而提高识别错误的修正效率,加快识别错误修正速度。

    一种基于聚类的图像查询方法

    公开(公告)号:CN101211355B

    公开(公告)日:2010-05-19

    申请号:CN200610171519.1

    申请日:2006-12-30

    Abstract: 本发明公开了一种基于聚类的图像查询方法,包括以下步骤:(1)提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;(2)对描述图像内容的高维特征进行降维,得到特征子集;(3)对特征子集构成的数据集进行聚类;(4)对聚类得到的每个类分别建立索引;(5)使用索引进行图像查询。本发明的优点在于:根据图像的注意力区域对图像进行简单有效的划分,优化了索引树结构,使检索更为准确和高效。

    一种视频中语义事件检测方法及系统

    公开(公告)号:CN101478675A

    公开(公告)日:2009-07-08

    申请号:CN200810055997.5

    申请日:2008-01-03

    Abstract: 本发明公开了一种视频中语义事件检测方法及系统。该方法包括下列步骤:运动矢量归一化及噪声运动矢量过滤;摄像机运动估计;运动对象分割;语义事件检测。该系统包括:运动矢量预处理模块,用于将运动矢量归一化并利用经验规则过滤噪声运动矢量;摄像机运动估计模块,用于判断摄像机的运动方式和运动参数;运动对象分割模块,用于利用摄像机运动补偿后的运动矢量,进行运动对象分割;语义事件检测模块,用于利用分割结果检测视频镜头中的语义事件。其能够更准确、高效地检测视频中的语义事件概念。

    用于视频转换的变换系数块的转换方法

    公开(公告)号:CN100477796C

    公开(公告)日:2009-04-08

    申请号:CN200510135213.6

    申请日:2005-12-27

    Abstract: 本发明公开了一种8×8离散余弦变换(DCT)系数块直接转换到4个4×4整数变换系数块的转换方法。该方法包括如下步骤:1)将缩放矩阵结合到MPEG-2反量化矩阵中去;2)根据置换矩阵对上一步骤1)的MPEG-2反量化过程获得的8×8 DCT块进行位置调整;3)将调整后的8×8 DCT块转换为4个4×4整数变换系数块。本发明的优点是保持视频质量、降低系数转换操作的计算复杂度。

Patent Agency Ranking