基于类内变化字典和训练图像的稀疏表示人脸识别方法

    公开(公告)号:CN102915436A

    公开(公告)日:2013-02-06

    申请号:CN201210411771.0

    申请日:2012-10-25

    Abstract: 本发明公开了一种基于类内变化字典和训练图像的稀疏表示人脸识别方法,用于解决现有方法在小样本、光照不均、人脸遮挡和表情变化下的局限性问题,提高了人脸识别精度。该方法的实现步骤为:(1)对训练图像集合和测试人脸图像进行图像特征提取,形成训练图像矩阵和测试图像向量,并分别进行归一化处理;(2)从人脸数据库中统计相同人脸在不同外部环境影响下呈现出来的图像纹理差异,形成人脸的类内变化字典;(3)将测试图像表示成为训练图像矩阵和类内变化字典的线性组合,通过L1范数最小化准则求得最优稀疏表示系数;(4)求得原测试图像与由各类别训练图像和类内变化字典重构得到的重构图像的残差,代入类别判定公式得到识别结果。

    一种基于车牌、车身颜色和车标识别的套牌车辆识别设备及方法

    公开(公告)号:CN101630361A

    公开(公告)日:2010-01-20

    申请号:CN200810246617.6

    申请日:2008-12-30

    Abstract: 本发明公开了一种基于车身颜色、车牌和车标识别的套牌车辆自动识别设备及其方法。所述的设备包括:视频检测器、车牌定位器、车牌识别器、车身颜色识别器、车标定位器、车标识别器、数据库查询与报警装置等。根据车牌图像的局部边缘信息丰富的特点,该设备可以在捕获的图像中准确的定位车牌,利用车牌的位置,又提取车身区域和车标的粗略位置,根据提取的粗略位置再准确的提取车身颜色和车标;接下来是车牌字符识别、车身颜色判断和车标识别,根据此三项识别结果就和数据库里的资料进行比对,可以查出是否为套牌车辆,如果是套牌车辆,可以自动报警,由执法人员拦截进行进一步核实。该设备结构化好,操作简单,判别精度高,而且人工设定参数少。该设备还可以应用在欠费车辆、被盗车辆或违章车辆抓逃等。

    可预览视频搜索引擎的爬虫系统的构建方法

    公开(公告)号:CN101404026A

    公开(公告)日:2009-04-08

    申请号:CN200810180825.0

    申请日:2008-11-25

    Inventor: 杨溥 郭军 陈光

    Abstract: 本发明公开了一种可预览视频搜索引擎的爬虫系统的构建方法,该方法包括下列步骤:(1)超链接映射成列表;(2)检测列表状态;(3)摘要图片处理;(4)视频处理;(5)视频标题处理。通过应用本发明所描述的方法,可以为可预览视频搜索引擎的爬虫系统提供通用的设计方法;可以为可预览视频搜索引擎提供预览型数据集,简化可预览视频搜索引擎的其他部分的设计和开发,大幅度地降低可预览视频搜索引擎爬虫系统和可预览视频搜索引擎的开发成本。

    用于文字识别的训练样本自动挑选装置及其方法

    公开(公告)号:CN1419214A

    公开(公告)日:2003-05-21

    申请号:CN02157956.3

    申请日:2002-12-23

    Abstract: 本发明公开了一种用于文字识别的训练样本自动挑选装置和方法,所述的装置包括:样本输入装置、样本数据存储单元、训练装置、模型数据库、识别装置、识别结果分析装置、边界样本选择装置、挑选结果输出装置和控制处理装置。所述的方法是根据训练样本对于训练的作用,将训练样本分为好样本、边界样本、差样本三种类型,并通过训练样本进行训练、识别的结果计算广义距离差,根据广义距离差给出三种样本的定义,最后通过边界样本的选择实现训练样本的挑选。本发明的装置和方法思路简捷,能够实现训练样本的自动挑选,挑选结果更加准确,从而使得训练出的模型更加精确,有效提高文字识别系统的识别率。

    人脸图像超分辨率重建方法、装置

    公开(公告)号:CN119251049A

    公开(公告)日:2025-01-03

    申请号:CN202411093816.3

    申请日:2024-08-09

    Abstract: 本公开提出一种人脸图像超分辨率重建方法、装置,方法包括:对低分辨率人脸图像的初始面部特征进行N次下采样,任意一次下采样得到的面部特征是增强后的第一低频特征以及增强后的多个第一高频特征融合得到;对第N次下采样输出的面部特征进行N次上采样输出增强后的面部特征,任意一次上采样得到的面部特征是低频融合特征和增强后的多个第二高频特征反小波变换得到;融合初始面部特征与增强后的面部特征,得到低分辨率人脸图像重建后的人脸图像。本公开实施例能够在下采样时减少关键面部结构的损失,以及在上采样时获取额外特征以增强和完善面部轮廓,以解决重建人脸图像的面部轮廓失真问题。

    多视角的细粒度识别方法、装置、电子设备及介质

    公开(公告)号:CN115424086A

    公开(公告)日:2022-12-02

    申请号:CN202210887082.0

    申请日:2022-07-26

    Abstract: 本申请公开了一种多视角的细粒度识别方法、装置、电子设备及介质。通过应用本申请的技术方案,可以利用一个由多个多视图样本的多视角图像所组成的样本数据集来对初始分类模型进行训练。从而得到一个能够主动选择同一样本的下一个视图图像进行图像识别的高效细粒度识别模型,进而一方面通过对同一样本多视图图像的信息聚合,解决了传统细粒度图像识别方法仅依靠单一图片提供具有判别力线索的局限性。另一方面通过对具有判别力视图的预测,提高了基于多视图细粒度识别的识别效率。

    一种基于竞争神经网络的鲁棒说话人识别方法

    公开(公告)号:CN107993664B

    公开(公告)日:2021-05-28

    申请号:CN201810075745.2

    申请日:2018-01-26

    Abstract: 本发明实施例公开了一种基于竞争神经网络的鲁棒说话人识别方法。该方法利用竞争神经网络提取具有噪声不变性的声学特征,并利用该特征进行基于GMM‑UBM模型的说话人识别系统的训练,包括如下步骤:构建包含两个级连的编码网络与区分网络的竞争神经网络,并利用其中的编码网络提取噪声不变特征,然后利用提取的特征实现基于GMM‑UBM模型的说话人。在竞争网络训练时编码网络与区分网络分别训练,训练编码网络时所有输入采用相同的干净语音标签,训练区分网络时利用训练语音的噪声类型作为训练标签,利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。

    一种基于潜层因子的跨领域商品推荐方法及装置

    公开(公告)号:CN106485537A

    公开(公告)日:2017-03-08

    申请号:CN201610809473.5

    申请日:2016-09-07

    Inventor: 高升 李俊岑 郭军

    CPC classification number: G06Q30/0201

    Abstract: 本发明实施例公开了一种基于潜层因子的跨领域商品推荐方法及装置,所述方法包括:采集第一领域和第二领域的用户对商品的打分数据;根据打分数据,构建针对第一领域和第二领域的打分矩阵;根据打分矩阵,确定第一领域和第二领域的公共打分矩阵、第一领域和第二领域的特有打分矩阵、第一领域和第二领域的潜层用户因子矩阵、第一领域和第二领域的潜层商品因子矩阵、第一领域和第二领域的指示矩阵;根据所确定的矩阵,构建目标函数;求解所述目标函数;根据函数的求解值,对第一打分矩阵和第二打分矩阵进行重构;根据重构后的第一打分矩阵和第二打分矩阵,对商品进行推荐。应用本发明实施例,提高了商品推荐的准确率。

    一种基于最小编辑距离的半结构化文本匹配方法

    公开(公告)号:CN104008187B

    公开(公告)日:2017-02-01

    申请号:CN201410257734.8

    申请日:2014-06-11

    Inventor: 赵宇 高升 郭军

    Abstract: 本发明属于自然语言处理领域,提出一种基于最小编辑距离的半结构化文本匹配方法。该方法包括如下步骤:一、对数据进行预处理;二、离线训练,确定对数似然率算法和左右熵算法阈值;三、结合这两种算法,在线为待评测的半结构化文本中非结构化文本抽取多词表达集合;四、利用抽取的多词表达集合,加上原评测文本中的结构化串,得到该文本的基于多词表达集合的文本表达;五、利用基于最小编辑距离的半结构化文本匹配方法,计算输入的半结构化文本和待匹配的半结构化文本的匹配度;六、以特征集合的相似度来衡量文本的匹配度,输出排序结果(Top-N)。利用本发明实施例,能够提高半结构化文本的匹配准确度,具有很大的实用价值。

    一种基于随机映射直方图模型的文本无关说话人鉴别装置

    公开(公告)号:CN103985384B

    公开(公告)日:2015-04-15

    申请号:CN201410232526.2

    申请日:2014-05-28

    Inventor: 于泓 马占宇 郭军

    Abstract: 本发明实施例公开了一种基于随机映射直方图模型的文本无关说话人鉴别方法。该方法包括如下步骤:特征提取步骤:将非归一化递增的线谱频率特征变换归一化的差分线谱频率特征并将相邻帧的差分线谱频率特征进行组合生成复合差分线谱频率特征以表达信号的动态特性。模型训练步骤:根据复合差分线谱频率特征的分布特点设计随机映射参数,对训练数据集进行随机映射并通过计算平均直方图来构建概率模型。鉴别步骤:对待鉴别人的语音信号按照步骤一提取特征后输入到步骤二训练得到的模型中,计算针对每个概率模型的似然值,获取最大似然值,确认说话人编号。利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。

Patent Agency Ranking