-
公开(公告)号:CN100336071C
公开(公告)日:2007-09-05
申请号:CN200510086249.X
申请日:2005-08-19
Applicant: 清华大学
IPC: G06K9/00
Abstract: 复杂背景下的眼睛精确定位技术属于人脸识别领域。其特征在于,提出了一种性能鲁棒的复杂背景下图像中的眼睛精确定位方法。它采用高效率和高冗余度的微结构特征来表达眼睛模式局部和全局区域的灰度分布特点;并采用AdaBoost算法从中选择出最具有区分的微结构特征构成强分类器,综合考虑了局部特征以及能够表达这种约束关系的全局特征得到更鲁棒的定位效果。从而以更简单的结构实现复杂背景图像下更高性能的的双眼定位;在多个公开数据库上以及竞赛评测的结果证明了本发明的优异性能。
-
公开(公告)号:CN1741035A
公开(公告)日:2006-03-01
申请号:CN200510086478.1
申请日:2005-09-23
Applicant: 清华大学
IPC: G06K9/00
Abstract: 印刷体阿拉伯字符集文本切分方法属于光学字符识别中的字符切分领域。本发明特征在于:在字符块分类的基础上,选择部分字符块水平投影分割文本图像成子区域,然后检测多行子区域归并字符块实现多行子区域的文字行切分;随后估计文字行的基线和顶线位置,并把文字行切分成联体字符段;最后根据字符切点的特点寻找在基线上、基线上方及基线下方的切点,并且利用结构规则删除过切分点。本发明在多字体多字号印刷体阿拉伯文本测试集上的字符切分正确率达到99%以上。
-
公开(公告)号:CN117373010A
公开(公告)日:2024-01-09
申请号:CN202311329890.6
申请日:2023-10-15
Applicant: 清华大学
IPC: G06V20/62 , G06V10/44 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了基于深度表征学习的车牌图像识别方法及系统,该方法,包括获取车牌图像样本数据送入车牌识别模型;其中,车牌识别模型,包括图像校正模块、特征提取模块、编码器和解码器;利用图像校正模块对车牌图像进行图像校正得到校正图像,并利用特征提取模块对校正图像进行特征提取得到最终特征图;将最终特征图输入至编码器得到隐含表征序列,并利用解码器对隐含表征序列进行解码得到车牌识别结果。本发明适用于识别开放场景中动态获取的车牌图像,可提高低质量车牌图像识别性能。
-
公开(公告)号:CN110522424A
公开(公告)日:2019-12-03
申请号:CN201910772417.2
申请日:2019-08-21
Applicant: 清华大学
Abstract: 本发明实施例提供一种新型压力传感器及其生理信号测量方法,该新型压力传感器包括:应变单元和测量单元;其中:应变单元用于感知压力的变化并产生弹性变形,且应变单元采用不完全透光材料;测量单元包括发光模块和光接收及转换模块;发光模块发出的光经过应变单元后被光接收及转换模块接收并转换为电信号,电信号的变化反映压力的变化。本发明实施例提供的新型压力传感器及其生理信号测量方法,通过将压力的变化转换为应变单元的形变,进而转换为光信号,并进一步转换为电信号,实现了压力变化信息的简便快速获取;并且具有精度高、可以测量很微小的压力变化,灵敏度高、压力变化反应快,体积小、使用方便,抗干扰能力强等诸多优点。
-
公开(公告)号:CN107909101A
公开(公告)日:2018-04-13
申请号:CN201711106410.4
申请日:2017-11-10
Applicant: 清华大学
CPC classification number: G06K9/6259 , G06K9/685 , G06K2209/01 , G06N3/0454 , G06N3/08
Abstract: 本发明提供基于卷积神经网络的半监督迁移学习字符识别方法,包括:将目标域中无类别标签的批量字符图像样本作为测试样本集输入半监督迁移学习后的卷积神经网络,识别所述测试样本集的字符图像;所述半监督迁移学习后的卷积神经网络由源域中有类别标签的批量字符图像样本、目标域中有类别标签的批量字符图像样本以及所述目标域中无类别标签的批量字符图像样本联合训练所得,提高了识别精度。本发明提供的基于卷积神经网络的半监督迁移学习字符识别方法及系统,能利用大量有类别标签的源域样本、少量有类别标签的目标域样本和较容易获得的无类别标签的目标域样本进行半监督迁移学习,提高了卷积神经网络对目标域样本的适应能力。
-
公开(公告)号:CN104008370B
公开(公告)日:2017-06-13
申请号:CN201410211494.8
申请日:2014-05-19
Applicant: 清华大学
Abstract: 本发明公开了一种视频人脸识别方法,包括以下步骤:S1:对视频进行人脸检测和跟踪得到人脸序列;S2:对所述人脸序列进行筛选,得到人脸典型帧集合;S3:基于正面人脸生成技术和图像超分辨率技术优化所述人脸典型帧集合,得到增强的人脸典型帧集合;S4:通过将所述增强的人脸典型帧集合与预设的静态人脸图像匹配库比对,进行人脸识别或验证。与现有的视频人脸识别方法相比,本发明通过使用增强的人脸典型帧集合,过滤和补偿了视频人脸姿态和分辨率的变化,从而提高了视频人脸识别的鲁棒性。
-
公开(公告)号:CN102609408A
公开(公告)日:2012-07-25
申请号:CN201210007729.2
申请日:2012-01-11
Applicant: 清华大学
Abstract: 本发明公开了一种基于多文种文档图像识别的跨文种理解方法,包括以下步骤:获取源文种的文档扫描图像,通过多文种文档图像识别途径对所述文档扫描图像进行处理,以得到源文种识别文本;对所述源文种识别文本进行分句处理;利用基于词的或基于句子的文本翻译理解模块对分句处理后的源文种识别文本进行转换,获得目标文种文本;对所述文档扫描图像、源文种识别文本和目标文种文本进行显示输出。本发明能够实现对多文种的文档扫描图像进行识别、分句、跨文种理解以及双语对照图文显示,为用户提供了各文种、各民族文字信息的获取、保存、交流与转换功能,便于用户实现跨文种的文档理解。
-
公开(公告)号:CN100336070C
公开(公告)日:2007-09-05
申请号:CN200510086248.5
申请日:2005-08-19
Applicant: 清华大学
IPC: G06K9/00
Abstract: 复杂背景下的人脸检测技术属于人脸识别领域。其特征在于,提出了一种性能鲁棒的复杂背景下图像中的人脸检测方法。它采用高效率和高冗余度的微结构特征来表达人脸模式中眼睛、嘴巴等区域的灰度分布特点;并采用风险敏感的AdaBoost算法从中选择出最具有区分人脸和非人脸的微结构特征构成强分类器,使训练得到的每一层分类器在保证对人脸类别极低的拒识率的情况下,尽可能降低非人脸样本的误接受率,从而以更简单的结构实现复杂背景图像下更高性能的的人脸检测;另外还使用了后处理算法进一步降低误检率。在多个公开数据库上以及竞赛评测的结果证明了本发明的优异性能。
-
公开(公告)号:CN1333366C
公开(公告)日:2007-08-22
申请号:CN200510011510.X
申请日:2005-04-01
Applicant: 清华大学
IPC: G06K9/00
Abstract: 基于统计结构特征的联机手写汉字识别方法,属于汉字识别技术领域,其特征在于:先对处理的字符对象进行预处理,以消除噪声干扰,消除部分书写变形并把待识汉字所占空间映射到一个固定大小的位置;提取包括方向特征和边缘特征在内的能很好反映联机手写汉字特征在内的统计结构特征,再把得到的这些原始特征使用线性鉴别分析方法压缩变换为识别特征;最后采用改进了的高斯二次分类器模型完成训练和识别,该模型用一个事先设定的常数值代替较小的特征值以消除较小的特征值估计不准确对分类性能的不利影响。本发明的平均识别率为98.43%,取得令人满意的效果。
-
公开(公告)号:CN1332348C
公开(公告)日:2007-08-15
申请号:CN200510086478.1
申请日:2005-09-23
Applicant: 清华大学
IPC: G06K9/00
Abstract: 印刷体阿拉伯字符集文本切分方法属于光学字符识别中的字符切分领域。本发明特征在于:在字符块分类的基础上,选择部分字符块水平投影分割文本图像成子区域,然后检测多行子区域归并字符块实现多行子区域的文字行切分;随后估计文字行的基线和顶线位置,并把文字行切分成联体字符段;最后根据字符切点的特点寻找在基线上、基线上方及基线下方的切点,并且利用结构规则删除过切分点。本发明在多字体多字号印刷体阿拉伯文本测试集上的字符切分正确率达到99%以上。
-
-
-
-
-
-
-
-
-