-
公开(公告)号:CN111553284A
公开(公告)日:2020-08-18
申请号:CN202010357461.X
申请日:2020-04-29
申请人: 武汉大学 , 清华大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06K9/00
摘要: 本申请涉及一种人脸图像处理方法、装置、计算机设备和存储介质。所述方法包括:获取第一用户的第一人脸图像;基于所述第一人脸图像的人脸特征生成对应的三维投影图像;获取第二用户的第二人脸视频,基于所述第二人脸视频中的各第二人脸图像提取人脸表情特征;将提取获得的各所述人脸表情特征分别融合至所述三维投影图像中进行表情重构,获得合成人脸视频;将所述合成人脸视频投影至三维实体模型进行播放,经过投影的所述三维实体模型用于人脸识别。采用本方法能够有效提高人脸识别的验证效率。
-
公开(公告)号:CN107093172A
公开(公告)日:2017-08-25
申请号:CN201610091568.8
申请日:2016-02-18
申请人: 清华大学 , 腾讯科技(深圳)有限公司
摘要: 本发明公开了一种文字检测方法及系统;方法包括:将目标图像的三色通道中的每个图像进行减色处理,得到减色图像,以及,将目标图像转换为二值图像;将减色图像中具有相同色彩的连通块进行合并,以及将二值图像中具有相同色彩的连通块合并;对减色图像三色通道的每种色彩通道的连通块、以及二值图像中的连通块,分别在竖直和水平方向上以连接的方式进行合并,得到目标图像中候选的文字区域;在目标图像上对应候选的文字区域的位置提取特定区域,基于所提取的特定区域中包含文字区域的概率与预设概率阈值的比较结果判断提取的特定区域中是否包含文字行或文字列。实施本发明,能够对图像中的文本进行准确检测。
-
公开(公告)号:CN105608673A
公开(公告)日:2016-05-25
申请号:CN201510946189.8
申请日:2015-12-16
申请人: 清华大学 , 腾讯科技(深圳)有限公司
摘要: 本发明涉及一种图像颜色量化与抖动的方法,所述方法包括:对输入图像进行计算得到视觉显著性图;基于所述视觉显著性图中的像素的视觉显著性参数构建目标函数;对所述输入图像进行交替的中值分割和聚类算法,得到初始颜色板;通过优化所述目标函数以交替的更新像素标记图和颜色板,得到最终的像素标记图和颜色板。采用该方法,能够提高颜色量化后的图像质量。此外,还提供了一种图像颜色量化与抖动的系统。
-
公开(公告)号:CN106874921B
公开(公告)日:2020-12-04
申请号:CN201510921073.9
申请日:2015-12-11
申请人: 清华大学 , 腾讯科技(深圳)有限公司
摘要: 本发明涉及一种图像分类方法和装置,所述方法包括:将待分类的图像输入多个不同的神经网络模型,获取各神经网络模型的指定的多个非输入层输出的数据生成相应的多个图像特征;将多个图像特征分别输入各神经网络模型对应的用于判别预设类别的线性分类器,获得相应的所述待分类的图像包含预设类别的物体图像的概率值;所述线性分类器是根据由相应的神经网络模型提取的相应的训练图像的特征进行训练得到的;根据获得的各个概率值判别所述待分类的图像是否包含预设类别的物体图像。本发明提供的图像分类方法装置使得图像分类更加准确。
-
公开(公告)号:CN105608673B
公开(公告)日:2020-09-25
申请号:CN201510946189.8
申请日:2015-12-16
申请人: 清华大学 , 腾讯科技(深圳)有限公司
摘要: 本发明涉及一种图像颜色量化与抖动的方法,所述方法包括:对输入图像进行计算得到视觉显著性图;基于所述视觉显著性图中的像素的视觉显著性参数构建目标函数;对所述输入图像进行交替的中值分割和聚类算法,得到初始颜色板;通过优化所述目标函数以交替的更新像素标记图和颜色板,得到最终的像素标记图和颜色板。采用该方法,能够提高颜色量化后的图像质量。此外,还提供了一种图像颜色量化与抖动的系统。
-
公开(公告)号:CN107093172B
公开(公告)日:2020-03-17
申请号:CN201610091568.8
申请日:2016-02-18
申请人: 清华大学 , 腾讯科技(深圳)有限公司
摘要: 本发明公开了一种文字检测方法及系统;方法包括:将目标图像的三色通道中的每个图像进行减色处理,得到减色图像,以及,将目标图像转换为二值图像;将减色图像中具有相同色彩的连通块进行合并,以及将二值图像中具有相同色彩的连通块合并;对减色图像三色通道的每种色彩通道的连通块、以及二值图像中的连通块,分别在竖直和水平方向上以连接的方式进行合并,得到目标图像中候选的文字区域;在目标图像上对应候选的文字区域的位置提取特定区域,基于所提取的特定区域中包含文字区域的概率与预设概率阈值的比较结果判断提取的特定区域中是否包含文字行或文字列。实施本发明,能够对图像中的文本进行准确检测。
-
公开(公告)号:CN106874921A
公开(公告)日:2017-06-20
申请号:CN201510921073.9
申请日:2015-12-11
申请人: 清华大学 , 腾讯科技(深圳)有限公司
摘要: 本发明涉及一种图像分类方法和装置,所述方法包括:将待分类的图像输入多个不同的神经网络模型,获取各神经网络模型的指定的多个非输入层输出的数据生成相应的多个图像特征;将多个图像特征分别输入各神经网络模型对应的用于判别预设类别的线性分类器,获得相应的所述待分类的图像包含预设类别的物体图像的概率值;所述线性分类器是根据由相应的神经网络模型提取的相应的训练图像的特征进行训练得到的;根据获得的各个概率值判别所述待分类的图像是否包含预设类别的物体图像。本发明提供的图像分类方法装置使得图像分类更加准确。
-
公开(公告)号:CN113516143B
公开(公告)日:2024-08-27
申请号:CN202011350030.7
申请日:2020-11-26
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V10/75 , G06V10/40 , G06V10/82 , G06N3/0464
摘要: 本申请是关于一种文本图像匹配方法、装置、计算机设备及存储介质,属于图像处理技术领域。该方法包括:获取第一特征以及第二特征;第一特征是由第一文本包含的至少两种尺度的文本特征经过编码得到的;第二特征是由第一图像包含的至少两种尺度的图像特征经过编码得到的,获取第一特征与第二特征之间的第一特征相似度;基于第一特征相似度,对第一特征以及第二特征进行加权,获得第一加权特征以及第二加权特征;基于第一特征、第二特征、第一加权特征以及第二加权特征,获取第一文本与第一图像的第二特征相似度;基于第二特征相似度,获取匹配信息。通过上述方案,提高了文本图像特征匹配的准确度。
-
公开(公告)号:CN112052771B
公开(公告)日:2024-08-27
申请号:CN202010896120.X
申请日:2020-08-31
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V40/10 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请公开一种对象重识别方法及装置;本申请与人工智能的计算机视觉以及云技术领域相关,可以获取目标区域内多个对象样本图像和每一对象样本图像的样本标签和时空信息;根据多个对象样本图像构建无向图,无向图包括相互连接的图像节点,图像节点包括对象样本图像的图像特征;基于目标区域内的时空概率分布、以及多个对象样本图像的图像特征和时空信息,确定无向图中相邻图像节点之间的时空转移概率和图像相似度;基于神经网络模型、时空转移概率、图像相似度以及多个对象样本图像的图像特征和样本标签,对神经网络模型的网络参数进行调整,以通过训练后的神经网络模型对多个待识别对象图像进行对象重识别;本申请能提升对象重识别的准确率。
-
公开(公告)号:CN110781765B
公开(公告)日:2024-02-09
申请号:CN201910942510.3
申请日:2019-09-30
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V40/20 , G06V10/774 , G06N20/00
摘要: 本发明实施例提供了一种人体姿态识别方法、装置、设备及存储介质;该方法包括:获取待识别图像;待识别图像中包含人体的成像信息;对待识别图像进行人体检测,得到至少一个人体信息;对待识别图像中的人体姿态关键点进行多尺度识别,得到多尺度关键点;对多尺度关键点进行多尺度融合,得到目标关键点;将目标关键点分配至每个人体信息中,得到人体姿态信息,完成人体姿态识别;人体姿态信息为每个人体信息的姿态所构成的集合。通过本发明实施例,能够提升人体姿态识别的准确度。
-
-
-
-
-
-
-
-
-