-
公开(公告)号:CN117014693A
公开(公告)日:2023-11-07
申请号:CN202211320887.3
申请日:2022-10-26
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/488 , H04N21/4402 , H04N21/44 , H04N21/435 , H04N21/2343
Abstract: 本申请实施例公开了一种视频处理方法、装置、设备以及存储介质,可适用于人工智能、云技术以及区块链等领域。该方法包括:确定待处理视频的初始视频帧序列,初始视频帧序列包括多个初始视频帧;确定图像特征序列,图像特征序列包括各初始视频帧的目标图像特征;基于每个目标图像特征以及图像特征序列中与该目标图像特征相邻的目标图像特征,确定该目标图像特征对应的融合特征;基于每个融合特征确定对应的初始视频帧的帧类型,帧类型包括第一类型和第二类型,第一类型的视频帧不包括重复出现的字幕信息,第二类型的视频帧包括重复出现的字幕信息。采用本申请实施例,可快速准确地确定出视频中各视频帧的帧类型,适用性高。
-
公开(公告)号:CN116958615A
公开(公告)日:2023-10-27
申请号:CN202210346679.4
申请日:2022-03-31
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06V40/16 , G06V30/41 , G06V10/40 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了图片识别方法、装置、设备和介质,涉及大数据技术领域,具体涉及图像内容审核技术领域。该方法包括:对目标图片进行人脸识别,根据人脸识别的结果对所述目标图片进行敏感人物检测;对所述目标图片进行多模态检测,所述多模态检测包括敏感文本检测、图文融合检测以及敏感图像检测中的至少一项;根据所述敏感人物检测的结果以及所述多模态检测的结果确定所述目标图片是否为敏感图片,能够结合多模态的识别结果判断图片是否敏感,大大提升了敏感图片的识别准确度。
-
公开(公告)号:CN111126396B
公开(公告)日:2023-08-22
申请号:CN201911360763.6
申请日:2019-12-25
Applicant: 北京科技大学 , 腾讯科技(深圳)有限公司
IPC: G06V20/62 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供了一种图像识别方法、装置、计算机设备以及存储介质,本申请属于人工智能领域,该方法包括:根据分类器集合获取与图像相关联的对象识别结果集合;分类器集合包括至少两个分类器,至少两个分类器为处于不同的参数训练阶段的模型,至少两个分类器均用于识别图像中所包含的目标对象,每个分类器均对应一个识别结果;获取至少两个分类器分别对应的识别置信度;根据识别置信度与对象识别结果集合中所包含的识别结果,确定图像对应的目标识别结果。采用本申请实施例,可以提高图像识别的准确率。
-
公开(公告)号:CN114399626A
公开(公告)日:2022-04-26
申请号:CN202210062161.8
申请日:2022-01-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V10/24 , G06V10/26 , G06V10/44 , G06V10/422 , G06V10/74
Abstract: 本申请提供一种图像处理方法、装置、计算机设备、存储介质及程序产品,涉及人工智能、计算机视觉、云计算技术领域。通过对待视角校正的文本图像提取边缘图和分割图;并基于边缘图所指示的边缘位置的边缘点,以精确到点的精度筛选出至少两个候选多边形;并进一步结合分割图,对该至少两个候选多边形进行筛选,得到目标多边形,以结合分割图所指示的文本区域,从文本边缘的几种候选中精确圈定文本的边缘,即使是复杂多变的场景也同样适用,提高图像处理过程的实用性和准确性。基于目标多边形和目标尺寸对文本图像进行透视变换,得到视角校正后的目标图像;通过对边缘图和分割图的结合提高文本边缘的精度,提高图像处理的准确性和实用性。
-
公开(公告)号:CN106940799B
公开(公告)日:2020-07-24
申请号:CN201610004431.4
申请日:2016-01-05
Applicant: 腾讯科技(深圳)有限公司
IPC: G06K9/34
Abstract: 本发明提供了一种文本图像处理方法,所述方法包括:预处理文本图像得到二值化图像和所述二值化图像包含的多个连通域;通过凸包算法得到所述多个连通域分别对应的凸包以及外接于所述凸包的字符区域;对得到的所述字符区域进行水平方向的字符切分得到所述二值化图像中分布的多个字符块;根据二值化图像中字符块高度进行字符块的合并处理,得到所述文本图像包含的字块。此外,还提供了一种与该方法匹配的文本图像处理装置。上述文本图像处理方法和装置能够提高字符分割的通用性和准确性。
-
公开(公告)号:CN111126396A
公开(公告)日:2020-05-08
申请号:CN201911360763.6
申请日:2019-12-25
Applicant: 北京科技大学 , 腾讯科技(深圳)有限公司
Abstract: 本申请实施例提供了一种图像识别方法、装置、计算机设备以及存储介质,本申请属于人工智能领域,该方法包括:根据分类器集合获取与图像相关联的对象识别结果集合;分类器集合包括至少两个分类器,至少两个分类器为处于不同的参数训练阶段的模型,至少两个分类器均用于识别图像中所包含的目标对象,每个分类器均对应一个识别结果;获取至少两个分类器分别对应的识别置信度;根据识别置信度与对象识别结果集合中所包含的识别结果,确定图像对应的目标识别结果。采用本申请实施例,可以提高图像识别的准确率。
-
公开(公告)号:CN106503609B
公开(公告)日:2019-07-16
申请号:CN201510566721.3
申请日:2015-09-08
Applicant: 腾讯科技(深圳)有限公司
Inventor: 王红法
IPC: G06K9/00
CPC classification number: G06K9/001 , G06K9/00013 , G06K9/00067 , G06K9/0008 , G06K9/4642 , G06T5/20
Abstract: 本发明实施例公开了一种指纹纹线点的识别方法,包括:接收输入的指纹图像,对所述指纹图像进行方向场估计;遍历所述指纹图像中的像素点作为目标像素点,获取根据方向场估计得到的所述目标像素点的纹线方向以及与所述纹线方向垂直的法线方向;以所述目标像素点为中心点划定矩形区域,且所述矩形区域的长和宽的延展方向分别对应所述目标像素点的纹线方向和法线方向,所述矩形区域包含沿所述法线方向排列的多个像素点行;计算各个所述像素点行中像素点的灰度值之和,在包含所述目标像素点的像素点行对应的灰度值之和为最小值时,判定所述目标像素点为指纹纹线点。本发明还公开了一种指纹纹线点的识别装置。本发明中指纹纹线点的识别方法及装置可以提高识别的准确性。
-
公开(公告)号:CN106709490A
公开(公告)日:2017-05-24
申请号:CN201510467750.4
申请日:2015-07-31
Applicant: 腾讯科技(深圳)有限公司
Inventor: 王红法
IPC: G06K9/32
Abstract: 本发明公开了一种字符的识别方法和装置,用于提高字符识别的准确率,以及保证字符识别的稳定性,本发明实施例提供的方法包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。
-
公开(公告)号:CN103854298B
公开(公告)日:2016-08-17
申请号:CN201410050540.0
申请日:2014-02-13
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种图片与二维码融合的方法,包括:将用户输入的要生成二维码的信息生成二维码,对用户选中的要融合的图片进行预处理,得到预处理后的图片,所述预处理后的图片与所述二维码的尺寸相同,且只有黑白效果,按照预置的融合策略,将所述预处理后的图片与所述二维码进行融合,生成图片二维码,所述图片二维码中所述预处理后的图片融合分布在所述二维码的整个区域中。本发明实施例提供的图片与二维码融合的方法,可以将图片融合到二维码中,改善了二维码的展示效果。
-
公开(公告)号:CN114693717B
公开(公告)日:2024-09-06
申请号:CN202210172618.0
申请日:2022-02-24
Applicant: 腾讯科技(深圳)有限公司
IPC: G06T7/187 , G06T5/80 , G06T3/4038 , G06T3/4023
Abstract: 本申请实施例提供一种图像处理方法、装置、设备及计算机可读存储介质,至少应用于人工智能技术领域,其中,方法包括:对待处理图像进行文本区域识别,得到与所述待处理图像中的目标文本对应的文本连通域;对所述文本连通域进行递归分割处理,得到所述文本连通域的上边界线和下边界线;基于所述上边界线与所述下边界线之间的间距,对所述目标文本对应的文本图像进行划分,形成多个文本子图像;对每一所述文本子图像进行图像变换处理,得到变换后的文本子图像;对所述变换后的文本子图像进行拼接,形成拼接文本图像。通过本申请,能够实现对待处理图像中的目标文本的文本图像进行准确的矫正处理,并能够提高文本矫正的效率。
-
-
-
-
-
-
-
-
-