-
公开(公告)号:CN114511741B
公开(公告)日:2024-09-13
申请号:CN202210107087.7
申请日:2022-01-28
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V10/764 , G06V10/40 , G06V10/26 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种图像的识别方法、装置、设备、存储介质及程序产品;涉及人工智能技术领域以及地图领域,方法包括:基于待识别图像调用检测模型进行标识检测处理,得到待识别图像中的待识别标识图像;基于待识别标识图像调用识别模型进行特征提取处理,得到待识别标识图像的图像特征;获取标识图像库中每个样本标识图像对应的图像特征,确定待识别标识图像的图像特征与每个样本标识图像的图像特征之间的特征距离;将最小的特征距离对应的样本标识图像所属的类别,作为待识别标识图像所属的类别。通过本申请提供的图像的识别方法,能够提升识别图像中标识的准确度。
-
公开(公告)号:CN116975331A
公开(公告)日:2023-10-31
申请号:CN202310203065.5
申请日:2023-02-23
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/48 , G06F16/487 , G06F16/9535
Abstract: 本申请涉及人工智能,具体本申请涉及一种媒体全局信息提取方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取媒体数据集和媒体数据集初始的全局时空特征;根据初始的全局时空特征,确定与媒体数据集的多个媒体数据对应的多个媒体特征序列;基于多个媒体特征序列确定初始的挖掘特征序列,并基于初始的挖掘特征序列进行多轮次的挖掘,获得输出的挖掘特征序列;根据输出的挖掘特征序列中与媒体数据集中的多个媒体数据各自对应的全局时空特征,确定与媒体数据集相对应的媒体全局信息。采用本方法能够提升媒体全局信息的准确性。
-
公开(公告)号:CN114417251A
公开(公告)日:2022-04-29
申请号:CN202210088542.3
申请日:2022-01-25
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请实施例公开了一种基于哈希码的检索方法、装置、设备及存储介质,相关实施例可应用于云技术、人工智能、智慧交通等各种场景,用于提高哈希码量化信息间的余弦相似度的准确性。本申请实施例方法包括:获取待处理信息所对应的第一特征向量,采用目标投影矩阵与目标旋转矩阵,对第一特征向量进行计算,得到第一分值向量,针对于第一分值向量中的每个分值元素,将分值元素分别与出现在分值元素之前的各个分值元素进行数值比较,以得到分值元素所对应的编码值,其中,每个分值元素所对应的编码值为0或1,根据第一分值向量中每个分值元素的编码值,生成待处理信息所对应的第一目标哈希码,根据第一目标哈希码确定第一目标检索信息。
-
公开(公告)号:CN114328988A
公开(公告)日:2022-04-12
申请号:CN202111404192.9
申请日:2021-11-24
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/43 , G06F16/483 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种多媒体数据的特征提取方法、多媒体数据检索方法及装置,其中多媒体数据的特征提取方法通过对目标多媒体数据进行图像特征提取,得到目标多媒体数据的图像特征序列;对目标多媒体数据中的音频数据进行语音识别,并对语音识别结果进行文本特征提取,得到目标多媒体数据的文本特征序列;将图像特征序列和文本特征序列进行融合,得到融合特征序列;对融合特征序列进行自注意力计算,得到目标特征序列;根据目标特征序列确定目标多媒体数据的目标特征。该方法可以提高对多媒体数据进行特征提取的准确性。
-
公开(公告)号:CN112861474A
公开(公告)日:2021-05-28
申请号:CN202110439827.2
申请日:2021-04-23
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/117 , G06K9/46 , G06K9/62 , G06F16/58 , G06F16/532 , G06F16/27
Abstract: 本申请提供了一种信息标注方法、装置、设备及计算机可读存储介质;涉及云技术以及人工智能技术,方法包括:基于图像数据集的第i次正样本、第i次锚样本和第i次负样本,训练第i‑1次度量模型,得到第i次度量模型;基于第i次度量模型,对比第i次正样本和第i次锚样本;基于对比结果,对第i次正样本进行主体裁剪,获得第i+1次正样本,并对第i次锚样本进行主体裁剪,获得第i+1次锚样本;继续基于第i+1次正样本、第i+1次锚样本和第i+1次负样本训练第i次度量模型,并基于训练后的第i次度量模型分别对第i+1次正样本和第i+1次锚样本进行主体裁剪,直到满足截止条件时,获得图像数据集的主体标注区域。通过本申请,能够提升主体检测领域的标注效率。
-
公开(公告)号:CN107688803B
公开(公告)日:2020-04-03
申请号:CN201610641373.6
申请日:2016-08-05
Applicant: 腾讯科技(深圳)有限公司
IPC: G06K9/20
Abstract: 本公开揭示了一种字符识别中识别结果的校验方法和装置。所述方法包括:通过字符识别输出的识别结果构建待识别字符串的隐马尔科夫链,所述识别结果包含待识别字符串中各字符的候选字符;根据所述隐马尔科夫链和预训练的状态转移矩阵求解所述识别结果输出所述候选字符的最优路径;根据所述最优路径中的状态转移概率识别所述待识别字符串中的非中文字符;根据所述待识别字符串中的非中文字符进行所述识别结果校验的反馈。通过此过程,将待识别字符串中存在的非中文字符识别出来,并且根据此进行识别结果校验的反馈,由此将为字符识别提供了反馈机制,并有效区分待识别字符串中的中文字符和非中文字符,进而能够有效避免识别结果中低级错误的存在。
-
公开(公告)号:CN104751410B
公开(公告)日:2017-05-24
申请号:CN201310754632.2
申请日:2013-12-31
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种图像与二维码的融合方法及装置,属于信息处理技术领域。所述方法包括:获取待融合的图像及二维码;根据二维码的单元大小将图像划分成多个图像区域;将二维码中第一区域的值覆盖到对应的图像区域的中心位置,并将二维码中第二区域的值覆盖到对应的图像区域,得到融合图像后的二维码。本发明通过获取待融合的图像及二维码,并根据二维码的单元大小将图像划分成多个图像区域,再将二维码中第一区域的值覆盖到对应的图像区域的中心位置,并将二维码中第二区域的值覆盖到对应的图像区域,得到融合图像后的二维码,从而扩大了图像的显示区域,优化了融合后的二维码的显示效果。
-
公开(公告)号:CN105407353A
公开(公告)日:2016-03-16
申请号:CN201410461412.5
申请日:2014-09-11
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N19/13 , H04N19/625
Abstract: 本发明实施例公开了一种图像压缩方法,及装置,其中方法的实现包括:获取需要进行图像压缩的图像集合;所述图像集合内包含需要压缩的图像;计算所述图像集合内的图像之间的相似度,将相似度高于预定门限的图像作为相似图像集合;利用相似图像之间的相似性对所述相似图像集合内的图像进行图像压缩。通过计算图像集合中的个图像的相似度,并获得相似图像集合,从而将无序的图像集合有序化;利用图像之间的相似性可以将无序图像集合中的一部分图像更好的压缩,获得更高的图像压缩率;因此可以进一步提高图像压缩率,从而降低需要占用的存储空间,以及传输时候消耗的流量。
-
公开(公告)号:CN103854298A
公开(公告)日:2014-06-11
申请号:CN201410050540.0
申请日:2014-02-13
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种图片与二维码融合的方法,包括:将用户输入的要生成二维码的信息生成二维码,对用户选中的要融合的图片进行预处理,得到预处理后的图片,所述预处理后的图片与所述二维码的尺寸相同,且只有黑白效果,按照预置的融合策略,将所述预处理后的图片与所述二维码进行融合,生成图片二维码,所述图片二维码中所述预处理后的图片融合分布在所述二维码的整个区域中。本发明实施例提供的图片与二维码融合的方法,可以将图片融合到二维码中,改善了二维码的展示效果。
-
公开(公告)号:CN114693717A
公开(公告)日:2022-07-01
申请号:CN202210172618.0
申请日:2022-02-24
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请实施例提供一种图像处理方法、装置、设备及计算机可读存储介质,至少应用于人工智能技术领域,其中,方法包括:对待处理图像进行文本区域识别,得到与所述待处理图像中的目标文本对应的文本连通域;对所述文本连通域进行递归分割处理,得到所述文本连通域的上边界线和下边界线;基于所述上边界线与所述下边界线之间的间距,对所述目标文本对应的文本图像进行划分,形成多个文本子图像;对每一所述文本子图像进行图像变换处理,得到变换后的文本子图像;对所述变换后的文本子图像进行拼接,形成拼接文本图像。通过本申请,能够实现对待处理图像中的目标文本的文本图像进行准确的矫正处理,并能够提高文本矫正的效率。
-
-
-
-
-
-
-
-
-