-
公开(公告)号:CN114282023A
公开(公告)日:2022-04-05
申请号:CN202110969825.4
申请日:2021-08-23
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/483 , G06V40/12 , G06V10/75 , G06V10/774 , G06K9/62
Abstract: 本申请公开了一种指纹生成方法、装置、服务器及存储介质,属于网络技术领域。通过本申请实施例提供的技术方案,在生成过程中,基于各个不同模态的资源特征来分别确定相应的资源集合,各个资源集合均包含对应模态下与该多媒体资源匹配的资源,从而基于这些资源集合内的历史多媒体资源与该多媒体资源在多个模态上的综合匹配程度,来确定内容上最相似的多媒体资源,从而进行多模态指纹的确定,通过上述方法所确定的多模态指纹融合了资源内容且易于存储和计算,不仅能起到标识多媒体资源的作用,同时通过该多模态指纹也能学习多媒体资源之间的一些相关性信息,从而提高推荐的准确性。
-
公开(公告)号:CN113495969B
公开(公告)日:2022-02-08
申请号:CN202111051312.1
申请日:2021-09-08
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及一种数字指纹生成方法、装置、计算机设备和存储介质。该方法包括:获取目标媒体数据,并对目标媒体数据进行特征提取并进行编码,得到目标媒体数据特征和编码特征,基于目标媒体数据特征从各个已生成数字指纹的历史媒体数据中进行相似媒体数据搜索,得到目标媒体数据对应的待筛选媒体数据集;基于编码特征从待筛选媒体数据集中进行相似编码筛选,得到目标媒体数据对应的初始筛选媒体数据集,基于目标媒体数据特征从初始筛选媒体数据集中进行相似特征筛选,得到目标媒体数据对应的目标筛选媒体数据;获取目标筛选媒体数据对应的目标数字指纹,将目标数字指纹作为目标媒体数据对应的数字指纹。采用本方法能够提高多媒体数字指纹生成效率。
-
公开(公告)号:CN113495969A
公开(公告)日:2021-10-12
申请号:CN202111051312.1
申请日:2021-09-08
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及一种数字指纹生成方法、装置、计算机设备和存储介质。该方法包括:获取目标媒体数据,并对目标媒体数据进行特征提取并进行编码,得到目标媒体数据特征和编码特征,基于目标媒体数据特征从各个已生成数字指纹的历史媒体数据中进行相似媒体数据搜索,得到目标媒体数据对应的待筛选媒体数据集;基于编码特征从待筛选媒体数据集中进行相似编码筛选,得到目标媒体数据对应的初始筛选媒体数据集,基于目标媒体数据特征从初始筛选媒体数据集中进行相似特征筛选,得到目标媒体数据对应的目标筛选媒体数据;获取目标筛选媒体数据对应的目标数字指纹,将目标数字指纹作为目标媒体数据对应的数字指纹。采用本方法能够提高多媒体数字指纹生成效率。
-
公开(公告)号:CN112861474B
公开(公告)日:2021-07-02
申请号:CN202110439827.2
申请日:2021-04-23
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/117 , G06K9/46 , G06K9/62 , G06F16/58 , G06F16/532 , G06F16/27
Abstract: 本申请提供了一种信息标注方法、装置、设备及计算机可读存储介质;涉及云技术以及人工智能技术,方法包括:基于图像数据集的第i次正样本、第i次锚样本和第i次负样本,训练第i‑1次度量模型,得到第i次度量模型;基于第i次度量模型,对比第i次正样本和第i次锚样本;基于对比结果,对第i次正样本进行主体裁剪,获得第i+1次正样本,并对第i次锚样本进行主体裁剪,获得第i+1次锚样本;继续基于第i+1次正样本、第i+1次锚样本和第i+1次负样本训练第i次度量模型,并基于训练后的第i次度量模型分别对第i+1次正样本和第i+1次锚样本进行主体裁剪,直到满足截止条件时,获得图像数据集的主体标注区域。通过本申请,能够提升主体检测领域的标注效率。
-
公开(公告)号:CN114329007B
公开(公告)日:2024-12-03
申请号:CN202111129434.8
申请日:2021-09-26
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/51 , G06F16/53 , G06F17/16 , G06V10/74 , G06V10/774
Abstract: 本申请实施例公开了一种人工智能领域的哈希特征压缩方法及相关装置,其中该方法包括:获取属于目标数据类型的目标对象对应的待压缩哈希码,待压缩哈希码是通过目标哈希模型编码处理目标对象的目标特征得到的;基于低效哈希位索引确定待压缩哈希码中的低效哈希位并去除低效哈希位,得到目标对象对应的压缩哈希码;低效哈希位索引是目标哈希码中重要度满足预设非重要条件的哈希位的索引值;低效哈希位索引是根据属于目标数据类型的训练对象的目标特征和通过目标哈希模型编码处理训练对象的目标特征得到的训练哈希码确定的。该方法能够有效减少哈希码中参考价值较低的信息,可实现多媒体检索、广告检索等车联网场景或者智慧交通场景下的应用。
-
公开(公告)号:CN113821676A
公开(公告)日:2021-12-21
申请号:CN202110853123.X
申请日:2021-07-27
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/732 , G06F16/783 , G06K9/62
Abstract: 本申请公开了一种视频检索方法、装置、设备及存储介质,属于人工智能技术领域。本申请通过综合考虑视频级别的时空信息和视频帧级别的时空信息,得到目标相似参数,使得该目标相似参数能够更加准确地表示第一视频与第二视频之间的相似程度,因此,基于该目标相似参数,能够提升对第一视频与第二视频之间重复片段检索的准确率。
-
公开(公告)号:CN113590898A
公开(公告)日:2021-11-02
申请号:CN202111130352.5
申请日:2021-09-26
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/903 , G06F16/906 , G06F16/908 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请实施例提供了一种数据检索方法、装置、电子设备、存储介质及计算机产品,涉及多媒体、大数据和云技术领域。该方法包括:获取检索数据,确定检索数据与至少两个第一锚点中各第一锚点之间的第一相似度,至少两个锚点是通过对训练数据集中的多个样本数据进行聚类得到的至少两个聚类中心;获取被检索数据库中的每个被检索数据与各第一锚点之间的第二相似度;根据检索数据对应于各第一锚点的第一相似度以及每个被检索数据对应于各第一锚点的第二相似度,从被检索数据库中确定与检索数据匹配的各候选被检索数据;从各候选被检索数据中确定与检索数据匹配至少一个目标被检索数据。基于本申请实施例提供的方法,能够大大提高数据检索的效率。
-
公开(公告)号:CN112115131A
公开(公告)日:2020-12-22
申请号:CN202011048598.3
申请日:2020-09-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/215 , G06Q30/02 , G06N3/04
Abstract: 本申请实施例提供一种数据去噪方法、装置、设备及计算机可读存储介质,涉及人工智能技术领域。方法包括:采用待去噪数据集合中的数据对预设算法模型进行训练;当训练后的算法模型不满足模型收敛条件时,将训练后的算法模型确定为待训练网络模型,并确定数据去噪请求中的待去噪数据集合中的每一数据与其他数据之间的第一平均距离;根据所述第一平均距离,确定噪声数据并去除所述噪声数据,得到更新数据集合;将所述更新数据集合中的数据作为样本数据输入至待训练网络模型中进行模型训练;当训练后的网络模型满足模型收敛条件时,将所述更新数据集合确定为去噪完成的数据集合。通过本申请实施例,能够提高去除噪声数据的准确率。
-
公开(公告)号:CN114490923B
公开(公告)日:2025-02-14
申请号:CN202111436420.0
申请日:2021-11-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/334
Abstract: 本申请实施例公开了一种相似文本匹配模型的训练、装置、设备及存储介质,相关实施例可应用于云技术、人工智能以及智能交通等各种场景,用于提高相似文本的召回率。该方法包括:获取与目标场景对应的第一批次样本集,并输入至原始相似文本匹配模型进行向量转化操作,得到第一批次正例句向量以及第一批次负例句向量,对第一批次正例句向量进行三元组构造操作,得到若干个第一批次三元组,并进行损失计算操作,得到第一批次损失函数,并对原始相似文本匹配模型进行参数调整操作,得到中间相似文本匹配模型,重复获取与目标场景对应的第二批次样本集,并执行向量转化操作、三元组构造操作、损失计算操作以及参数调整操作,得到目标相似文本匹配模型。
-
公开(公告)号:CN114490923A
公开(公告)日:2022-05-13
申请号:CN202111436420.0
申请日:2021-11-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/33
Abstract: 本申请实施例公开了一种相似文本匹配模型的训练、装置、设备及存储介质,相关实施例可应用于云技术、人工智能以及智能交通等各种场景,用于提高相似文本的召回率。该方法包括:获取与目标场景对应的第一批次样本集,并输入至原始相似文本匹配模型进行向量转化操作,得到第一批次正例句向量以及第一批次负例句向量,对第一批次正例句向量进行三元组构造操作,得到若干个第一批次三元组,并进行损失计算操作,得到第一批次损失函数,并对原始相似文本匹配模型进行参数调整操作,得到中间相似文本匹配模型,重复获取与目标场景对应的第二批次样本集,并执行向量转化操作、三元组构造操作、损失计算操作以及参数调整操作,得到目标相似文本匹配模型。
-
-
-
-
-
-
-
-
-