-
公开(公告)号:CN113434775A
公开(公告)日:2021-09-24
申请号:CN202110802012.6
申请日:2021-07-15
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/9535 , G06K9/62
Abstract: 本公开关于一种搜索内容的确定方法及装置,该方法包括:接收搜索词,并基于搜索词对数据库中的内容进行召回,得到多个内容;确定多个内容在目标评估指标下的指标值,并根据每个内容对应的指标值对多个内容进行排序,得到目标排序结果;将目标排序结果中的目标分位数的内容对应的指标值确定为阈值;从多个内容中筛选得到目标筛选结果,并获取目标筛选结果中对应的指标值小于阈值的内容,得到过滤结果;将过滤结果确定为搜索词对应的搜索内容,本公开至少解决相关技术中搜索系统搜索到的内容与搜索词不协调的问题。
-
公开(公告)号:CN111984803B
公开(公告)日:2021-08-17
申请号:CN202010845865.3
申请日:2020-08-20
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种多媒体资源处理方法、装置、计算机设备及存储介质,属于计算机技术领域。本公开实施例提供的多媒体资源处理方式,考虑到用户更倾向于对相同或相似的多媒体资源进行反馈,引入了行为数据这种信息源,不局限于已有的样本数据,突破了数据瓶颈,将行为数据转化为一种图数据,账号和多媒体资源映射为图中的节点,节点之间的连接关系能够形象地、清晰地体现多个账号和多个多媒体资源之间的反馈关系,通过这种节点之间的连接关系,能够根据已知分类结果的多媒体资源,对未知分类结果的多媒体资源进行准确分类,打破了数据瓶颈,且无需人工标注增加训练样本,通过已有数据即可完成所有的多媒体资源的分类,分类效率高。
-
公开(公告)号:CN107679513B
公开(公告)日:2021-07-13
申请号:CN201710984142.X
申请日:2017-10-20
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本发明实施例公开了图像处理方法、装置及服务器,包括下述步骤:获取待处理的人脸图像;将所述人脸图像输入到构建有损失函数的卷积神经网络模型中,所述损失函数根据预设期望指向性的筛选增大图像分类后的类间距离;获取所述卷积神经网络模型输出的分类数据,并根据所述分类数据对所述人脸图像进行内容理解。通过在卷积神经网络模型上构建新的损失函数,该损失函数具有晒选增大图像分类后类间距的作用,通过该损失函数训练得到的卷积神经网络模型,输出的分类数据的类间距离增大,使图像识别过程中类间距离增大,图像之间差别的显著性明显提高,致使图像比对时准确性明显的提高,应用该图像处理方法的安全性也得到了有效地保障。
-
公开(公告)号:CN110222649B
公开(公告)日:2020-12-18
申请号:CN201910497450.9
申请日:2019-06-10
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/00
Abstract: 本公开关于一种视频分类方法、装置、电子设备和存储介质。所述方法包括:对待分类视频内的多帧第一视频图像进行预测,得到每帧第一视频图像的预测标签和预测标签的出现概率,从而确定第一标签集合中的每种第一标签的出现次数和出现概率对应的预测准确率;根据每种第一标签的出现次数、出现概率和出现概率对应的预测准确率,确定待分类视频的特征向量;根据待分类视频的特征向量,确定待分类视频的分类标签。不仅使用了预测标签的出现次数、预测标签的出现概率,还结合了出现概率的准确率来进行视频分类,分类的粒度更细,分类的结果更加准确。
-
公开(公告)号:CN112000821A
公开(公告)日:2020-11-27
申请号:CN202010848523.7
申请日:2020-08-21
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/435 , G06F16/438 , G06F16/44 , G06K9/62
Abstract: 本公开关于一种多媒体信息推送方法、装置、服务器及存储介质,该方法包括:获取与待推送账户对应的候选多媒体信息;通过目标排序模型,得到各个候选多媒体信息的排序标签;目标排序模型根据从至少两个信息排序模型中选取的树模型融合得到,用于输出多媒体信息的排序标签;按照排序标签,将各个候选多媒体信息进行排序,得到排序后的候选多媒体信息;将排序后的候选多媒体信息推送至待推送账户。采用本方法,由于对候选多媒体信息进行排序的目标排序模型是从至少两个信息排序模型中选取的树模型融合得到的,其模型结构不会出现冗余,从而使得目标排序模型的整体运行效率较高,进而提高了多媒体信息的推送效率。
-
公开(公告)号:CN109522424B
公开(公告)日:2020-04-24
申请号:CN201811204512.4
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请提供了一种数据的处理方法、装置、电子设备及存储介质,包括:通过标签分类模型包括的已有标签对第一样本集中的样本进行标签标注,得到第二样本集,获取第二样本集中的未标注已有标签的目标样本;获取针对目标样本设置的描述信息;将描述信息与标签库包括的标签进行相似度计算,确定与描述信息的相似度最高的标签为新标签;通过新标签对第二样本集中的目标样本进行标注,得到包括目标样本以及目标样本对应的新标签的第三样本集。本申请通过将未标注已有标签的目标样本对应的描述信息与标签库包括的标签进行相似度计算,确定相似度最高的新标签对目标样本进行二次标注,完善了标签分类体系,提高了对多媒体样本的分类精度。
-
公开(公告)号:CN109543714B
公开(公告)日:2020-03-27
申请号:CN201811204515.8
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种数据特征的获取方法、装置、电子设备及存储介质,包括:获取包括图像信息和文本信息的多媒体样本;分别提取图像信息的第一图像特征以及文本信息的第一文本特征;将第一图像特征和第一文本特征导入注意力机制模型,输出基于第一图像特征的注意力的第二文本特征,和/或基于第一文本特征的注意力的第二图像特征。本申请基于注意力机制,捕捉第一图像特征和第一文本特征之间的关联性,并得到应用了注意力机制的第二文本特征和/或第二图像特征,使得第二文本特征和第二图像特征包括了图像信息和文本信息之间的关联性,本申请获取的应用了注意力机制的特征是基于一个端到端的注意力机制模型实现的,减少了应用场景对多模型的依赖。
-
公开(公告)号:CN110807486A
公开(公告)日:2020-02-18
申请号:CN201911052428.X
申请日:2019-10-31
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种类别标签的生成方法、装置、电子设备及存储介质,属于计算机技术领域。方法包括:基于目标数量,从备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签,基于预设数量,从备选图像集合中选取参考图像组,根据为参考图像组中每个参考图像标注的类别标签,获取第一准确率,根据第一准确率,对目标数量进行调整,基于调整后的目标数量,继续从其他的备选图像集合中选取目标图像组,为目标图像组中的每个目标图像生成第一类别标签。该方法自动为目标图像生成第一类别标签,不需要进行人工标注,降低了成本,提高了生成效率。并且,通过调整目标数量,从备选图像集合中选取目标图像,提高了准确率。
-
公开(公告)号:CN109389162B
公开(公告)日:2019-11-19
申请号:CN201811142163.8
申请日:2018-09-28
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种样本图像筛选方法和装置、电子设备及存储介质,其中所述方法包括:采用图像分类器分别对待筛选的各样本图像进行预测,得到所述各样本图像对应的特征向量和分类标签;对所述各样本图像对应的特征向量进行聚类,分别确定所述各样本图像所属的聚类中心;依据各所述样本图像对应的聚类中心和分类标签,对各聚类中心进行合并;依据合并结果筛选出目标样本图像。通过本公开的样本图像筛选方法,能够及时、准确地对“新”数据进行筛选无需人工手动干预,能够节省人力资源,通过筛选出的“新”数据可以进一步生成“新”标签。
-
公开(公告)号:CN108763325B
公开(公告)日:2019-10-01
申请号:CN201810421395.0
申请日:2018-05-04
Applicant: 北京达佳互联信息技术有限公司
Inventor: 张志伟
IPC: G06F16/783 , G06K9/62
Abstract: 本发明提供了一种网络对象处理方法及装置,属于计算机技术领域。本发明实施例中,可以先从目标对象中提取至少两种模态信息,然后计算每种模态信息对应的特征向量,并将每种模态信息对应的特征向量融合,得到融合特征向量,最后基于融合特征向量,对目标对象进行分类。由于融合特征向量能够代表每种模态信息对应的特征,因此,本发明实施例中,终端可以在基于目标对象的所有信息特征对目标对象进行分类的同时,简化了分类过程,降低了分类成本。
-
-
-
-
-
-
-
-
-