-
公开(公告)号:CN109543714B
公开(公告)日:2020-03-27
申请号:CN201811204515.8
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种数据特征的获取方法、装置、电子设备及存储介质,包括:获取包括图像信息和文本信息的多媒体样本;分别提取图像信息的第一图像特征以及文本信息的第一文本特征;将第一图像特征和第一文本特征导入注意力机制模型,输出基于第一图像特征的注意力的第二文本特征,和/或基于第一文本特征的注意力的第二图像特征。本申请基于注意力机制,捕捉第一图像特征和第一文本特征之间的关联性,并得到应用了注意力机制的第二文本特征和/或第二图像特征,使得第二文本特征和第二图像特征包括了图像信息和文本信息之间的关联性,本申请获取的应用了注意力机制的特征是基于一个端到端的注意力机制模型实现的,减少了应用场景对多模型的依赖。
-
公开(公告)号:CN109145937A
公开(公告)日:2019-01-04
申请号:CN201810664585.5
申请日:2018-06-25
Applicant: 北京达佳互联信息技术有限公司
CPC classification number: G06K9/6267 , G06K9/6218 , G06K9/6256 , G06N3/0454
Abstract: 本发明实施例提供了一种模型训练的方法及装置,其中所述方法包括:获取指定分类类别中的待训练的样本数据;对所述待训练的样本数据进行特征提取,获得所述指定分类类别对应的特征信息;对所述指定分类类别对应的特征信息进行聚类,得到多个聚类标签;对所述聚类标签对应的样本数据进行数据均衡处理;将数据均衡处理后的样本数据作为目标样本数据;采用所述目标样本数据,训练指定模型。本发明可以通过上述无监督的方法细化已有分类类别内的标签,实现类别内的样本均衡,为模型提供均衡的样本数据,根据该均衡的样本数据进行模型训练可以得到优化的模型,采用该优化的模型进行数据预测可以得到更准确的预测结果,提高模型预测的准确率。
-
公开(公告)号:CN113902835B
公开(公告)日:2025-05-23
申请号:CN202111342784.2
申请日:2021-11-12
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F17/00 , G06T11/60 , G06F3/0484 , G06F16/435
Abstract: 本公开关于图像处理方法、装置、电子设备和存储介质,属于互联网技术领域,该方法包括:在客户端获取并展示第一模板的图像处理步骤信息,修改图像处理步骤信息,基于修改后的图像处理步骤信息处理当前图像,得有修饰效果的图像。这样,通过模板的图像处理步骤信息的方式向用户推荐模板,利于降低图像处理软件中图像处理功能的挑选难度和使用难度,也利于提升用户粘度。
-
公开(公告)号:CN111538859B
公开(公告)日:2023-10-10
申请号:CN202010329061.8
申请日:2020-04-23
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/73 , G06F16/75 , G06F16/78 , G06F18/214
Abstract: 本发明提供一种动态更新视频标签的方法、装置及电子设备,该方法包括:接收平台账户上传的待标注视频数据,从平台账户之前上传的视频数据中,获取标签视频数据集合外的缓冲视频数据,标签视频数据集合包括至少一个标注视频标签的标签视频数据;采用分类算法对待标注视频数据及缓冲视频数据进行分类,根据分类结果确定触发视频标签更新时,确定各分类相对标签视频数据集合的变化率;确定变化率大于设定阈值的分类对应的新视频标签,利用新视频标签更新标注的视频标签,利用该分类中的视频数据更新标签视频数据。本发明提供的动态更新视频标签的方法、装置及电子设备,解决了现有确定视频标签的方法对平台账户的代表性数据感知和更新不及时的问题。
-
公开(公告)号:CN110543862B
公开(公告)日:2022-04-22
申请号:CN201910839264.9
申请日:2019-09-05
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种数据获取方法、装置及存储介质,属于计算机技术领域。该方法包括:根据网络模型的识别对象,获取多个第一用户标识;对多个第一用户标识对应的原始数据进行聚类,得到每个原始数据的聚类标识;对于每个第一用户标识,根据第一用户标识对应的每个原始数据的聚类标识,确定第一用户标识的权重;从多个第一用户标识中选取至少一个第二用户标识,获取至少一个第二用户标识对应的原始数据,作为待标注的目标数据。第二用户标识对应的原始数据中不属于识别对象的目标数据较少,提高了待标注的目标数据的纯度,提高了技术人员筛选目标数据的速度,进而提高了标注效率。
-
公开(公告)号:CN110543862A
公开(公告)日:2019-12-06
申请号:CN201910839264.9
申请日:2019-09-05
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开是关于一种数据获取方法、装置及存储介质,属于计算机技术领域。该方法包括:根据网络模型的识别对象,获取多个第一用户标识;对多个第一用户标识对应的原始数据进行聚类,得到每个原始数据的聚类标识;对于每个第一用户标识,根据第一用户标识对应的每个原始数据的聚类标识,确定第一用户标识的权重;从多个第一用户标识中选取至少一个第二用户标识,获取至少一个第二用户标识对应的原始数据,作为待标注的目标数据。第二用户标识对应的原始数据中不属于识别对象的目标数据较少,提高了待标注的目标数据的纯度,提高了技术人员筛选目标数据的速度,进而提高了标注效率。
-
公开(公告)号:CN111581481B
公开(公告)日:2024-03-08
申请号:CN202010402130.3
申请日:2020-05-13
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/951
-
公开(公告)号:CN111046927B
公开(公告)日:2023-05-30
申请号:CN201911177127.X
申请日:2019-11-26
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F18/214 , G06F18/2413
-
公开(公告)号:CN114003739A
公开(公告)日:2022-02-01
申请号:CN202111275891.8
申请日:2021-10-29
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/45 , G06F16/432 , G06F16/438
Abstract: 本公开关于一种多媒体资源的处理方法及装置,解决了服务器依据搜索词进行搜索时,准确率较低的问题。具体方案包括:多媒体资源的处理装置获取搜索词,并根据搜索词,确定与搜索词关联的资源类型,且根据确定出的关联的资源类型的数量,分别获取与每个关联的资源类型对应且与搜索词匹配的多媒体资源。之后,多媒体资源的处理装置将获取的多媒体资源作为搜索词的搜索结果进行展示。
-
公开(公告)号:CN109409414A
公开(公告)日:2019-03-01
申请号:CN201811142162.3
申请日:2018-09-28
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种样本图像确定方法和装置、电子设备及存储介质,其中所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。本公开提供的样本图像确定能够准确、快速的从多个样本图像中提取从困难样本图像,并且无需人工手动干预,能够节省人力资源。
-
-
-
-
-
-
-
-
-