-
公开(公告)号:CN109522424B
公开(公告)日:2020-04-24
申请号:CN201811204512.4
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请提供了一种数据的处理方法、装置、电子设备及存储介质,包括:通过标签分类模型包括的已有标签对第一样本集中的样本进行标签标注,得到第二样本集,获取第二样本集中的未标注已有标签的目标样本;获取针对目标样本设置的描述信息;将描述信息与标签库包括的标签进行相似度计算,确定与描述信息的相似度最高的标签为新标签;通过新标签对第二样本集中的目标样本进行标注,得到包括目标样本以及目标样本对应的新标签的第三样本集。本申请通过将未标注已有标签的目标样本对应的描述信息与标签库包括的标签进行相似度计算,确定相似度最高的新标签对目标样本进行二次标注,完善了标签分类体系,提高了对多媒体样本的分类精度。
-
公开(公告)号:CN109657710A
公开(公告)日:2019-04-19
申请号:CN201811489982.X
申请日:2018-12-06
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种数据筛选方法、装置、服务器及存储介质,属于互联网领域。该方法包括:采用分类模型对多个原始数据进行分类,得到每个原始数据的分类结果;基于分词工具和词向量模型,获取各个类别标签的第一词向量和每个原始数据中文本信息的第二词向量;基于所述各个类别标签的第一词向量和每个原始数据中文本信息的第二词向量,从所述多个原始数据中,确定目标数据。通过引入分词工具和词向量模型,使得原始数据中的文本信息能够以计算机可处理的向量形式表示,降低了人工标注带来的成本,增大了海量的原始数据的利用率。
-
公开(公告)号:CN110798726A
公开(公告)日:2020-02-14
申请号:CN201911002043.2
申请日:2019-10-21
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N21/431 , H04N21/44 , H04N21/8547 , H04N21/2187 , H04N21/435
Abstract: 本公开示出了一种弹幕显示方法、装置、电子设备及存储介质,首先对目标视频进行抽帧,对所抽帧画面中的人体指定部位进行检测,生成人体指定部位检测框,然后根据人体关键部位、人体指定部位检测框以及人体指定部位检测框在所属画面中所占的比例,确定各帧画面的蒙版区域,当接收到视频播放请求时,将目标视频、蒙版区域以及弹幕内容发送给客户端播放器,以使客户端播放器在播放目标视频时,按照蒙版区域显示弹幕内容。本公开根据人体指定部位检测框在所属画面中的占比对蒙版区域进行自适应调整,从而对画面中人体不同区域进行自适应防挡,在人体为主题的视频场景中,本方案可以动态平衡视频内容以及弹幕内容的展示,提供更好的观看体验。
-
公开(公告)号:CN109522424A
公开(公告)日:2019-03-26
申请号:CN201811204512.4
申请日:2018-10-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本申请提供了一种数据的处理方法、装置、电子设备及存储介质,包括:通过标签分类模型包括的已有标签对第一样本集中的样本进行标签标注,得到第二样本集,获取第二样本集中的未标注已有标签的目标样本;获取针对目标样本设置的描述信息;将描述信息与标签库包括的标签进行相似度计算,确定与描述信息的相似度最高的标签为新标签;通过新标签对第二样本集中的目标样本进行标注,得到包括目标样本以及目标样本对应的新标签的第三样本集。本申请通过将未标注已有标签的目标样本对应的描述信息与标签库包括的标签进行相似度计算,确定相似度最高的新标签对目标样本进行二次标注,完善了标签分类体系,提高了对多媒体样本的分类精度。
-
公开(公告)号:CN109657710B
公开(公告)日:2022-01-21
申请号:CN201811489982.X
申请日:2018-12-06
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开是关于一种数据筛选方法、装置、服务器及存储介质,属于互联网领域。该方法包括:采用分类模型对多个原始数据进行分类,得到每个原始数据的分类结果;基于分词工具和词向量模型,获取各个类别标签的第一词向量和每个原始数据中文本信息的第二词向量;基于所述各个类别标签的第一词向量和每个原始数据中文本信息的第二词向量,从所述多个原始数据中,确定目标数据。通过引入分词工具和词向量模型,使得原始数据中的文本信息能够以计算机可处理的向量形式表示,降低了人工标注带来的成本,增大了海量的原始数据的利用率。
-
公开(公告)号:CN110135505B
公开(公告)日:2021-09-17
申请号:CN201910418617.8
申请日:2019-05-20
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于一种图像分类方法、装置、计算机设备及计算机可读存储介质。通过将待分类图像属于各个类别的概率值与概率阈值进行比较,当该概率值小于概率阈值时,将待分类图像的图像特征与多个类别特征进行匹配,确定与该图像特征匹配成功的类别特征,由于类别特征可以用于表示一个类别的图像应具有的特征,因此,可以将所确定的类别特征对应的类别作为该图像所属的类别,在保证分类结果准确率的同时,提高了图像分类任务中的召回率,使得图像分类任务中被正确分类的图像数量大幅增多。
-
公开(公告)号:CN111553378A
公开(公告)日:2020-08-18
申请号:CN202010182989.8
申请日:2020-03-16
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种用于图像分类的图像分类模型训练方法、装置、电子设备及计算机可读存储介质,涉及人工智能技术领域。其中,在进行图像分类模型训练时,通过构造的包含有图像语义特征损失函数的联合损失函数对图像分类模型的模型参数进行调整、优化,以提高图像分类模型的图像分类精度。
-
公开(公告)号:CN110135505A
公开(公告)日:2019-08-16
申请号:CN201910418617.8
申请日:2019-05-20
Applicant: 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于一种图像分类方法、装置、计算机设备及计算机可读存储介质。通过将待分类图像属于各个类别的概率值与概率阈值进行比较,当该概率值小于概率阈值时,将待分类图像的图像特征与多个类别特征进行匹配,确定与该图像特征匹配成功的类别特征,由于类别特征可以用于表示一个类别的图像应具有的特征,因此,可以将所确定的类别特征对应的类别作为该图像所属的类别,在保证分类结果准确率的同时,提高了图像分类任务中的召回率,使得图像分类任务中被正确分类的图像数量大幅增多。
-
公开(公告)号:CN111046232B
公开(公告)日:2024-06-14
申请号:CN201911206100.9
申请日:2019-11-30
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06F16/75 , G06N3/0464 , G06N3/08
Abstract: 本公开关于一种视频分类方法、装置、电子设备以及存储介质,用以至少解决相关技术中视频分类方法无法兼顾分类准确度以及分类速度的问题,方法包括:使用预先训练得到的基于卷积神经网络的特征提取模型对待分类视频数据进行多帧特征提取,以得到所述待分类视频数据的多帧视频特征集;根据所述多帧视频特征集,确定所述待分类视频数据的稳定性指标,其中,所述待分类视频数据的稳定性指标用于表征所述待分类视频数据中连续两帧视频帧所对应画面的变化程度;根据所述待分类视频的稳定性指标,确定与所述待分类视频数据对应的预先训练好的分类模型,并利用所述分类模型对所述待分类视频数据进行分类。
-
公开(公告)号:CN111553378B
公开(公告)日:2024-02-20
申请号:CN202010182989.8
申请日:2020-03-16
Applicant: 北京达佳互联信息技术有限公司
IPC: G06V10/774 , G06V10/82 , G06N3/0464
Abstract: 本公开关于一种用于图像分类的图像分类模型训练方法、装置、电子设备及计算机可读存储介质,涉及人工智能技术领域。其中,在进行图像分类模型训练时,通过构造的包含有图像语义特征损失函数的联合损失函数对图像分类模型的模型参数进行调整、优化,以提高图像分类模型的图像分类精度。
-
-
-
-
-
-
-
-
-