数据筛选方法、装置、服务器及存储介质

    公开(公告)号:CN109598307B

    公开(公告)日:2020-11-27

    申请号:CN201811489992.3

    申请日:2018-12-06

    Abstract: 本公开是关于一种数据筛选方法、装置、服务器及存储介质,属于互联网领域。该方法包括:采用至少一个分类模型对多个原始数据进行分类,得到每个原始数据的分类结果;基于每个原始数据的分类结果对该多个原始数据进行筛选,得到多个第一数据;根据该多个第一数据的类别标签,对该多个第一数据进行筛选,得到至少一个第二数据。本公开通过预设条件的预测概率筛选出第一数据,再根据类别标签筛选出第二数据,降低了人工标注带来的成本,避免了因人力资源有限所导致的对原始数据的利用率的限制,增大了海量的原始数据的利用率。

    图像筛选方法、装置、计算机设备及存储介质

    公开(公告)号:CN110147851B

    公开(公告)日:2022-04-01

    申请号:CN201910457186.6

    申请日:2019-05-29

    Abstract: 本公开关于一种图像筛选方法、装置、计算机设备及存储介质,属于机器学习技术领域。本公开能够从用户点击行为层面对多个第一图像进行初步筛选,由于用户点击行为通常与人眼视觉的特征具有相关性,因此筛选得到的第二图像可以表示人眼视觉层面的筛选结果,进一步地,从计算机视觉层面对多个第二图像进行进一步筛选,不增加人力成本的基础上大大提升了机器在进行图像筛选的智能性,增加了筛选出的第三图像的种类,丰富了第三图像的多样性。

    多媒体资源的标签确定方法、装置、电子设备及存储介质

    公开(公告)号:CN110781323A

    公开(公告)日:2020-02-11

    申请号:CN201911022889.2

    申请日:2019-10-25

    Inventor: 张志伟 李铅 闫瑞

    Abstract: 本公开关于一种多媒体资源的标签确定方法、装置、电子设备及存储介质,涉及计算机技术领域,所述方法包括获取目标多媒体资源和目标多媒体资源的描述信息,确定描述信息对应的第一数量的信息词向量,并获取目标多媒体资源的第二数量的候选标签,确定第二数量个候选标签对应的第二数量的候选标签向量,确定每个信息词向量与每个候选标签向量之间的向量距离,得到第一数量乘第二数量个向量距离数值,从候选标签中,选择满足预设选取规则的向量距离数值对应的候选标签,将满足预设选取规则的向量距离数值对应的候选标签作为目标多媒体资源的分类标签。采用本公开,电子设备可以准确地选取分类标签,该分类标签可以准确体现目标多媒体资源的分类结果。

    数据筛选方法、装置、服务器及存储介质

    公开(公告)号:CN109598307A

    公开(公告)日:2019-04-09

    申请号:CN201811489992.3

    申请日:2018-12-06

    Abstract: 本公开是关于一种数据筛选方法、装置、服务器及存储介质,属于互联网领域。该方法包括:采用至少一个分类模型对多个原始数据进行分类,得到每个原始数据的分类结果;基于每个原始数据的分类结果对该多个原始数据进行筛选,得到多个第一数据;根据该多个第一数据的类别标签,对该多个第一数据进行筛选,得到至少一个第二数据。本公开通过预设条件的预测概率筛选出第一数据,再根据类别标签筛选出第二数据,降低了人工标注带来的成本,避免了因人力资源有限所导致的对原始数据的利用率的限制,增大了海量的原始数据的利用率。

    一种图像分类方法、装置、电子设备及存储介质

    公开(公告)号:CN111125422B

    公开(公告)日:2024-04-02

    申请号:CN201911284976.5

    申请日:2019-12-13

    Inventor: 张志伟 闫瑞 林靖

    Abstract: 本公开是关于一种图像分类方法、装置、电子设备及存储介质,涉及计算机技术领域,用以解决相关技术中图像分类技术准确度较低的问题,本公开方法包括:对待识别数据集中的图像进行分类,确定待识别数据集中图像的类别标签;提取各图像的文本特征以及各图像的类别标签的文本特征,其中图像的文本特征用于表示图像中对象的状态;根据各图像的文本特征以及相应图像的类别标签的文本特征,确定各图像与相应类别标签的匹配度;根据确定的匹配度,从同一类别标签对应的各图像中确定类别标签对应的目标图像。由于本公开实施例对图像分类后,进一步根据图像中对象的状态与图像的类别标签的匹配度,对同一类别标签的图像进一步筛选,提高了分类的准确度。

    一种数据处理方法、装置、设备及存储介质

    公开(公告)号:CN113987324A

    公开(公告)日:2022-01-28

    申请号:CN202111229055.6

    申请日:2021-10-21

    Abstract: 本公开关于一种数据处理方法、装置、系统、设备及存储介质,涉及计算机技术领域,可以提高数据处理的效率。该数据处理方法包括:接收数据请求方发送的特征数据获取请求;特征数据获取请求包括数据请求标识;响应于特征数据获取请求,调用预先配置好的配置文件,获取与数据请求标识对应的多个样本数据,并将多个样本数据转换成多个特征数据;多个样本数据包括搜索词和搜索结果;多个样本数据中的至少两个样本数据的数据类型不同;多个特征数据与多个样本数据一一对应;多个特征数据中的每个特征数据的数据类型相同;向数据请求方发送多个特征数据;多个特征数据用于训练生成用于预测用户搜索行为的行为预测模型。

    图像筛选方法、装置、计算机设备及存储介质

    公开(公告)号:CN110147851A

    公开(公告)日:2019-08-20

    申请号:CN201910457186.6

    申请日:2019-05-29

    Abstract: 本公开关于一种图像筛选方法、装置、计算机设备及存储介质,属于机器学习技术领域。本公开能够从用户点击行为层面对多个第一图像进行初步筛选,由于用户点击行为通常与人眼视觉的特征具有相关性,因此筛选得到的第二图像可以表示人眼视觉层面的筛选结果,进一步地,从计算机视觉层面对多个第二图像进行进一步筛选,不增加人力成本的基础上大大提升了机器在进行图像筛选的智能性,增加了筛选出的第三图像的种类,丰富了第三图像的多样性。

Patent Agency Ranking