计算机通信网络上基于属性的可视化搜索的系统和方法

    公开(公告)号:CN112567361B

    公开(公告)日:2025-01-28

    申请号:CN201980034238.7

    申请日:2019-05-06

    Abstract: 一种视觉搜索系统包括计算设备,该计算设备包括:图像处理引擎,用于生成表示图像输入中的用户所选择对象的特征矢量;对象检测引擎,用于在图像输入中定位一个或多个对象并且用于从图像输入中的对象确定用户所选择对象的类别,对象检测引擎使用类别生成针对用户所选择对象的多个属性;用于存储多个表的产品数据存储,多个表存储与用户所选择对象的类别相关联的一个或多个属性;属性生成引擎,用于为用户所选择对象的每个属性生成多个属性选项;以及属性匹配引擎,用于比较用户所选择对象的属性和属性选项以及视觉上相似的产品和图像的属性和属性选项。

    生成和应用针对图像的对象级关系索引

    公开(公告)号:CN113939813B

    公开(公告)日:2024-10-29

    申请号:CN202080036848.3

    申请日:2020-03-27

    Abstract: 本文描述了一种计算机实现的技术,用于使用机器训练模型来标识图像内的个体对象。该技术然后针对所标识的对象创建关系索引。即,关系索引中的每个索引条目与给定对象相关联,并且每个索引条目包括与给定对象有关的属性集合。一个这样的属性标识与给定对象相关联的至少一个潜在语义向量。每个属性提供一种将给定对象链接到关系索引中的一个或多个其他对象的方法。在该技术的一个应用中,用户可以提交指定查询对象的查询。该技术查阅关系索引以查找与查询对象相关的一个或多个对象。在某些情况下,查询对象和每个其他对象具有互补关系。

    生成和应用针对图像的对象级关系索引

    公开(公告)号:CN113939813A

    公开(公告)日:2022-01-14

    申请号:CN202080036848.3

    申请日:2020-03-27

    Abstract: 本文描述了一种计算机实现的技术,用于使用机器训练模型来标识图像内的个体对象。该技术然后针对所标识的对象创建关系索引。即,关系索引中的每个索引条目与给定对象相关联,并且每个索引条目包括与给定对象有关的属性集合。一个这样的属性标识与给定对象相关联的至少一个潜在语义向量。每个属性提供一种将给定对象链接到关系索引中的一个或多个其他对象的方法。在该技术的一个应用中,用户可以提交指定查询对象的查询。该技术查阅关系索引以查找与查询对象相关的一个或多个对象。在某些情况下,查询对象和每个其他对象具有互补关系。

    用于可视搜索的可视意图触发

    公开(公告)号:CN112673369A

    公开(公告)日:2021-04-16

    申请号:CN201980047024.3

    申请日:2019-06-18

    Abstract: 代表性实施例公开了用于对图像执行可视意图分类或者可视意图检测或者两者的机制。可视意图分类利用根据分类分类法来对所述图像中的对象进行分类的训练过的机器学习模型。可视意图分类可以被用作用于发起进一步动作的预触发机制以大大节省处理时间。示例进一步动作包括用户场景、查询定制、用户体验增强等。可视意图检测利用训练过的机器学习模型来标识图像中的对象,在所述图像周围放置边界框,并且根据所述分类法来对所述对象进行分类。所述训练过的机器学习模型利用多个特征检测器、多层预测、多标签分类器和边界框回归。

    计算机通信网络上基于属性的可视化搜索的系统和方法

    公开(公告)号:CN112567361A

    公开(公告)日:2021-03-26

    申请号:CN201980034238.7

    申请日:2019-05-06

    Abstract: 一种视觉搜索系统包括计算设备,该计算设备包括:图像处理引擎,用于生成表示图像输入中的用户所选择对象的特征矢量;对象检测引擎,用于在图像输入中定位一个或多个对象并且用于从图像输入中的对象确定用户所选择对象的类别,对象检测引擎使用类别生成针对用户所选择对象的多个属性;用于存储多个表的产品数据存储,多个表存储与用户所选择对象的类别相关联的一个或多个属性;属性生成引擎,用于为用户所选择对象的每个属性生成多个属性选项;以及属性匹配引擎,用于比较用户所选择对象的属性和属性选项以及视觉上相似的产品和图像的属性和属性选项。

    用于可视搜索的可视意图触发

    公开(公告)号:CN112673369B

    公开(公告)日:2024-09-06

    申请号:CN201980047024.3

    申请日:2019-06-18

    Abstract: 代表性实施例公开了用于对图像执行可视意图分类或者可视意图检测或者两者的机制。可视意图分类利用根据分类分类法来对所述图像中的对象进行分类的训练过的机器学习模型。可视意图分类可以被用作用于发起进一步动作的预触发机制以大大节省处理时间。示例进一步动作包括用户场景、查询定制、用户体验增强等。可视意图检测利用训练过的机器学习模型来标识图像中的对象,在所述图像周围放置边界框,并且根据所述分类法来对所述对象进行分类。所述训练过的机器学习模型利用多个特征检测器、多层预测、多标签分类器和边界框回归。

    将音频内容变换为图像
    9.
    发明授权

    公开(公告)号:CN112840398B

    公开(公告)日:2024-07-19

    申请号:CN201980068378.6

    申请日:2019-09-05

    Abstract: 本文描述了用于将音频内容变换为图像的技术。该技术可以包括:从源接收音频内容;将音频内容转换为音频特征时间流;以及使用经机器训练的一个或多个模型,将音频特征流转换为一个或多个图像。该技术基于对如下各项的识别来生成(多个)图像:传达与音频内容相关联的一个或多个语义主题的语义信息;以及传达与音频内容相关联的一个或多个情感的情感信息。该技术然后生成包括(多个)图像的输出表示,其将输出表示提供给一个或多个显示设备以用于在那里显示。输出表示用作音频内容的显著语义以及情感相关特性的概要。

    使用机器训练词条频率加权因子的产生密集嵌入向量的编码器

    公开(公告)号:CN113661487A

    公开(公告)日:2021-11-16

    申请号:CN202080024993.X

    申请日:2020-02-03

    Abstract: 本文中描述了一种用于生成提供输入文本的分布表示的密集嵌入向量的计算机实现的技术。在一种实现中,该技术包括:生成维度为g的输入词条频率(TF)向量,该输入TF向量包括与输入文本的实例中的词条的出现频率相关的频率信息;使用TF修改通过相应机器训练加权因子来修改输入TF向量中的词条特定频率信息,以产生维度为g的中间向量;使用投影组件将维度为g的中间向量投影到维度为k的嵌入向量中,其中k小于g。TF修改组件和投影组件都可以使用相应机器训练神经网络。应用组件可以基于嵌入向量来执行基于取回的功能、基于识别的功能、基于推荐的功能、基于分类的功能等中的任何功能。

Patent Agency Ranking