-
公开(公告)号:CN113656373A
公开(公告)日:2021-11-16
申请号:CN202110937110.0
申请日:2021-08-16
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种构建检索数据库的方法、装置、设备以及存储介质,涉及人工智能技术领域,具体为智能推荐和深度学习技术领域。该方法包括:获取数据集,将数据集分为第一数据集和第二数据集;对第一数据集中的数据进行聚类,得到至少一个一级聚类中心;基于一级聚类中心对第一数据集中的数据进行聚类,得到对应的至少一个二级聚类中心;基于第一数据集中的数据与一级聚类中心以及二级聚类中心的残差,得到第一数据集对应的码本;基于第一数据集对应的码本对第二数据集进行训练,得到数据集对应的码本。本公开的构建检索数据库的方法,减少了检索数据库的占用内存,提高了检索召回率,提高了建库的速度。
-
公开(公告)号:CN113449155B
公开(公告)日:2024-02-27
申请号:CN202110807062.3
申请日:2021-07-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/901 , G06F16/908
Abstract: 本公开公开了用于特征表示处理的方法、装置、设备和介质,涉及计算机技术领域,尤其涉及大数据领域。具体实现方案为:获取索引对象,索引对象至少包括两个块目录对象;从索引对象获取当前使用的第一块目录对象,第一块目录对象包括块对象指针的序列,块对象指针指向块对象,块对象包括特征表示的序列;基于第一块目录对象中的块对象指针的序列,获取最新的第一块对象,指向第一块对象的块对象指针在块对象指针的序列中是最新的;以及如果确定第一块对象中的特征表示的当前数量小于第一块对象中的特征表示的最大可容纳数量,则在第一块对象所包括的特征表示的序列中添加待添加的特征表示。由此,能够降低内存开销并提高效率。
-
公开(公告)号:CN113449155A
公开(公告)日:2021-09-28
申请号:CN202110807062.3
申请日:2021-07-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/901 , G06F16/908
Abstract: 本公开公开了用于特征表示处理的方法、装置、设备、介质和程序产品,涉及计算机技术领域,尤其涉及大数据领域。具体实现方案为:获取索引对象,索引对象至少包括两个块目录对象;从索引对象获取当前使用的第一块目录对象,第一块目录对象包括块对象指针的序列,块对象指针指向块对象,块对象包括特征表示的序列;基于第一块目录对象中的块对象指针的序列,获取最新的第一块对象,指向第一块对象的块对象指针在块对象指针的序列中是最新的;以及如果确定第一块对象中的特征表示的当前数量小于第一块对象中的特征表示的最大可容纳数量,则在第一块对象所包括的特征表示的序列中添加待添加的特征表示。由此,能够降低内存开销并提高效率。
-
-