一种百亿级图像快速搜索的方法

    公开(公告)号:CN114595350B

    公开(公告)日:2024-04-26

    申请号:CN202111489763.3

    申请日:2021-12-08

    Inventor: 程涛 刘春平 肖锋

    Abstract: 本发明涉及计算机软件技术领域,涉及信息搜索技术领域,具体涉及一种百亿级图像快速搜索的方法。包括:图像样本数据的处理,利用深度神经网络对百亿级图像样本数据进行图像特征提取,经PCA降维后,形成了图像的特征向量库;利用Faiss框架下的IVPQ算法构建至少两级PQ组,每一级PQ组至少包含3个PQ,保证特征向量的切分数量两两互质,从而形成特征向量索引库;基于该特征像向量引库,可以在检索时获得最优候选集并对最优候选集进行相似度计算和排序,最后输出最终的排序TOPN。本发明比FAISS有更高的准确性,在单服务器运行中,Top10的召回率达61.8%,运行稳定性更好,支撑220真实并发,吞吐率高达10000次且平均响应时间在30ms,检索效率更高。

    段句位的倒排索引结构设计及其限定运算全文检索的方法

    公开(公告)号:CN116578666A

    公开(公告)日:2023-08-11

    申请号:CN202310847909.X

    申请日:2023-07-12

    Abstract: 本发明提出了一种段句位的倒排索引结构设计及其限定运算全文检索的方法,具体的,设计了一种支持段句位的倒排索引结构包括:词典和与所述词典中的词对应的倒排索引列表;所述倒排索引列表包括:待索引文件ID为DocID、词频TF、位置POS、句子SEN、段落SEG。同时,本发明提出了一种段句位限定运算全文检索的方法,在倒排索引列表中存储索引词的位置(POS)、句子(SEN)、段落(SEG)等信息,通过对关键词的位置关系进行设定,在所述倒排索引列表中对位置属性校验,实现文档过滤,返回给用户满足段句位要求的文档。实现用户对段、句、字距离等高级查询需求,同时对查询语句进行相关度评分,使全文检索过程更加完善。

    文本事件信息提取方法、电子装置和非易失性存储介质

    公开(公告)号:CN110321432A

    公开(公告)日:2019-10-11

    申请号:CN201910548427.8

    申请日:2019-06-24

    Abstract: 本发明属于信息处理技术领域,为了解决现有技术中事件信息提取的技术方案存在准确率不高的技术问题,本发明提供一种本发明第一方面提供一种文本事件信息提取方法,该方法包括:对文本进行分词划分,并将分词做向量转换后得到词向量,以及将词向量输入至神经网路模型,输出实体;基于文本格式特征定义的信息类型,按照文法定义的对应模式规则,将文本块中的分词和实体按照文法定义的对应模式规则,整理成结构化后的文本块;对结构化后的文本块进行事件信息提取处理,使用文法定义的对应模式规则实现关键字抽取,并把关键字输出到结果模板中。因此,利用神经网络深度学习与规则相结合的方式,配置事件提取模型,实现文本事件信息的准确提取。

    关系数据库增量迁移处理方法、关系数据库中数据保存方法

    公开(公告)号:CN110309126A

    公开(公告)日:2019-10-08

    申请号:CN201910591554.6

    申请日:2019-07-02

    Abstract: 为了解决通过时间戳方式进行关系数据增量迁移过程中,存在数据丢失的技术问题,本发明提供一种关系数据库增量迁移处理方法、关系数据库中数据保存方法、电子装置和非易失性存储介质;所述关系数据库增量迁移处理方法中,基于时间偏移量Tx,调整关系数据库增量迁移处理中上次执行的时间戳为T’n-1=Tn-1-Tx,并将所述数据库迁移时间戳字段范围Tr设置为[T’n-1,Tn],对所述关系数据库中需要完成增量迁移操作、且时间戳在Tr范围内的每个迁移数据执行迁移操作。因此,即使关系数据库对应服务器的时间与数据迁移对应服务器的时间不一致,也不影响数据的准确性。

    视频关键位置定位方法及装置

    公开(公告)号:CN107222746B

    公开(公告)日:2019-06-18

    申请号:CN201710271432.X

    申请日:2017-04-24

    Abstract: 本发明的实施例提供了一种视频关键位置定位方法及装置。所述视频关键位置定位方法包括:获取视频帧序列中各相邻视频帧之间的帧差;获取视频帧序列中设定范围内的帧差的第一帧差极大值;如果第一帧差极大值位于设定范围内的第一区域范围内,则将第一帧差极大值的位置确定为视频帧序列的当前关键位置,其中,设定范围包括第一区域范围和第二区域范围,第一区域范围的长度大于第二区域范围的长度。采用本发明实施例的技术方案,可以有效地实现视频关键位置的定位,并且避免误差传递,具有较高的鲁棒性。

    知识数据提供方法、装置、电子设备和存储介质

    公开(公告)号:CN109739964A

    公开(公告)日:2019-05-10

    申请号:CN201811613073.2

    申请日:2018-12-27

    Abstract: 本公开实施例提供一种知识数据提供方法、装置、电子设备和存储介质。知识数据提供方法包括:获取查询请求语句;对查询请求语句进行分词处理,获取至少一个查询词;从扩展词典分别获取与各个查询词对应的扩展关键词;将获取到的各个所述查询词或其对应的扩展关键词的组合分别与多个语义匹配表达式进行匹配,获取查询意图的信息;从知识库获取与所述查询意图对应的知识数据;提供所述知识数据。能够对以自然语言的方式提出的查询请求进行理解、分析,通过构建的语义理解框架对从查询请求提取的关键信息进行需求匹配,并且根据匹配得到的查询意图,提供知识库中的相应知识数据,从而能够为查询用户提供准确地匹配到其查询意图的知识数据。

Patent Agency Ranking