基于哈希学习的图像数据快速检索方法

    公开(公告)号:CN110134803A

    公开(公告)日:2019-08-16

    申请号:CN201910415146.5

    申请日:2019-05-17

    Abstract: 基于哈希学习的图像数据快速检索方法,涉及图像数据快速检索方法,属于数据检索技术领域。为了解决现有模型在哈希码生成阶段使用多次松弛会使模型在训练阶段负反馈过程出现偏差的问题。本发明的深度哈希模型包含五个卷积-池化层、两个全连接层、特征层、哈希层和输出层;并基于三元组约束进行训练,得到训练好的深度哈希模型后,利用深度哈希模型建立样本库,样本库由图像样本及对应的哈希码构成;针对查询图像,利用训练好的深度哈希模型生成查询图像的哈希码;利用查询图像的哈希码与图像样本库进行检索。本发明适用于图像数据检索。

    一种关系数据库中基于主题类簇单元的关键词查询方法

    公开(公告)号:CN105975488B

    公开(公告)日:2019-06-18

    申请号:CN201610264735.4

    申请日:2016-04-25

    Abstract: 一种关系数据库中基于主题类簇单元的关键词查询方法,涉及信息检索领域,尤其涉及一种关系数据库中基于主题类簇单元的关键词查询方法。本发明要为解决现有关键词在线查询方法存在查询过程中频繁的表连接所带来巨大时间开销的问题,而现有关键词离线查询方法对于内部结构复杂、数据量庞大的大规模数据库上的查询存在查询效率低的问题。一种关系数据库中基于主题类簇单元的关键词查询方法按以下步骤进行:1、主题类簇单元构建过程;①、基于数据表特性和查询日志垂直分组;②、提出主题类簇中表连接顺序优化方案;③、基于主题类簇元组关联图水平分组;2、建立基于关联规则的索引优化机制;3、将查询结果返回给用户。本发明应用于信息检索领域。

    基于负载均衡和查询日志的数据空间多维索引方法

    公开(公告)号:CN106095951B

    公开(公告)日:2019-04-23

    申请号:CN201610422994.5

    申请日:2016-06-13

    Abstract: 基于负载均衡和查询日志的数据空间多维索引方法,涉及数据空间索引技术领域。旨在把倒排索引分布到不同的索引节点中,使得各个索引节点保持负载均衡,同时最小化查询处理涉及的通信开销和减少搜索空间。在垂直划分中,首先利用查询日志和实体中频繁出现的词,聚合索引token词,使用超图表示用户查询与倒排列表间的访问模式;在水平划分中,通过超图刻画用户查询与实体间的访问模式信息,把水平划分问题归约为超图划分问题,使得不同索引节点的负载保持均衡,并降低查询涉及的通信开销。结合垂直划分和水平划分策略,构建二维混合索引并扩展为三维索引。通过在公开数据集DBLP上进行实验表明本发明方法在吞吐量、查询响应时间及扩展性优于已有方法。

    基于力引导的点布局优化算法

    公开(公告)号:CN109005048A

    公开(公告)日:2018-12-14

    申请号:CN201810519647.3

    申请日:2018-05-28

    Abstract: 本发明属于可视化数据技术领域,公开了基于力引导的点布局优化算法,包括如下步骤:步骤(1):定义节点集合,边集合和无向图G;步骤(2):设置系统中吸引力的总大小,系统中排斥力的总大小和总量级函数;步骤(3):定义M(0);步骤(4):用算法聚集阶段迭代的总数和算法分裂阶段迭代的总数表示;步骤(5):计算吸引力和排斥力在X轴方向和Y轴方向上的分量;步骤(6):用笛卡尔坐标空间内X、Y轴方向上的排斥力和吸引力表示第t次迭代时节点在X、Y轴方向上受到的合力,然后获取节点迭代后的坐标;步骤(7):迭代次数等于一个固定值时,迭代停止,算法结束。本发明解决传统算法中迭代次数多的问题,具有更好的扩展性。

    一种基于知识图谱的关系预测方法

    公开(公告)号:CN108694469A

    公开(公告)日:2018-10-23

    申请号:CN201810589288.9

    申请日:2018-06-08

    CPC classification number: G06Q10/04

    Abstract: 本发明为一种基于知识图谱的关系预测方法,将知识图谱利用无向图来表示,提出了一种改进的结合了双向关系路径和嵌入式的混合关系预测算法,包括如下步骤:(1)将三元组数据集构建一个有效的知识图谱,并初始化参数;(2)对知识图谱中每个实体和关系利用TransE算法进行训练,将实体和关系嵌入到一个低维的向量空间中;(3)抽取出每个三元组的关系标签,构建每个关系的子图;(4)在每个关系子图上,通过迭代的方式发现每个实体之间的可达路径,并根据图结构划分子图,对每个可达路径的可靠性进行计算;(5)迭代每两个没有直接边连接的实体,通过构造的联合评价函数和损失函数来评估两个实体之间是否存在隐含关系;(6)补全知识图谱结构。

    一种基于斜率弹性相似性度量方法

    公开(公告)号:CN107871140A

    公开(公告)日:2018-04-03

    申请号:CN201711085758.X

    申请日:2017-11-07

    CPC classification number: G06K9/6215

    Abstract: 本发明提供的是一种基于斜率弹性相似性度量方法。步骤一:输入时间序列x和y及过滤参数λ,进行l1趋势过滤,输出折线X和Y;步骤二:计算折线X和Y各分段加权斜率,折线X和Y用加权斜率表示为kx和ky;设定等距间隔参数d,等距插入加权斜率;步骤三:经过插值处理后,形成两个新不等长序列,使用动态时间弯曲距离DTW计算不等长序列的趋势距离。本发明把时间序列通过滤波特征表示为折线段,保留了趋势信息并实现了降维;线段权重斜率可实现趋势的度量比较;通过等距插值以适应DTW等间隔计算,实现了弹性度量。

    一种用于大数据环境下可支持多格式特性的数据空间检索方法

    公开(公告)号:CN103902699A

    公开(公告)日:2014-07-02

    申请号:CN201410125840.0

    申请日:2014-03-31

    CPC classification number: G06F17/30336

    Abstract: 本发明涉及一种用于大数据环境下可支持多格式特性的数据空间检索方法。本发明包括:用户输入查询内容;判断用户查询类型;采用前缀扫描方式读取所建立的多级索引;进行链表合并操作;重写查询;遍历多级索引;将逆序压入栈中;首先弹出栈顶中两个元素;读取所建立的多级索引;根据索引链表右连接方案;弹出栈顶元素;输出满足条件的所有元素。本发明的方法由B-树索引和二级索引共同构成多级索引,能够解决主索引在大数据环境下,路径查询索引连接代价过大的问题。

    一种考虑深度学习模型健壮性的水下目标分类的方法

    公开(公告)号:CN114565831B

    公开(公告)日:2025-02-25

    申请号:CN202210202911.7

    申请日:2022-03-02

    Abstract: 一种考虑深度学习模型健壮性的水下目标分类的方法,本发明为了解决现有深度学习模型对水下目标分类准确率低的问题,它包括利用训练好的原始模型对采集的水下目标数据训练集进行预测得到所有分类正确样本的集合和所有分类错误样本的集合;将所有分类错误样本的集合输入训练好的原始模型内,对分类错误样本的特征进行聚类和特征补偿,得到分类错误样本的特征补偿;将特征补偿输入训练好的原始模型内得到特征补偿后的原始模型;将水下目标数据训练集输入特征补偿后的原始模型内,输出分类错误的样本;建立对抗训练模型,得到训练好的对抗训练模型;将对抗训练模型与特征补偿后的原始模型加权组合生成深度学习模型;属于水下目标分类领域。

    基于互信息增强的自监督新颖性检测方法

    公开(公告)号:CN113592016B

    公开(公告)日:2023-12-01

    申请号:CN202110908117.X

    申请日:2021-08-09

    Abstract: 基于互信息增强的自监督新颖性检测方法,涉及图像处理领域。本发明是为了解决现有图像新颖性检测方法的重构效果不佳,难以对类内外图像边界进行区分,进而导致在复杂场景中检测效果差的问题。本发明具体过程为:将待检测的图像输入到训练好的自监督新颖性检测模型的自编码网络中进行新颖性检测,获得检测结果。所述自监督新颖性检测模型包括:自编码网络、隐鉴别器、鉴别器、分类器;自编码网络包括:生成器和编码器,用于对输入的待检测图像数据进行重构;所述隐鉴别器用于与编码器进行对抗训练;所述鉴别器用于与生成器进行对抗训练;分类器用于对生成器生成的图像进行分类。本发明用于对图像的新颖性进行检测。

    一种基于语义增强的标题短文本分类方法

    公开(公告)号:CN111460147B

    公开(公告)日:2023-06-23

    申请号:CN202010214338.2

    申请日:2020-03-24

    Abstract: 一种基于语义增强的标题短文本分类方法,它属于文本分类技术领域。本发明解决了现有方法对情报数据挖掘中的标题短文本分类的精确度低的问题。本发明对采集的标题短文本以及标题短文本对应的文章内容进行预处理后,将预处理后的文章内容作为样本数据的扩充语料,另外还通过特征检索的方式获得了标题短文本的扩充语料,并且利用验证集对模型参数寻优时获得的优质数据集对训练集进行更新,即本发明对标题短文本进行了CSE编码语义增强和ASE自主语义增强,通过语义增强技术对标题短文本进行分类,可以有效提高FastText分类器在短文本分类上的精确度,分类精度将有近30%的大幅度提升。本发明可以应用于短文本分类。

Patent Agency Ranking