基于负载均衡和查询日志的数据空间多维索引方法

    公开(公告)号:CN106095951A

    公开(公告)日:2016-11-09

    申请号:CN201610422994.5

    申请日:2016-06-13

    CPC classification number: G06F17/30333

    Abstract: 基于负载均衡和查询日志的数据空间多维索引方法,涉及数据空间索引技术领域。旨在把倒排索引分布到不同的索引节点中,使得各个索引节点保持负载均衡,同时最小化查询处理涉及的通信开销和减少搜索空间。在垂直划分中,首先利用查询日志和实体中频繁出现的词,聚合索引token词,使用超图表示用户查询与倒排列表间的访问模式;在水平划分中,通过超图刻画用户查询与实体间的访问模式信息,把水平划分问题归约为超图划分问题,使得不同索引节点的负载保持均衡,并降低查询涉及的通信开销。结合垂直划分和水平划分策略,构建二维混合索引并扩展为三维索引。通过在公开数据集DBLP上进行实验表明本发明方法在吞吐量、查询响应时间及扩展性优于已有方法。

    一种关系数据库中基于主题类簇单元的关键词查询方法

    公开(公告)号:CN105975488A

    公开(公告)日:2016-09-28

    申请号:CN201610264735.4

    申请日:2016-04-25

    CPC classification number: G06F16/285 G06F16/2471

    Abstract: 一种关系数据库中基于主题类簇单元的关键词查询方法,涉及信息检索领域,尤其涉及一种关系数据库中基于主题类簇单元的关键词查询方法。本发明要为解决现有关键词在线查询方法存在查询过程中频繁的表连接所带来巨大时间开销的问题,而现有关键词离线查询方法对于内部结构复杂、数据量庞大的大规模数据库上的查询存在查询效率低的问题。一种关系数据库中基于主题类簇单元的关键词查询方法按以下步骤进行:1、主题类簇单元构建过程;①、基于数据表特性和查询日志垂直分组;②、提出主题类簇中表连接顺序优化方案;③、基于主题类簇元组关联图水平分组;2、建立基于关联规则的索引优化机制;3、将查询结果返回给用户。本发明应用于信息检索领域。

    基于Borda算法的搜索结果排序方法

    公开(公告)号:CN105808739A

    公开(公告)日:2016-07-27

    申请号:CN201610136924.3

    申请日:2016-03-10

    CPC classification number: G06F16/90348

    Abstract: 基于Borda算法的搜索结果排序方法,属于搜索引擎结果排序领域。现有的Borda排序算法对于结果相关分值的计算时,所用的位置关系并不能完全代表相关度的变化,导致搜索结果排序不准确。一种基于Borda算法的搜索结果排序方法,先是对返回结果的位置得分统一规范化处理,并且结合进了检索词串与搜索结果的相似度,对相似度的计算方法也进行了改进。本发明利用标题和摘要进行相似度的计算时,结合了查询词与结果的匹配权重,使得相似度的计算更加准确;且提高搜索效率。

    基于偏旁特征嵌入的中文命名实体识别网络模型

    公开(公告)号:CN114510945B

    公开(公告)日:2024-10-22

    申请号:CN202210157121.1

    申请日:2022-02-21

    Abstract: 基于偏旁特征嵌入的中文命名实体识别网络模型,涉及自然语言处理与中文命名实体识别领域。解决了现有中文命名实体识别算法的语义识别的准确率和F值低的问题。将字符拆分成其偏旁构成的形式,将其映射为偏旁特征向量、并与单词特征向量和字符特征向量,组合后输入到Bi‑LSTM编码层中进行编码中,编码后的特征经CRF解码层解码后得到输入文本的命名实体标签,从而实现对中文命名实体的识别。本发明主要用于对中文命名实体进行识别。

    基于深度学习的法兰中心点识别方法

    公开(公告)号:CN118053064A

    公开(公告)日:2024-05-17

    申请号:CN202410169717.2

    申请日:2024-02-06

    Abstract: 基于深度学习的法兰中心点识别方法,本发明涉及法兰中心点识别方法。本发明的目的是为了解决现有传统视觉识别系统对法兰中心点的识别准确性低、效率低下、以及适应性不足的问题。过程为:步骤一、随机采样带法兰中心点坐标标签的法兰图片,作为训练集;步骤二、构建神经网络模型;具体过程为:神经网络模型包括:语义分割网络、全局特征提取网络和关键点识别网络;步骤三、基于训练集训练构建的神经网络模型,获得训练好的神经网络模型;步骤四、采集待测法兰图片,将待测法兰图片输入训练好的神经网络模型,训练好的神经网络模型输出待测法兰图片的法兰中心点。本发明用于法兰中心点的识别领域。

    融合义原信息的语言含义理解方法

    公开(公告)号:CN112464673B

    公开(公告)日:2023-05-26

    申请号:CN202011431776.0

    申请日:2020-12-09

    Abstract: 融合义原信息的语言含义理解方法,属于语言信息处理技术领域。为了解决现有的语言建模方法存在复杂度较高的问题和不能兼顾效果的问题。本发明所述方法首先将语言以每个单词为单位,按照两条路径进行处理;左路径:单词编码器+RNN+单词解码器,左路径输出记为wl;右路径:义原编码器+RNN+义原解码器+词语解码器+sigmoid,右路径输出记为wr;然后将两个路径的输出进行融合。主要用于语言含义理解。

    一种基于混合度量的特征分布度量方法

    公开(公告)号:CN115861660A

    公开(公告)日:2023-03-28

    申请号:CN202211689077.5

    申请日:2022-12-27

    Abstract: 一种基于混合度量的特征分布度量方法,为解决在图像分类时深度迁移学习方法的迁移学习模型无法对目标域数据准确标注的问题。将图片分为源域和目标域;利用源域中的图片对迁移学习模型进行训练,得到模型;计算分类损失;计算域间特征边缘分布差异的一、二、三阶统计量距离,再加权组合得到域间特征边缘分布的混合度量;获取目标域软标签,利用软标签计算目标域特征的初始软质心,再使用余弦相似度得目标域特征的伪标签;计算域间特征的条件分布差异的一、二、三阶统计量距离,再加权组合得到域间特征条件分布的混合度量;将二者混合度量相加得域间特征统计量距离;计算迁移学习模型总体损失函数,更新模型;预测测试样本,得到种类预测概率。

Patent Agency Ranking