一种高效的新型内存索引结构处理方法

    公开(公告)号:CN110597805A

    公开(公告)日:2019-12-20

    申请号:CN201910672625.5

    申请日:2019-07-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种高效的新型内存索引结构处理方法。在跳表处理前,通过统计信息计算查询分布以及数据分布情况;选择插入跳表结构的哨兵节点;通过求解跳表在插入节点后的最小平均操作代价,得到最优的哨兵节点的配置结果;在底层跳表结构中插入这些哨兵节点,接着在底层跳表结构中的哨兵节点插入完毕后,通过Bulkload方法自底向上建立上层CSB+树结构,对哨兵节点的快速定位;对于每一条需要查询或者插入的数据,通过上层CSB+树结构,找到最近哨兵节点,从此开始对跳表进行操作。本发明方法在保留传统跳表结构实现简单、并发性好、适合范围查询等优势的基础上,提升了整个操作过程对缓存的利用率,从而明显提升了内存索引的性能。

    一种图像数据多标签分类方法

    公开(公告)号:CN110210515A

    公开(公告)日:2019-09-06

    申请号:CN201910339785.8

    申请日:2019-04-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种图像数据多标签分类方法。对输入图像进行分解,利用神经网络提取特征的高次相关性,对标签数据进行分解,利用神经网络提取标签的高次相关性,采用包含多层全连接层的神经网络将输入图像的特征码从输入空间解码到标签空间;构建损失函数,初始化训练参数,采用随机梯度下降方法最小化最终损失函数为目标,训练求解获得最优的训练参数;然后针对待测试的图像数据输入到训练后的模型中进行预测,输出获得标签结果,实现多标签分类。本发明解决了图像数据前人工作不能同时提取标签的二次相关性和多次相关性的问题,降低了由于图像数据太过稀疏带来的预测困难,提高了多标签分类的准确性。

    一种低采样定位环境下的室内语义轨迹标注和补全方法

    公开(公告)号:CN109190656A

    公开(公告)日:2019-01-11

    申请号:CN201810778020.X

    申请日:2018-07-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种低采样定位环境下的室内语义轨迹标注和补全方法。语义实体和室内空间结构信息录入,构建获得移动转移图;采集原始位置轨迹,对每个原始位置轨迹分割形成多个分割片段;对于事件模式,用户选取绑定位置轨迹片段;将分割片段和位置轨迹片段的关键特征进行相似性比较,取相似性最高的进行相关性链接,形成一组独立的语义元组;将语义元组组装,概率推断计算生成缺失部分的语义元组;插入补全后将完整的语义轨迹导出。本发明方法在面向移动约束复杂、位置数据采样频率较低的室内定位场景时,可导出准确可用的完整语义轨迹数据。

    一种面向非实时快照位置数据的签到用户近似搜索方法

    公开(公告)号:CN108924778A

    公开(公告)日:2018-11-30

    申请号:CN201810778007.4

    申请日:2018-07-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向非实时快照位置数据的签到用户近似搜索方法。读入非实时快照位置数据,建立室内分区空间索引;输入查询区域计算查询区域对应的保底区域和浮动区域;以浮动区域作为空间范围查询的查询条件,在室内分区空间索引上搜索移动用户;根据搜索到的移动用户的快照位置数据,构建不确定移动区域,判定移动用户为确定签到用户或可能签到用户,并放入对应集合中;将确定签到用户集合和可能签到用户集合作为近似搜索结果返回给图形界面进行展示。本发明方法在无线定位数据采样频率低、内存维护数据条件有限的场景下,搜索当前时刻可能在特定查询区域进行签到的用户时,能同时保证搜索过程的高效性和完整有效性。

    面向概率型位置流数据的室内区域访问量连续监控方法

    公开(公告)号:CN108924763A

    公开(公告)日:2018-11-30

    申请号:CN201810779777.0

    申请日:2018-07-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向概率型位置流数据的室内区域访问量连续监控方法。从室内定位系统获取位置流数据,构造有效轨迹,输入查询区域;进行区域访问量计算过程,周期性地从缓冲池中读取最新有效轨迹并计算;进行增量预测过程,根据计算结果缓存进行增量预测获得估算结果;通过图形界面对监控区域的访问量排名进行可视化展示。本发明方法在面向移动约束复杂、流式的定位位置数据具有多重可能性的室内定位场景时,可以以较高的效率和准确率提供一组查询区域的用户访问量在连续时刻上的排名展示。不仅可以周期性地返回准确的计算结果,也在注重效率的前提下提供了快速返回的增量预测结果。

    一种基于循环神经网络的数据库查询时间预测方法

    公开(公告)号:CN107491508A

    公开(公告)日:2017-12-19

    申请号:CN201710647281.3

    申请日:2017-08-01

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于循环神经网络的数据库查询时间预测方法。首先从数据库历史查询记录中抽取出查询计划,构成的原始数据,一条查询计划包含操作信息和运行时间;按照运行时间长短将原始数据分类,使得每类中的查询计划的数量相等;对查询计划进行特殊处理获得操作序列和运行时间序列;操作序列作为特征向量和运行时间序列作为标签,输入神经网络,训练并得到模型;针对待测的查询计划,重复步骤获得操作序列,输入模型,输出运行时间序列,完成对数据库查询时间的预测。本发明方法在关系型数据库查询时间预测上取得了良好的效果,模拟数据训练下模型的正确率高于78%。该方法可以用于解决查询优化、负载管理中的关键问题。

    一种基于深度神经网络的用户会话推荐方法

    公开(公告)号:CN105787100A

    公开(公告)日:2016-07-20

    申请号:CN201610157679.4

    申请日:2016-03-18

    Applicant: 浙江大学

    CPC classification number: G06F16/9535 G06N3/02 G06Q30/0631

    Abstract: 本发明公开了一种基于深度神经网络的用户会话的推荐方法。该方法的步骤如下:收集购物网站日志数据,重建用户会话所浏览过的商品网页,生成训练集D’、交叉验证集V’和测试集T’;对所有的会话进行扩展处理,从而生成训练集D、交叉验证集V和测试集T;设置神经网络参数,生成深度深度神经网络模型;训练神经网络,使用基于遗传算法的自动调参框架进行调参;计算模型在测试集T上的正确率;计算路径压缩比。本发明能显著提高推荐精度,针对神经网络调参困难的问题,基于遗传算法提出一个自动调整网络相关配置的算法,大大提高网络调参的效率。它适用于在线购物网站在与用户交互的同时,向用户推荐他们可能会购买的商品。

    基于微博的众包问答系统信息采集方法

    公开(公告)号:CN103106267B

    公开(公告)日:2016-03-30

    申请号:CN201310040557.3

    申请日:2013-02-02

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于微博的众包问答系统信息采集方法,该发明首先实现了与微博平台进行数据交互的数据采集和发布模块,通过该模块自动采集系统相关的所有问答数据和用户资料信息;对于采集到的问答数据进行后台分析处理,为用户提供更直观和专业的回答结果展示;另外,系统通过对用户资料信息和问答行为的具体分析,将各类新问题有效推送给可能回答的潜在用户,以对新问题进行高效、快速扩散;应用本发明的方法,可以通过微博平台实现问答系统更高效快速地获取答案。

    一种基于动态摘要技术的微博流信息提取方法

    公开(公告)号:CN103699611A

    公开(公告)日:2014-04-02

    申请号:CN201310688854.9

    申请日:2013-12-16

    Applicant: 浙江大学

    CPC classification number: G06F17/3089 G06F17/3071

    Abstract: 本发明公开了一种基于动态摘要技术的微博流信息提取方法,该发明首先设计了一种基于微博流的增量聚类方法,并提出一种新的微博类向量的数据结构,以维护类的聚集信息。同时,结合金字塔型时间帧结构,保存历史时刻的信息快照,从而支持对任意时间段进行摘要。利用聚类方法得到的信息,提出高层次摘要算法,选取最具有代表性的微博作为摘要。在此基础上,通过检测摘要内容的变化,设计一种话题演变检测方法,自动地生成时间轴。本发明设计的方法在面向海量社会化文本进行信息提取的效率和效果上取得了良好的平衡,既使得用户在知识获取过程中更加的便利,同时也支持诸如实时报道、历史综述等数据分析工作。

    基于凸性的多点远邻查询方法

    公开(公告)号:CN101984433B

    公开(公告)日:2012-11-21

    申请号:CN201010545438.X

    申请日:2010-11-12

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于凸性的多点远邻查询方法。利用现有DBMS平台和空间数据库引擎相结合构建空间数据库系统,并合理的选用空间数据库索引技术。在此基础上开发凸性距离函数引擎提供多点远邻查询方法需要的距离计算方法。开发基于凸性的多点远邻查询处理引擎,包括最小界定的多点远邻查询方法,最好优先的多点远邻查询方法和基于凸包的多点远邻查询方法。开发多点远邻查询优化引擎,根据查询特征智能的选择合适的多点远邻查询方法进行查询处理。本发明利用DBMS平台、空间数据库引擎和空间数据库索引技术的成果,基于已有系统快捷的开发基于凸性的多点远邻查询处理引擎,通过多点远邻查询优化引擎选择最合适的查询方法,提供最好的性能。

Patent Agency Ranking