-
公开(公告)号:CN111259938A
公开(公告)日:2020-06-09
申请号:CN202010023677.2
申请日:2020-01-09
Applicant: 浙江大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于流形学习和梯度提升模型的图片偏多标签分类方法。从训练数据集构建一个加权图,通过求解以上第一最小化模型获得非负权重矩阵,根据加权图建立第二最小化模型并求解获得重构标签矩阵,根据重构标签矩阵将训练数据集换构造并训练二值相关模型,预测得标签矩阵;对图片的特征向量矩阵建立回归器最小化求解,用迭代预测结果矩阵增强特征向量矩阵,结合负梯度矩阵构造数据集并训练学习获得弱回归器,求和所有弱回归器,得最终回归器,对预待测图片处理判断。本发明能够充分地利用图片偏多标签数据之间的相关性来提升图片的多标签分类预测性能,可实现偏标签数据的消歧,提高了准确度和鲁棒性,其性能优于现有的图片偏多标签方法。
-
公开(公告)号:CN110597805A
公开(公告)日:2019-12-20
申请号:CN201910672625.5
申请日:2019-07-24
Applicant: 浙江大学
IPC: G06F16/22
Abstract: 本发明公开了一种高效的新型内存索引结构处理方法。在跳表处理前,通过统计信息计算查询分布以及数据分布情况;选择插入跳表结构的哨兵节点;通过求解跳表在插入节点后的最小平均操作代价,得到最优的哨兵节点的配置结果;在底层跳表结构中插入这些哨兵节点,接着在底层跳表结构中的哨兵节点插入完毕后,通过Bulkload方法自底向上建立上层CSB+树结构,对哨兵节点的快速定位;对于每一条需要查询或者插入的数据,通过上层CSB+树结构,找到最近哨兵节点,从此开始对跳表进行操作。本发明方法在保留传统跳表结构实现简单、并发性好、适合范围查询等优势的基础上,提升了整个操作过程对缓存的利用率,从而明显提升了内存索引的性能。
-
公开(公告)号:CN108924778A
公开(公告)日:2018-11-30
申请号:CN201810778007.4
申请日:2018-07-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向非实时快照位置数据的签到用户近似搜索方法。读入非实时快照位置数据,建立室内分区空间索引;输入查询区域计算查询区域对应的保底区域和浮动区域;以浮动区域作为空间范围查询的查询条件,在室内分区空间索引上搜索移动用户;根据搜索到的移动用户的快照位置数据,构建不确定移动区域,判定移动用户为确定签到用户或可能签到用户,并放入对应集合中;将确定签到用户集合和可能签到用户集合作为近似搜索结果返回给图形界面进行展示。本发明方法在无线定位数据采样频率低、内存维护数据条件有限的场景下,搜索当前时刻可能在特定查询区域进行签到的用户时,能同时保证搜索过程的高效性和完整有效性。
-
公开(公告)号:CN108924763A
公开(公告)日:2018-11-30
申请号:CN201810779777.0
申请日:2018-07-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向概率型位置流数据的室内区域访问量连续监控方法。从室内定位系统获取位置流数据,构造有效轨迹,输入查询区域;进行区域访问量计算过程,周期性地从缓冲池中读取最新有效轨迹并计算;进行增量预测过程,根据计算结果缓存进行增量预测获得估算结果;通过图形界面对监控区域的访问量排名进行可视化展示。本发明方法在面向移动约束复杂、流式的定位位置数据具有多重可能性的室内定位场景时,可以以较高的效率和准确率提供一组查询区域的用户访问量在连续时刻上的排名展示。不仅可以周期性地返回准确的计算结果,也在注重效率的前提下提供了快速返回的增量预测结果。
-
公开(公告)号:CN107491508A
公开(公告)日:2017-12-19
申请号:CN201710647281.3
申请日:2017-08-01
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于循环神经网络的数据库查询时间预测方法。首先从数据库历史查询记录中抽取出查询计划,构成的原始数据,一条查询计划包含操作信息和运行时间;按照运行时间长短将原始数据分类,使得每类中的查询计划的数量相等;对查询计划进行特殊处理获得操作序列和运行时间序列;操作序列作为特征向量和运行时间序列作为标签,输入神经网络,训练并得到模型;针对待测的查询计划,重复步骤获得操作序列,输入模型,输出运行时间序列,完成对数据库查询时间的预测。本发明方法在关系型数据库查询时间预测上取得了良好的效果,模拟数据训练下模型的正确率高于78%。该方法可以用于解决查询优化、负载管理中的关键问题。
-
公开(公告)号:CN105787100A
公开(公告)日:2016-07-20
申请号:CN201610157679.4
申请日:2016-03-18
Applicant: 浙江大学
CPC classification number: G06F16/9535 , G06N3/02 , G06Q30/0631
Abstract: 本发明公开了一种基于深度神经网络的用户会话的推荐方法。该方法的步骤如下:收集购物网站日志数据,重建用户会话所浏览过的商品网页,生成训练集D’、交叉验证集V’和测试集T’;对所有的会话进行扩展处理,从而生成训练集D、交叉验证集V和测试集T;设置神经网络参数,生成深度深度神经网络模型;训练神经网络,使用基于遗传算法的自动调参框架进行调参;计算模型在测试集T上的正确率;计算路径压缩比。本发明能显著提高推荐精度,针对神经网络调参困难的问题,基于遗传算法提出一个自动调整网络相关配置的算法,大大提高网络调参的效率。它适用于在线购物网站在与用户交互的同时,向用户推荐他们可能会购买的商品。
-
公开(公告)号:CN103106267B
公开(公告)日:2016-03-30
申请号:CN201310040557.3
申请日:2013-02-02
Applicant: 浙江大学
Abstract: 本发明公开了一种基于微博的众包问答系统信息采集方法,该发明首先实现了与微博平台进行数据交互的数据采集和发布模块,通过该模块自动采集系统相关的所有问答数据和用户资料信息;对于采集到的问答数据进行后台分析处理,为用户提供更直观和专业的回答结果展示;另外,系统通过对用户资料信息和问答行为的具体分析,将各类新问题有效推送给可能回答的潜在用户,以对新问题进行高效、快速扩散;应用本发明的方法,可以通过微博平台实现问答系统更高效快速地获取答案。
-
公开(公告)号:CN119964172A
公开(公告)日:2025-05-09
申请号:CN202510041227.9
申请日:2025-01-10
Applicant: 浙江大学
IPC: G06V30/18 , G06V30/148 , G06V20/70 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种UML类图信息提取方法、系统及设备,旨在解决现有UML类图信息提取依赖人工,效率低且易出错的问题。该方法包括:收集并标注大量不同风格与复杂度的UML类图图像,划分为训练、验证及测试集;构建以卷积神经网络为基础结构的YOLO模型,设置合适参数并利用训练集训练,依损失函数与反向传播算法优化,同时以验证集监控防止过拟合;将待处理UML类图图像输入训练好的模型,识别类矩形轮廓与关系类型符号并确定位置,通过OCR技术提取文本信息,进而提取UML类图信息。本发明显著提高信息提取效率与准确性,且方法可扩展性强,适用于不同领域与风格的UML类图处理,为软件工程相关任务提供有力支持。
-
公开(公告)号:CN118093597A
公开(公告)日:2024-05-28
申请号:CN202410490193.7
申请日:2024-04-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F18/22
Abstract: 本发明公开了一种表格数据重构方法及装置、问答方法,包括筛选出与用户问题有关的表头并保留该表头所在的列,得到列重构表格;对列重构后的表格进行行重构:根据单元值将表格的列划分为三类,即连续值列、离散值列、时间值列;提取连续值列的统计量、离散值列的与用户问题有关的类别以及时间值列的最早和最晚时间作为表格的重构特征,并将这些重构特征进行连接得到行重构表格,从而得到完整的重构表格;进一步地,输入大语言模型来生成符合用户问题需求的SQL语句,大大提高了通过自然语言处理表格任务的准确率,在实际的使用场景更加智能与有效。
-
公开(公告)号:CN118035365A
公开(公告)日:2024-05-14
申请号:CN202410248304.3
申请日:2024-03-05
Applicant: 浙江大学计算机创新技术研究院
Abstract: 本发明公开了一种利用关系型数据库管理系统存储多模型数据的方法。本发明方法的步骤包括:1)将多模型数据按属性存储:将多模型数据的各属性转化成若干属性表,第一列代表对象编号,第二列为一个属性;2)遗传算法寻优:使用遗传算法,选择属性表进行聚合,寻找使得查询速度最快的关系模式;3)提高存储效率:将查询速度相近的若干关系模式做比较,选择占用存储最少的关系模式。本发明首次提出了一种利用遗传算法的、将多模型数据存储在关系型数据库管理系统中的方法,本发明方法提升了查询效率并减少了空间消耗,优于现有方法,具有通用、简便等优点。
-
-
-
-
-
-
-
-
-