-
公开(公告)号:CN119323602A
公开(公告)日:2025-01-17
申请号:CN202411349577.3
申请日:2024-09-26
Applicant: 浙江大学
Abstract: 本发明提出了一种基于生成式稠密模型的目标建筑视觉定位方法。本发明针对传统视觉定位方法严重依赖于昂贵的三维重建地图的问题,设计两阶段定位方法。在离线注册阶段,以生成式模型得到的3D稠密模型为输入,并使用联合位姿‑尺度优化算法,优化3D模型几何比例并注册多视角下的渲染图像及其对应位姿;在线定位阶段,本发明基于预训练的轻量化跨域特征匹配器以及鲁棒位姿解算器,可以快速获得查询图像对应的相机位姿。本发明兼顾了定位精度与速度,以及能够在无地图、少参考的严格环境下进行部署与使用,能够显著提高低质量模型在视觉定位中的效果。通过与现有视觉定位方法比较,本发明表现出了更广泛的可应用性以及更精确的定位结果。
-
公开(公告)号:CN118377867A
公开(公告)日:2024-07-23
申请号:CN202410393398.3
申请日:2024-04-02
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/33 , G06F16/84 , G06F40/30
Abstract: 本发明公开了一种基于大语言模型的学术会议问答系统,包括:数据结构化模块用于采用数据转换智能体将网页数据转换为半结构化数据,采用节点数据插入智能体根据网页链接和半结构化数据确定半结构化数据在树形结构的插入位置,并进行数据插入,得到树形结构数据;信息检索模块用于基于用户问题对树形结构数据进行查询路径检索得到相似的多个查询路径作为外部知识;知识问答模块用于利用用于问答的大语言模型基于用户问题和外部知识进行知识问答,得到问题答案。该系统将网页数据转成为树形结构数据,有利于从树形结构数据中高效抽取所需信息,同时借助检索增强的方式增强大语言模型在学术会议领域的问答能力,为学术研究者提供强大的智能辅助。
-