-
公开(公告)号:CN120045583A
公开(公告)日:2025-05-27
申请号:CN202510073091.X
申请日:2025-01-17
Applicant: 浙江大学
IPC: G06F16/2452 , G06F16/242 , G06F18/241 , G06F18/214 , G06N3/045
Abstract: 本发明公开了一种基于认知增强的大语言模型自然语言问题到SQL查询的翻译方法。方法包括先根据数据库中用户提出的自然语言问题依次进行SQL语句处理和合并处理,得到翻译原始数据集,然后对翻译原始数据集依次进行筛选处理、模板处理、增广处理和合并处理,得到翻译数据集,再将翻译数据集输入到关键词预测分类模型中进行训练,得到训练完成的关键词预测分类模型,最终对用户提出的待翻译自然语言问题进行综合处理得到用户提出的待翻译自然语言问题对应的查询结果。本发明实现了优化大语言模型在自然语言问题到SQL查询任务的不同环节的有益效果,取得了增强了大语言模型对自然语言问题到SQL查询任务和SQL语言的理解的优势。
-
公开(公告)号:CN119474276A
公开(公告)日:2025-02-18
申请号:CN202510027118.1
申请日:2025-01-08
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/33 , G06N5/04 , G06N5/022
Abstract: 本发明公开了一种面向检索增强生成系统的错误定位方法、电子设备、介质,包括:获取检索增强生成系统的中间执行结果,包括:用户问题、原始检索相关文档、模型响应、标准答案;将原始检索相关文档插入第一提示词模板中,输入至第一大语言模型,提取原始检索事实三元组;将所有原始检索事实三元组插入第二提示词模板中,输入至第二大语言模型,判断所有原始检索事实三元组能否推导答案以回答用户问题;若能推导答案,则判定检索增强生成系统中的检索器正常;反之,则判定检索器异常;将用户问题、模型响应、标准答案、原始检索事实三元组输入至第三大语言模型中,判定模型响应的准确完整性,从而判断检索增强生成系统中的大语言模型是否异常。
-
公开(公告)号:CN116431915A
公开(公告)日:2023-07-14
申请号:CN202310398860.4
申请日:2023-04-06
Applicant: 浙江大学
IPC: G06F16/9535 , G06Q30/0601 , G06N20/00 , G06N3/098 , G06N3/048 , G06N3/047 , G06F21/62
Abstract: 本发明实施例提供了一种基于联邦学习和注意力机制的跨域推荐方法与装置,包括:获取用户的源域特征向量;在各个客户端上分别构建跨域推荐模型,根据源域特征向量获取用户的领域共享特征,根据用户的标识、商品的标识分别获取用户的领域特定特征和商品特征向量;对领域共享特征和领域特定特征进行聚合,得到混合特征向量;基于混合特征向量与商品特征向量进行推荐预测,得到用户对商品的偏好概率;基于联邦学习机制,训练所有客户端上的跨域推荐模型。本发明保障用户特征可以从源域准确迁移到目标域,又考虑了用户在不同领域偏好的多样性,从而提高推荐预测的准确率。
-
公开(公告)号:CN108924778B
公开(公告)日:2020-05-22
申请号:CN201810778007.4
申请日:2018-07-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向非实时快照位置数据的签到用户近似搜索方法。读入非实时快照位置数据,建立室内分区空间索引;输入查询区域计算查询区域对应的保底区域和浮动区域;以浮动区域作为空间范围查询的查询条件,在室内分区空间索引上搜索移动用户;根据搜索到的移动用户的快照位置数据,构建不确定移动区域,判定移动用户为确定签到用户或可能签到用户,并放入对应集合中;将确定签到用户集合和可能签到用户集合作为近似搜索结果返回给图形界面进行展示。本发明方法在无线定位数据采样频率低、内存维护数据条件有限的场景下,搜索当前时刻可能在特定查询区域进行签到的用户时,能同时保证搜索过程的高效性和完整有效性。
-
公开(公告)号:CN119474262A
公开(公告)日:2025-02-18
申请号:CN202411333724.8
申请日:2024-09-24
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/31 , G06F16/334 , G06F16/36 , G06F16/38 , G06N3/045 , G06F40/16
Abstract: 本发明公开了一种结合外部知识检索增强大语言模型的数据匹配方法、设备、介质,包括:将数据匹配任务拆解为自然语言形式的规则集合;遍历数据匹配数据集中的每一样本;对于第i个样本,获取该样本中与源数据库相关的数据库角色实体及其元数据;将数据库角色实体作为索引,其对应的元数据作为值构建第一知识集;将该样本输入大语言模型以提取关键词,检索得到关键词在外部领域知识库中对应的实体,并获取该实体的one‑hop关系;将关键词作为索引,其对应的one‑hop关系作为值构建第二知识集;获取压缩后的in‑context示例数据;基于规则集合、第一知识集、第二知识集、压缩的in‑context示例数据构建提示词并输入至大语言模型,得到数据匹配结果。
-
公开(公告)号:CN109190656B
公开(公告)日:2020-07-21
申请号:CN201810778020.X
申请日:2018-07-16
Applicant: 浙江大学
IPC: G06K9/62 , G06F16/909
Abstract: 本发明公开了一种低采样定位环境下的室内语义轨迹标注和补全方法。语义实体和室内空间结构信息录入,构建获得移动转移图;采集原始位置轨迹,对每个原始位置轨迹分割形成多个分割片段;对于事件模式,用户选取绑定位置轨迹片段;将分割片段和位置轨迹片段的关键特征进行相似性比较,取相似性最高的进行相关性链接,形成一组独立的语义元组;将语义元组组装,概率推断计算生成缺失部分的语义元组;插入补全后将完整的语义轨迹导出。本发明方法在面向移动约束复杂、位置数据采样频率较低的室内定位场景时,可导出准确可用的完整语义轨迹数据。
-
公开(公告)号:CN108924763B
公开(公告)日:2020-07-03
申请号:CN201810779777.0
申请日:2018-07-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向概率型位置流数据的室内区域访问量连续监控方法。从室内定位系统获取位置流数据,构造有效轨迹,输入查询区域;进行区域访问量计算过程,周期性地从缓冲池中读取最新有效轨迹并计算;进行增量预测过程,根据计算结果缓存进行增量预测获得估算结果;通过图形界面对监控区域的访问量排名进行可视化展示。本发明方法在面向移动约束复杂、流式的定位位置数据具有多重可能性的室内定位场景时,可以以较高的效率和准确率提供一组查询区域的用户访问量在连续时刻上的排名展示。不仅可以周期性地返回准确的计算结果,也在注重效率的前提下提供了快速返回的增量预测结果。
-
公开(公告)号:CN109190656A
公开(公告)日:2019-01-11
申请号:CN201810778020.X
申请日:2018-07-16
Applicant: 浙江大学
IPC: G06K9/62 , G06F16/909
Abstract: 本发明公开了一种低采样定位环境下的室内语义轨迹标注和补全方法。语义实体和室内空间结构信息录入,构建获得移动转移图;采集原始位置轨迹,对每个原始位置轨迹分割形成多个分割片段;对于事件模式,用户选取绑定位置轨迹片段;将分割片段和位置轨迹片段的关键特征进行相似性比较,取相似性最高的进行相关性链接,形成一组独立的语义元组;将语义元组组装,概率推断计算生成缺失部分的语义元组;插入补全后将完整的语义轨迹导出。本发明方法在面向移动约束复杂、位置数据采样频率较低的室内定位场景时,可导出准确可用的完整语义轨迹数据。
-
公开(公告)号:CN108924778A
公开(公告)日:2018-11-30
申请号:CN201810778007.4
申请日:2018-07-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向非实时快照位置数据的签到用户近似搜索方法。读入非实时快照位置数据,建立室内分区空间索引;输入查询区域计算查询区域对应的保底区域和浮动区域;以浮动区域作为空间范围查询的查询条件,在室内分区空间索引上搜索移动用户;根据搜索到的移动用户的快照位置数据,构建不确定移动区域,判定移动用户为确定签到用户或可能签到用户,并放入对应集合中;将确定签到用户集合和可能签到用户集合作为近似搜索结果返回给图形界面进行展示。本发明方法在无线定位数据采样频率低、内存维护数据条件有限的场景下,搜索当前时刻可能在特定查询区域进行签到的用户时,能同时保证搜索过程的高效性和完整有效性。
-
公开(公告)号:CN108924763A
公开(公告)日:2018-11-30
申请号:CN201810779777.0
申请日:2018-07-16
Applicant: 浙江大学
Abstract: 本发明公开了一种面向概率型位置流数据的室内区域访问量连续监控方法。从室内定位系统获取位置流数据,构造有效轨迹,输入查询区域;进行区域访问量计算过程,周期性地从缓冲池中读取最新有效轨迹并计算;进行增量预测过程,根据计算结果缓存进行增量预测获得估算结果;通过图形界面对监控区域的访问量排名进行可视化展示。本发明方法在面向移动约束复杂、流式的定位位置数据具有多重可能性的室内定位场景时,可以以较高的效率和准确率提供一组查询区域的用户访问量在连续时刻上的排名展示。不仅可以周期性地返回准确的计算结果,也在注重效率的前提下提供了快速返回的增量预测结果。
-
-
-
-
-
-
-
-
-