-
公开(公告)号:CN118626494A
公开(公告)日:2024-09-10
申请号:CN202411046420.3
申请日:2024-08-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/22 , G06F40/18 , G06F40/186 , G06F40/117
Abstract: 本发明提供了一种结构化数据洞察生成方法、系统及介质,该方法包括以下步骤:使用对应的表格、问题和答案数据集对开源自然语言模型进行微调后,得到数据定位模型和洞察生成模型;数据定位模型从表格中识别出与问题相关的位置并标注;数据定位模型对表格使用预生成事实的方法从模板中生成相关推理事实;将标注后的表格、问题和生成的推理事实输入到洞察生成模型中,洞察生成模型给出最终的结构化数据洞察。相较现有技术,本发明减少了收集数据时人工标注的压力,提高了模型预测的可解释性和准确率,减少了语言模型在推理(尤其是数值推理)时的模型幻觉问题。
-
公开(公告)号:CN118331995A
公开(公告)日:2024-07-12
申请号:CN202410761162.0
申请日:2024-06-13
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/242 , G06F16/332 , G06F16/31
Abstract: 本申请涉及计算机技术领域,提供了从文本到SQL语句的增强方法、设备和计算机存储介质,该方法包括:对自然语言问题进行优化,得到优化的自然语言问题;基于数据库内容信息和优化的自然语言问题,生成模型的上下文感知提示;将上下文感知提示输入模型,生成与自然语言问题相应的SQL语句;对SQL语句进行评估并将评估结果向模型反馈,直至模型生成的SQL语句合规或生成次数达到预设次数。本申请的技术方案可以使得模型能够生成更精确和合规的SQL语句。
-
公开(公告)号:CN118626494B
公开(公告)日:2024-11-26
申请号:CN202411046420.3
申请日:2024-08-01
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/22 , G06F40/18 , G06F40/186 , G06F40/117
Abstract: 本发明提供了一种结构化数据洞察生成方法、系统及介质,该方法包括以下步骤:使用对应的表格、问题和答案数据集对开源自然语言模型进行微调后,得到数据定位模型和洞察生成模型;数据定位模型从表格中识别出与问题相关的位置并标注;数据定位模型对表格使用预生成事实的方法从模板中生成相关推理事实;将标注后的表格、问题和生成的推理事实输入到洞察生成模型中,洞察生成模型给出最终的结构化数据洞察。相较现有技术,本发明减少了收集数据时人工标注的压力,提高了模型预测的可解释性和准确率,减少了语言模型在推理(尤其是数值推理)时的模型幻觉问题。
-
公开(公告)号:CN118798821A
公开(公告)日:2024-10-18
申请号:CN202411139998.3
申请日:2024-08-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06Q10/10 , G06Q10/0637 , G06Q10/04 , G06Q40/04
Abstract: 本申请涉及大数据大模型技术领域,提供了数据流通交易违规行为处理方法,该方法包括:基于数据流通交易的历史违规行为相关法律文书,构建历史违规行为所属类型对应的证据链;通过监控目标数据流通交易的过程,预测目标数据流通交易所属违规行为的类型;根据目标数据流通交易所属违规行为的类型和历史违规行为所属类型对应的证据链,确定目标数据流通交易的证据相关联的证据类型;根据目标数据流通交易的证据相关联的证据类型,构建目标数据流通交易的证据链;根据目标数据流通交易的证据链计算违规权重并与由具有相同违规行为类型的历史违规行为的证据链计算出的违规权重进行比较,确定目标数据流通交易是否违规。本申请的技术方案可以对数据流通交易过程中的违规行为进行有效判定和溯源。
-
-
-