-
公开(公告)号:CN119990085A
公开(公告)日:2025-05-13
申请号:CN202510160821.X
申请日:2025-02-13
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F40/18 , G06F18/214 , G06N3/045 , G06N3/088 , G06N3/0895
Abstract: 本发明公开了一种基于表格置换不变性的预训练方法和装置。该方法包括第一阶段根据表格中行、列的置换不变性构造正负样本对数据,然后用对比学习的方法构建预训练任务;为了让预训练模型适应各种各样的下游任务,第二阶段是表格与下游任务进行对齐,表格的下游任务包括表格问答、表格分类、表格数据生成、表格摘要提取等,根据不同的下游任务分别对预训练模型和下有任务的语言大模型进行联合对齐训练,从而得到能适应各种下游任务的预训练模型。
-
公开(公告)号:CN118245485B
公开(公告)日:2024-08-23
申请号:CN202410645067.4
申请日:2024-05-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F40/177 , G06F40/151
Abstract: 本发明公开了一种大模型处理表格数据的方法、装置及介质,包括:将用户的自然语言转化为SQL查询,以进行表格数据查询请求;将SQL查询中的表格任务解析成对应的算子,以生成粗粒度的计算图;使用算子分解、算子组合、算子重排,并结合代价函数对粗粒度的计算图进行优化,生成细粒度的计算图;根据细粒度的计算图编译成代码;执行所述代码,得到用户答复。本发明能够实现与表格的自然语言交互,能够实现提取信息、计算、推理等功能,具备更强的理解和执行表格任务的能力。
-
公开(公告)号:CN118245485A
公开(公告)日:2024-06-25
申请号:CN202410645067.4
申请日:2024-05-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F40/177 , G06F40/151
Abstract: 本发明公开了一种大模型处理表格数据的方法、装置及介质,包括:将用户的自然语言转化为SQL查询,以进行表格数据查询请求;将SQL查询中的表格任务解析成对应的算子,以生成粗粒度的计算图;使用算子分解、算子组合、算子重排,并结合代价函数对粗粒度的计算图进行优化,生成细粒度的计算图;根据细粒度的计算图编译成代码;执行所述代码,得到用户答复。本发明能够实现与表格的自然语言交互,能够实现提取信息、计算、推理等功能,具备更强的理解和执行表格任务的能力。
-
公开(公告)号:CN111259938B
公开(公告)日:2022-04-12
申请号:CN202010023677.2
申请日:2020-01-09
Applicant: 浙江大学
IPC: G06V10/764 , G06K9/62
Abstract: 本发明公开了一种基于流形学习和梯度提升模型的图片偏多标签分类方法。从训练数据集构建一个加权图,通过求解以上第一最小化模型获得非负权重矩阵,根据加权图建立第二最小化模型并求解获得重构标签矩阵,根据重构标签矩阵将训练数据集换构造并训练二值相关模型,预测得标签矩阵;对图片的特征向量矩阵建立回归器最小化求解,用迭代预测结果矩阵增强特征向量矩阵,结合负梯度矩阵构造数据集并训练学习获得弱回归器,求和所有弱回归器,得最终回归器,对预待测图片处理判断。本发明能够充分地利用图片偏多标签数据之间的相关性来提升图片的多标签分类预测性能,可实现偏标签数据的消歧,提高了准确度和鲁棒性,其性能优于现有的图片偏多标签方法。
-
公开(公告)号:CN119167940A
公开(公告)日:2024-12-20
申请号:CN202411054769.1
申请日:2024-08-01
Applicant: 浙江大学
IPC: G06F40/30 , G06N5/04 , G06N3/0455 , G06N3/0464 , G06N3/042 , G06N3/0499 , G06N3/092 , G06V20/70 , G06V10/82 , G06T11/60
Abstract: 本发明公开了一种基于场景图的文生图大模型提示词优化方法、电子设备、介质,包括:获取第一提示词,解析得到第一场景图;将第一提示词输入至文生图大模型中,生成对应的第一图片;将第一场景图与第一图片进行语义对齐得到第二场景图;将第一提示词以及第二场景图输入至预先训练好的提示词优化模型中,输出第二提示词;包括:对第一提示词进行编码得到文本特征,对第二场景图进行编码、卷积得到语义特征;将文本特征、语义特征拼接后输入至文本编辑解码器,输出至少包括删除、重排、插入在内的动作;基于输出的删除、重排、插入动作对第一提示词进行处理,得到第二提示词。
-
公开(公告)号:CN118093597A
公开(公告)日:2024-05-28
申请号:CN202410490193.7
申请日:2024-04-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F18/22
Abstract: 本发明公开了一种表格数据重构方法及装置、问答方法,包括筛选出与用户问题有关的表头并保留该表头所在的列,得到列重构表格;对列重构后的表格进行行重构:根据单元值将表格的列划分为三类,即连续值列、离散值列、时间值列;提取连续值列的统计量、离散值列的与用户问题有关的类别以及时间值列的最早和最晚时间作为表格的重构特征,并将这些重构特征进行连接得到行重构表格,从而得到完整的重构表格;进一步地,输入大语言模型来生成符合用户问题需求的SQL语句,大大提高了通过自然语言处理表格任务的准确率,在实际的使用场景更加智能与有效。
-
公开(公告)号:CN118015345A
公开(公告)日:2024-05-10
申请号:CN202410098720.X
申请日:2024-01-24
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/774 , G06F17/16 , G06N3/088
Abstract: 本发明公开了一种图片黑盒领域自适应分类方法、电子设备、介质,包括:将待分类的目标域图片数据输入至预先训练好的目标域分类器,预测输出标签结果;其中,目标域分类器的训练过程包括:获取第一图片和第二图片;基于第一图片和第二图片在目标域分类器的输出与其对应的标签,计算有标签图片分类损失;基于图片及其对应的增强副本构建特征相似度矩阵,基于图片的潜在标签构建标签相关性矩阵,从而计算对比损失;计算无标签图片的猜测标签,基于无标签图片的目标域预测标签以及猜测标签计算无标签图片分类损失;将有标签图片分类损失、对比损失、无标签图片分类损失之和作为损失函数,基于该损失函数训练目标域分类器。
-
公开(公告)号:CN119415641A
公开(公告)日:2025-02-11
申请号:CN202510014062.6
申请日:2025-01-06
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F16/332 , G06F16/35 , G06F16/33 , G06F18/214
Abstract: 本发明公开了一种表格数据分析领域大模型的训练和评估方法。对获取的表格、文本数据进行筛选打分;编制多套不同提示词,制作表格数据场景下的“问题”数据以及“问题‑回答”数据对作为基础的训练样本;对生成的“问题”和“问题‑回答”样本对进行数据增强;收集并筛选普通的文本问答、逻辑数学以及代码生成任务数据,选择合适的数据配比,对基底模型进行全参数指令对齐训练;收集、制作评估数据集,编写评估脚本,运行获得对应评价指标;根据评价指标以及评估集合的反馈,迭代优化训练数据集,直到模型达到预期指标为止。本发明能够使得训练得到的表格数据分析领域大模型不仅具有很强的表格问答能力,还具备较强的通用问题解决能力。
-
公开(公告)号:CN118228142B
公开(公告)日:2024-08-13
申请号:CN202410650118.2
申请日:2024-05-24
Applicant: 浙江大学
IPC: G06F18/2415 , G06F18/213 , G06F18/22 , G06N3/0495
Abstract: 本发明公开了一种基于特征校正的结构化数据新类别识别方法及装置,包括:获取有标注样本集和无标注样本集,将每一个样本输入表征编码器,得到样本表征;根据神经网络坍缩现象,生成预分配的单纯形等角紧凑结构作为目标化最优分类头;为无标注样本集中的样本生成初步伪标签,对初步伪标签进行细粒度修正,得到硬标签;基于目标化最优分类头和样本标签,对样本表征进行校正;根据校正后的样本表征和对应的标签,进行基于损失大小关系的标签过滤;使用过滤后的标签及其对应的样本进行半监督训练,更新表征编码器参数;所述半监督模型包括训练好的表征编码器和目标化最优分类头,用于新类样本识别。本发明大幅度提升结构化数据新类别识别准确率。
-
公开(公告)号:CN118093597B
公开(公告)日:2024-07-30
申请号:CN202410490193.7
申请日:2024-04-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F18/22
Abstract: 本发明公开了一种表格数据重构方法及装置、问答方法,包括筛选出与用户问题有关的表头并保留该表头所在的列,得到列重构表格;对列重构后的表格进行行重构:根据单元值将表格的列划分为三类,即连续值列、离散值列、时间值列;提取连续值列的统计量、离散值列的与用户问题有关的类别以及时间值列的最早和最晚时间作为表格的重构特征,并将这些重构特征进行连接得到行重构表格,从而得到完整的重构表格;进一步地,输入大语言模型来生成符合用户问题需求的SQL语句,大大提高了通过自然语言处理表格任务的准确率,在实际的使用场景更加智能与有效。
-
-
-
-
-
-
-
-
-