-
公开(公告)号:CN117131070A
公开(公告)日:2023-11-28
申请号:CN202311404243.7
申请日:2023-10-27
Applicant: 之江实验室
IPC: G06F16/242 , G06F40/30 , G06F40/242
Abstract: 本发明公开了一种自适应规则引导的大语言模型生成SQL系统,包括:表结构构建模块,用于列名标准化和列名字典构建;参考规则库构建模块用于构建参考规则库,包括表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;自适应规则构建模块用于构建与Text查询语句匹配的自适应规则;规则引导SQL生成模块根据自适应规则,引导大语言模型逐步生成SQL语句。本发明能帮助非数据库技术人员实现自然语言查询转SQL语句,并避免隐含条件和模糊语义引起的列数据筛选条件错误等问题。
-
公开(公告)号:CN117033554A
公开(公告)日:2023-11-10
申请号:CN202311033090.X
申请日:2023-08-16
Applicant: 之江实验室
IPC: G06F16/33 , G06F16/332 , G06F40/30 , G06F40/289 , G06F18/214
Abstract: 本申请涉及一种数据分析方法、装置、计算机设备以及存储介质。所述方法包括:根据公开的语义解析数据集、目标领域的历史数据分析数据集、数据表结构和数据字典对列表自然语言预训练模型进行模型训练,确定数据分析模型;根据标准数据分析要素和历史数据分析数据集,对循环神经网络模型进行训练,确定分析请求解析模型;通过分析请求解析模型,基于数据表结构和数据字典对目标数据分析请求进行解析,确定目标数据分析请求对应的目标数据分析要素;通过数据分析模型,根据目标数据分析要素确定目标数据分析请求对应的目标结构化查询语言,并运行目标结构化查询语言,确定目标数据分析请求所对应的数据分析结果。上述方法可以提高数据分析的准确性。
-
公开(公告)号:CN116304891B
公开(公告)日:2023-08-01
申请号:CN202310590427.0
申请日:2023-05-24
Applicant: 之江实验室
IPC: G06F18/241 , G06N3/096 , G06N3/088 , G06F16/2452 , G06N3/08
Abstract: 本申请涉及一种基于多源数据迁移学习的类别预测方法和装置。所述方法包括:获取多个来自不同数据源的表格数据,基于表格数据确定不同的目标任务下的关键数据映射表;通过数据向量化获取表格数据中每个单元格的文本向量,根据文本向量对待训练的自监督表格模型进行预训练;基于关键数据映射表,通过自监督表格模型确定目标任务训练集;基于目标任务对自监督表格模型进行优化,得到待优化的目标表格模型,根据目标任务训练集训练待优化的目标表格模型,得到目标表格模型;通过目标表格模型确定待预测数据的类别。采用本方法能够解决业务相似的不同机构中存在的因表格结构差异导致的预处理工作繁重、业务模型无法迁移复用等难点问题。
-
公开(公告)号:CN115293133A
公开(公告)日:2022-11-04
申请号:CN202210564739.X
申请日:2022-05-23
Applicant: 之江实验室
IPC: G06F40/211 , G06F16/35 , G06F40/216 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于抽取文本因子增强的车险欺诈行为识别方法,在文本抽取前期阶段,通过度量文本相似度解决原始数据缺省和错误问题,利用车险场景知识构建车辆事故描述关键词词汇表,提升车险场景文本分词准确度。本发明融合了词性句法信息,设计了预训练语言模型联合框架。利用预训练语言模型知识抽取事故触发词,结合注意力机制学习句法关系权重,通过词性过滤优化抽取结果。本发明还提出并设计了事故原因转译模版帮助抽取事故原因,可以有效减低模型中间存在的传递误差。最后,整合抽取的文本因子,利用Transformer编码器将离散的结构化文本编码,并采用集成学习模型预测是否存在车险欺诈行为。
-
公开(公告)号:CN118333153A
公开(公告)日:2024-07-12
申请号:CN202410491855.2
申请日:2024-04-23
Applicant: 之江实验室
IPC: G06N5/022 , G06N5/04 , G06F18/214
Abstract: 本发明公开了一种基于大语言模型的柔性思维链学习方法、设备和介质,利用大语言模型针对任务进行初始的思维链模板生成,使用思维链模板进行分布答案生成,经过针对最终输出结果的样本粗筛选和针对各个步骤结构的样本精筛选后,得到训练样本数据集;使用监督学习的方法训练柔性思维链模型用于任务推理;柔性思维链模型包括:大语言模型、各个步骤的柔性参数层、prompt层;将柔性参数层、prompt层、训练样本数据集输入大语言模型中,输出结果与样本真值进行一致性判断,得到的惩罚函数优化柔性参数层。本发明提升了推理精度,降低了思维链的构建难度,同时降低了大语言模型调用成本。
-
公开(公告)号:CN117094826A
公开(公告)日:2023-11-21
申请号:CN202311261009.3
申请日:2023-09-27
Applicant: 之江实验室
IPC: G06Q40/04 , G06Q30/0601 , G06F40/30 , G06F16/36 , G06N3/04 , G06F18/22 , G06F18/25 , G06F18/213
Abstract: 本申请涉及一种数据交易的匹配方法、装置、电子装置和存储介质,其中,该数据交易的匹配方法包括:基于各数据提供方的第一语义特征,和各数据采购方的第二语义特征进行匹配,得到第一匹配结果;将第一语义特征和第一图谱特征融合,将第二语义特征和第二图谱特征融合,基于融合结果得到第二匹配结果;利用图计算方法对第二匹配结果进行交易对象分层,并根据分层结果构建交易反馈链路,以使匹配后的交易双方完成数据交易。其能够基于机器学习完成对数据提供方和数据采购方的交易需求的特征表征,进而基于特征表征完成数据提供方和数据采购方的匹配,从而为数据交易过程中的数据提供方和数据采购方实现精确的交易匹配。
-
公开(公告)号:CN116306657B
公开(公告)日:2023-08-22
申请号:CN202310565366.2
申请日:2023-05-19
Applicant: 之江实验室
IPC: G06F40/295 , G06F16/33 , G06N20/00 , G06F16/35
Abstract: 本发明公开一种基于方阵标注和双仿射层注意力的实体抽取方法及系统。本发明由文本数据库模块、文本预处理模块、文本建模模块、输出模块四个部分组成。该系统是首次将图像语义分割的思想融入文本实体抽取的任务中,将传统的序列标注任务转变成方阵标注任务,并使用双仿射层注意力机制将序列表示的语义向量转化为长宽均为文本序列长度的方阵,缓解了中文文本实体识别任务中实体边缘检测难,检测精度低的问题。
-
公开(公告)号:CN116579792A
公开(公告)日:2023-08-11
申请号:CN202310449475.8
申请日:2023-04-20
Applicant: 之江实验室
IPC: G06Q30/0201 , G06Q30/0283 , G06Q20/38 , G06Q40/04
Abstract: 本申请涉及一种数据定价方法、数据定价装置、数据交易方法和系统,其中,该数据定价方法包括:基于预设的差分隐私模型得到待交易数据的隐私损失信息;至少将待交易数据的状态变量信息和隐私损失信息输入训练完备的动态定价模型,得到待交易数据的参考定价。其通过引入差分隐私技术,结合动态规划模型,在提高数据交易中数据隐私安全度的同时,为待交易数据的定价提供了稳定一致的量化标准,从而在降低数据要素定价的难度的情况下消除了数据信息外泄的情况。
-
公开(公告)号:CN115810134B
公开(公告)日:2023-07-21
申请号:CN202310110512.2
申请日:2023-02-14
Applicant: 之江实验室
IPC: G06V10/764 , G06V20/70 , G06V10/10 , G06V20/62 , G06V10/74 , G06Q30/018 , G06Q40/08
Abstract: 本发明公开了一种车险反欺诈的图像采集质检方法、系统和装置,所述方法由车险理赔质检终端和车险理赔质检服务器执行,包括:通过车险理赔质检终端收集并识别分类包括车损情况、车辆信息、场景信息、驾驶员信息、三方信息在内的图像信息,对图像信息进行筛选,并对筛选后的图像信息进行标注;将标注后的图像信息发送至车险理赔质检服务器,以使车险理赔质检服务器执行图像质检,得到质检结果;险理赔质检服务器将质检结果返回至车险理赔质检终端。本发明方法能够在信息收集的过程中,完成车险现场数据的标注和识别,从收集端规范了数据的采集,提高了图像采集的质量。
-
公开(公告)号:CN114462553B
公开(公告)日:2022-07-15
申请号:CN202210376689.2
申请日:2022-04-12
Applicant: 之江实验室
IPC: G06K9/62 , G06V40/16 , G06V10/74 , G06V10/774 , G06V10/764 , G06Q30/00 , G06Q40/08 , G06F16/51 , G06F16/55
Abstract: 本发明公开了一种面向车险反欺诈的图像标注及要素抽取方法与系统,本发明方法针对车险现场采集,事后补充图片等图像进行反欺诈要素提取。本发明系统包括:车险要素表构建模块,图像采集模块、标注功能模块和要素提取模块,其中标注功能模块包括多标签类别标注模块,车损部位标注模块,人脸标注模块;要素提取模块用于对各个标注数据集进行要素提取。本发明主要聚焦于建立面向车险反欺诈的图像要素标注与提取,使得提取的图像要素更客观,生成可以用于交叉验证车险结构化数据,提高数据质量。
-
-
-
-
-
-
-
-
-